欢迎来到毕设资料网! | 帮助中心 毕设资料交流与分享平台
毕设资料网
全部分类
  • 毕业设计>
  • 毕业论文>
  • 外文翻译>
  • 课程设计>
  • 实习报告>
  • 相关资料>
  • ImageVerifierCode 换一换
    首页 毕设资料网 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    k均值课程设计---K均值聚类(k-means)优化

    • 资源ID:1430077       资源大小:83KB        全文页数:6页
    • 资源格式: DOC        下载积分:100金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    下载资源需要100金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

    k均值课程设计---K均值聚类(k-means)优化

    1、K K 均值聚类(均值聚类(k k- -meansmeans)优化)优化 基于遗传算法基于遗传算法 一、一、 K K 均值聚类的算法和遗传算法的均值聚类的算法和遗传算法的概述概述 1、K 均值聚类(k-means)就是将对物理或抽象对象的集合分组成为由类似的对象组 成的多个簇的过程。 聚类分析是指事先不知样本的类别, 而利用样本的先验知识来构造分类 器 (无监督学习) , 可以用两个准则来做(1)聚类准则函数, (2)误差平方和准则 (最常用的) 。 2、 遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化搜 索算法。生物的进化过程主要是通过染色体之间的交叉和变异来完成的

    2、,与此相对应,遗传 算法中最优解的搜索过程也模仿了生物的进化过程, 使用遗传操作数作用于群体进行遗传操 作,从而得到新一代群体,其本质是一种求解问题的高效并行全局搜索算法。它能在搜索过 程中自动获取和积累有关搜索空间的知识, 并自适应地控制搜索过程, 从而得到最优解或准 最优解。 算法以适应度函数为依据, 通过对群体个体施加遗传操作实现群体内个体结构重组 的迭代处理。在这一过程中,群体个体一代代地优化并逐渐逼近最优解。鉴于遗传算法的全 局优化性,本文给出了一种基于遗传算法的 K 均值聚类算法来克服 K 均值算法的局部性。 二、二、K K 均值算法的基本思想均值算法的基本思想 K 均值算法是一种

    3、使用最广泛的聚类算法。算法以 K 为参数,把 n 个对象分为 K 个簇, 使簇内具有较高的相似度,而簇间相似度较低。算法首先随机选择 K 个对象,每个对象初始 地代表了一个簇的平均值或中心, 对剩余的每个对象根据其与各个簇中心的距离, 将它赋给 最近的簇,然后重新计算每个簇的平均值,不断重复该过程,直到准则函数收敛。准则函数 如下: 其中,ix 为簇 C 的平均值。i K 均值算法的描述如下: (1)任意选择 K 个记录作为初始的聚类中心。 (2)计算每个记录与 K 个聚类中心的距离,并将距离最近的聚类作为该点所属的类。 (3)计算每个聚集的质心(聚集点的均值)以及每个对象与这些中心对象的距离

    4、,并根据最小 距离重新对相应的对象进行划分。重复该步骤,直到式(1)不再明显地发生变化。 三、基于遗传算法的三、基于遗传算法的 K K 均值聚类算法均值聚类算法 本文将遗传算法应用到聚类分析中, 把遗传算法的全局优化能力与聚类分析的局部优化 能力相结合来克服聚类算法的局部性,在种群进化过程中,引入 K 均值操作,同时,为了避 免早熟现象, 在种群中采用自适应方法动态调节交叉概率和变异概率, 使其能够随适应度自 动改变。算法具体步骤如下。 1 1 染色体编码染色体编码 染色体编码有很多种, 在聚类分析中较常用的是基于聚类中心的浮点数编码和基于聚类 划分的整数编码。由于聚类算法具有多维性、数量大等特点,聚类问题的样本数目一般远大 于其聚类数目,因此采用基于聚类中心的浮点数编码,将各个类别的中心编码为染色体。例 如对于一个类别为 3 的聚类问题, 假设数据集为 2 维。 初始的 3 个聚类中心点为(1, 2), (5, 4), (8, 7),则染色体编码为(1, 2, 5, 4, 8, 7)。这种基于聚类中心的编码方式缩短了染 色体的长度,提高了遗传算法的速度,对于


    注意事项

    本文(k均值课程设计---K均值聚类(k-means)优化)为本站会员(毕***)主动上传,毕设资料网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请联系网站客服QQ:540560583,我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们
    本站所有资料均属于原创者所有,仅提供参考和学习交流之用,请勿用做其他用途,转载必究!如有侵犯您的权利请联系本站,一经查实我们会立即删除相关内容!
    copyright@ 2008-2025 毕设资料网所有
    联系QQ:540560583