信息与编码课程设计----k均值聚类算法及其matlab实现
《信息与编码课程设计----k均值聚类算法及其matlab实现》由会员分享,可在线阅读,更多相关《信息与编码课程设计----k均值聚类算法及其matlab实现(6页珍藏版)》请在毕设资料网上搜索。
1、 信息与编码课程设计 题 目:k 均值聚类算法及其 matlab 实现 目录 一算法介绍 2 二 Matlab 语言的介绍 2 三算法的实现 3 四结论 6 五参考文献 6 摘要:本文主要介绍了 K 均值聚类算法并完成了 k 均值聚类算法的 matlab 实 现 正文: 一算法介绍 k-means 算法是输入聚类个数 k, 以及包含 n个数据对象的数据库, 输出满 足方差最小标准的 k 个聚类 k-means 算法的工作过程说明如下:首先从 n 个数据对象任意选择 k 个对 象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相 似度(距离) ,分别将它们分配给与其最相似的(聚
2、类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值) ;不断重复这 一过程直到标准测度函数开始收敛为止。 一般都采用均方差作为标准测度函数. k 个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。 k-means 算法是一种基于样本间相似性度量的间接聚类方法, 属于非监督学 习方法。此算法以 k 为参数,把 n 个对象分为 k 个簇,以使簇内具有较高的相 似度,而且簇间的相似度较低。相似度的计算根据一个簇中对象的平均值(被看 作簇的重心)来进行。此算法首先随机选择 k 个对象,每个对象代表一个聚类的 质心。对于其余的每一个对象,根据该对象与各
3、聚类质心之间的距离,把它分配 到与之最相似的聚类中。然后,计算每个聚类的新质心。重复上述过程,直到准 则函数会聚。 k-means 算法是一种较典型的逐点修改迭代的动态聚类算法, 其要 点是以误差平方和为准则函数。逐点修改类中心:一个象元样本按某一原则,归 属于某一组类后,就要重新计算这个组类的均值,并且以新的均值作为凝聚中心 点进行下一次象元素聚类;逐批修改类中心:在全部象元样本按某一组的类中心 分类之后,再计算修改各类的均值,作为下一次分类的凝聚中心点。 处理流程: (1) 从 n个数据对象任意选择 k 个对象作为初始聚类中心; (2) 循环(3)到(4)直到每个聚类不再发生变化为止 (3) 根据每个聚类对象的均值(中心对象) ,计算每个对象与这些中心对 象的距离;并根据最小距离重新对相应对象进行划分; (4) 重新计算每个(有变化)聚类的均值(中心对象) 二Matlab 语言的介绍 matlab 是由美国 mathworks 公司发布的主要面对科学计算、 可视化以及交互式程 序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线 性动态系统的建模和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 编码 课程设计 均值 算法 及其 matlab 实现
