暑期社会实践报告--K-Means聚类系统的学习与实现
-
资源ID:1438181
资源大小:31.05KB
全文页数:3页
- 资源格式: DOCX
下载积分:50金币
快捷下载

账号登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
|
暑期社会实践报告--K-Means聚类系统的学习与实现
1、暑期社会实践报告 -K-Means 聚类系统的学习与实现 实践内容实践内容:学习聚类理论知识,并区分与分类的区别,深入学习 K-Means 聚类系统的原理和实现机制,并结合 java 语言实现聚类。 什么是聚类什么是聚类? 将物理或抽象对象的集合分成由类似的对象组成 的多个类的过程被称为聚类。 由聚类所生成的簇是一组数据对象的集 合, 这些对象与同一个簇中的对象彼此相似, 与其他簇中的对象相异。 “物以类聚,人以群分” ,在自然科学和社会科学中,存在着大量的 分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题 的一种统计分析方法。 聚类分析起源于分类学, 但是聚类不等于分类。 聚类与
2、分类的不同在于,聚类所要求划分的类是未知的。 聚类分析内 容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚 类法、图论聚类法、聚类预报法等。 聚类与分类的区别:聚类与分类的区别:和分类学习相比,聚类的样本没有标记,需 要由聚类学习算法来自动确定。 聚类分析是研究如何在没有训练的条 件下把样本划分为若干类。在分类中,对于目标数据库中存在哪些类 是知道的,要做的就是将每一条记录分别属于哪一类标记出来。 聚类 需要解决的问题是将已给定的若干无标记的模式聚集起来使之成为 有意义的聚类, 聚类是在预先不知道目标数据库到底有多少类的情况 下,希望将所有的记录组成不同的类或者说聚类, 并且使得在
3、这种分 类情况下,以某种度量为标准的相似性,在同一聚类之间最小化,而 在不同聚类之间最大化。与分类不同,无监督学习不依赖预先定义的 类或带类标记的训练实例,需要由聚类学习算法自动确定标记, 而分 类学的实例或数据样本有类别标记。 聚类学习是观察式学习,而不是 示例式学习。 K-Means 原理:原理: 首先从 n 个数据对象任意选择 k 个对象作为初始 聚类中心;而对于所剩下其它对象, 则根据它们与这些聚类中心的相 似度 (距离) , 分别将它们分配给与其最相似的 (聚类中心所代表的) 聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的 均值) ;不断重复这一过程直到标准测度函数开始
4、收敛为止。一般都 采用均方差作为标准测度函数. k 个聚类具有以下特点:各聚类本身 尽可能的紧凑,而各聚类之间尽可能的分开。 学习总结:学习总结:对于机器学习来说最重要的是如何让计算机学会人的 思维,即把人的思维具体化,用代码一句句的告诉计算机,让计算机 在面临选择时有独立的判断能力。所以,机器学习更多的是算法思维 而非编程能力,当然,编程是一切从事计算机行业的基础,在我们学 校并没有直接开机器学习或者自然语言处理的相关课程, 所以学生学 习机器学习只能是在指导老师给定的方向下自己一步步探索, 不断深 入。我在学习聚类的过程中加入了很多 QQ 群,很多时候,我看不懂 他们在说什么但是感觉这真的是一个很高大上的东西, 现在我也在准 备考研究生,考上之后我还是会继续这一方向,不断努力。