毕业论文---基于文本的聚类算法
《毕业论文---基于文本的聚类算法》由会员分享,可在线阅读,更多相关《毕业论文---基于文本的聚类算法(33页珍藏版)》请在毕设资料网上搜索。
1、基于文本的聚类算法研究 I 摘 要 聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合, 应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文 本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照 文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相 似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指 导,事先对数据结构未知,是一种典型的无监督分类。 本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模 型, 相似度计算及常见聚类算法。 本文主要研究的聚类主要方法是 k-均值和 SOM 算法,
2、介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同 时介绍了两种算法的改进算法。 关键词:文本聚类 聚类方法 K-MEAN SOM 基于文本的聚类算法研究 II Abstract Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly access from th
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 基于 文本 算法
