开题报告--基于自适应和演化自适应的组合遗传算法的聚类分析
《开题报告--基于自适应和演化自适应的组合遗传算法的聚类分析》由会员分享,可在线阅读,更多相关《开题报告--基于自适应和演化自适应的组合遗传算法的聚类分析(9页珍藏版)》请在毕设资料网上搜索。
1、 本科毕业设计开题报告 (2014 届)届) 论文题目 基于自适应和演化自适应的 组合遗传算法的聚类分析 1 基于自适应和演化自适应的组合遗传算法的聚类分析 一、选题的背景与意义 1.1 研究开发的目的 聚类分析作为一种重要的数据预处理技术, 是数据挖掘领域极具挑战性的一 类组合优化问题,其目标是将一个数据对象集或模式集划分成若干个簇,使同一 个簇中的对象具高度同质性,不同簇之间的对象具高度异质性 1,2,3。现有的不同 类型的聚类算法已广泛应用于各类领域,诸如模式识别、机器学习、决策科学、 图像处理、人工智能和商业等。传统的聚类算法大体上可分为层次聚类和划分聚 类两大类,前者是将数据对象组成
2、一颗聚类树,通过合并或者分裂两种方式递归 地产生嵌套聚类层次而后者则同时找到 K 个聚类中心来划分数据集, 并采用迭代 重定位技术改进数据聚类效果。 本文主要研究划分聚类并且聚类中心数目作为先 验条件,这个先验条件对于大数据处理是十分必要的。然而,因为通常数据规模 大和数据维度高,而且划分聚类作为一种已知的 NP-难问题,许多已有的聚类算 法诸如 K-means 算法根据其规则函数只能找到局部最优解, 而无法找到全局最优 解 4。 显然,我们可以通过启发式全局随机优化算法来解决此类聚类问题,诸如美 国 Michigan 大学的 John Holland 教授发明的遗传算法。其作为一类进化算法,
3、 可在可行解空间内随机化搜索最优解,具有很高的隐含并行性,适用于解决复杂 的非线性和多维空间寻优问题以及组合优化问题5,6,7。传统的遗传算法根据个体 的适应度值来选择个体,然后通过遗传算子进行交叉、变异,产生新的种群。显 然,遗传算法已成为一种重要的解决数据聚类问题的工具,然而如何设置合适的 遗传算法的参数值将决定遗传算法的性能8,9。其一,因为特定的问题需要特定 的参数值才能找到最优解或者近似解,其值也决定了是否能够高效地找到可行 解。其二,因为这些参数存在非线性关系以至于很难决定参数的最优值。其三, 因为在遗传进化的不同阶段,这些参数值的最优值可能不同。因此,如何优化如 交叉率和变异率这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 开题 报告 基于 自适应 演化 组合 遗传 算法 聚类分析
