1、 (20112011 届)届) 本科毕业论文(设计)本科毕业论文(设计) 题 目: 连续数据的离散化研究 学 院: 专 业: 信息管理与信息系统 班 级: 学 号: 姓 名: 指导教师: 完成日期: 教 务 处 制 诚诚 信信 声声 明明 我申明,所呈交的论文(设计)是本人在老师指导下进行 的研究工作及取得的研究成果。据我查证,除了文中特别加 以标注和致谢的地方外,论文(设计)中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得或其 他教育机构的学位或证书而使用过的材料。 我承诺, 论文(设 计)中的所有内容均真实、可信。 论文(设计)作者签名: 签名日期: 年 月 日 授授 权权 声声
2、 明明 学校有权保留送交论文(设计)的原件,允许论文(设 计)被查阅和借阅,学校可以公布论文(设计)的全部或部 分内容,可以影印、缩印或其他复制手段保存论文(设计) , 学校必须严格按照授权对论文(设计)进行处理,不得超越授 权对论文(设计)进行任意处置。 论文(设计)作者签名: 签名日期: 年 月 日 连续数据的离散化研究连续数据的离散化研究 中文摘要:中文摘要: 数据资源是 21 世纪的新兴战略资源,因此对数据资源进行 数据挖掘是非常重要的一项工作, 而对连续数据进行离散化处理是数据挖掘过程 中必不可少的一项工作。连续数据的离散化研究作为一种相对比较新兴的领域, 其现有的算法还远没有达到令
3、人满意的程度。因此,本人认为对连续数据的离散 化研究是当今国内的一个重要的课题。本文阐述连续数据的离散化的研究现状、 研究方法、决策树、几种离散化方法。主要通过使用 C4.5 算法,在 Visual Studio.NET 编写代码来实现连续数据的离散化。 关键词:关键词:决策树;C4.5;离散化方法 The Research of Discretization of Continuous Data Abstract: Data resource is the 21st centurys emerging strategy resources, so data mining is a very
4、important work, and the discretization of continuous data is a necessary job in data mining process. As a relatively new field, the existing algorithm of discretization of continuous data is far from reaching satisfactory degree. Therefore, I think the discretization of continuous data research a very important issue in the domestic. This paper expounds the present sit