1、 【数据挖掘课程设计】【数据挖掘课程设计】 -3-4-5 规则划分规则划分 目目 录录 一一 实实 验验 目目 的的- - -3 3 二二 实实 验验 内内 容容- -3 3 三三 实实 验验 要要 求求- -3 3 四四 实实 验验 准准 备备- -3 3 五五 实实 验验 步步 骤骤- -4 4 六六 功功 能能 代代 码码-5 5 七七 实实 验验 结结 果果- -9 9 八八 实实 验验 心心 得得-1 10 0 一一 实验目的实验目的 1. 加强对 3-4-5 规则划分算法的了解 2. 加强对 Java 语言的理解与动手操作能力 3. 进一步熟悉 eclipse 环境。 二二 实验内
2、容实验内容 3-4-5 规则介绍规则介绍 3-4-5 规则可以用来将数值数据分割成相对一致,看上去自然的区间。一般,该规则根据 最高有效位的取值范围,递归逐层地将给定的数据区域划分成 3,4 或 5 个相对等宽的区 间。我们将用一个例子解释这个规则的用法。规则如下:如果一个区间在最高有效位包 含,或个不同的值,则将该区间划分为个区间(对,划分为 个等宽的区间;对于,按-分组,划分成个区间) 。如果在最高位包含, 个不同的值,则将区间划分为个等宽的区间。如果在最高有效位包含, 个不同的值,则将区间划分成个等宽的区间。该规则可以递归地用于每个区间,为给 定的数值属性创建概念分层。 三三 实验要求实
3、验要求 用 Java 语言实现 3-4-5 规则划分算法。 四四 实验准备实验准备 1. 了解 3-4-5 规则划分的具体过程 2. 具体详细的算法模块用什么方法实现分析 3. 对总体进行可行性的研究 4. 具体的编程实现 3-4-5 规则划分 5. 算法优点缺点 优点:可以将数据分割成相对一致、看上去自然的区间 缺点:需要自己确定数据来开始分割,要有一定数据分析能力 五实验步骤五实验步骤 六六功能代码功能代码 1.自定义数据的自定义数据的 low和和 high 的值为以后做准备的值为以后做准备 package zhj; public class Data private int low; p
4、rivate int high; public Data(int low ,int high) this.low=low; this.high=high; public String toStirng() return “(“+low+“,“+high+“; public int getHigh() return high; public void setHigh(int high) this.high = high; public int getLow() return low; public void setLow(int low) this.low = low; 2.基本功能代码基本功能代码 import java.util.ArrayList; public class MyData private int min; private int max; private int low = -159867; private int high = 1838761; private int msd; private int low1; private int high1; private ArrayList a = new ArrayList();/ 区间的存储 public MyData(int