课程设计--特征选择与压缩-模式识别
《课程设计--特征选择与压缩-模式识别》由会员分享,可在线阅读,更多相关《课程设计--特征选择与压缩-模式识别(11页珍藏版)》请在毕设资料网上搜索。
1、特征选择与压缩特征选择与压缩 目录 1. Relieff 算法算法 2 1.1 算法原理算法原理 2 1.2 主要代码主要代码 2 主程序: 2 ReliefRelief 核心算法:核心算法: .4 随机抽取随机抽取 K K 近邻代码:近邻代码: .6 1.3 结果分析结果分析 7 2. K-L 变换算法变换算法9 2.1 算法原理算法原理 9 2.2 主要代码主要代码 9 2.3 结果分析结果分析 . 10 对比两种方法图如下:对比两种方法图如下: 11 1. RELIEFF算法算法 1.1 算法原理算法原理 RELIEF 算法最早由 KIRA 提出, 最初局限于两类数据的分类问题。 REL
2、IEF 算法是一种特征权重算法(FEATURE WEIGHTING ALGORITHMS),根据各个特征 和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征将被移除。 RELIEF 算法中特征和类别的相关性是基于特征对近距离样本的区分能力。 算 法从训练集 D 中随机选择一个样本 R,然后从和 R 同类的样本中寻找最近邻 样本 H,称为 NEAR HIT,从和 R 不同类的样本中寻找最近邻样本 M,称为 NEARMISS,然后根据以下规则更新每个特征的权重:如果 R 和 NEAR HIT 在 某个特征上的距离小于 R 和 NEAR MISS 上的距离,则说明该特征对区分同类 和不同类的最
3、近邻是有益的, 则增加该特征的权重; 反之, 如果 R 和 NEAR HIT 在某个特征的距离大于 R 和 NEAR MISS 上的距离,说明该特征对区分同类和 不同类的最近邻起负面作用,则降低该特征的权重。以上过程重复 M 次,最 后得到各特征的平均权重。特征的权重越大,表示该特征的分类能力越强, 反之,表示该特征分类能力越弱。RELIEF 算法的运行时间随着样本的抽样次 数 M 和原始特征个数 N 的增加线性增加,因而运行效率非常高。 1.2 主要代码主要代码 主程序: % 特征选择测试 nSample = 500, 500, 500; % 2维情况 dim = 6; coeff = -2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课程设计 特征 选择 压缩 模式识别
