1、PDF外文:http:/ 1 人脸识别的鲁棒回归问题 原文来源 : Imran Naseema, Roberto Togneri, Mohammed Bennamoun Robust regression for face recognition 1 前言 随着 安全威胁 逐渐增加,更加 突显出 在一些敏感设施中安装 高效可靠的鉴别系统的重要性。在这方面,生物识别技术已经表现出了良好的性能。相比于其他可利用的生物特征,如语音、虹膜、指纹、掌型和步态,脸部似乎是最自然的选择。 首先, 它是非侵入性的,需要用户的合作,而且廉宜实现。脸部识别广泛使
2、用 于 在视频监控中 用来锁定犯罪嫌疑人,也 突显出了它的重要性。随着多媒体型号传输和加工在近几年来的发展,我们见证了人脸识别的许多新兴应用,例如,通过互联网进行人脸识别,正成为一个最新的应用。然而 ,这些相对较新的应用往往同样意味着鲁棒性问题。尽管 人脸识别 测试是在一个离线控制的实验室环境,但是由于环境亮度、传感器故障、信道噪声、在网络媒体压缩噪声等原因,探测器 图像总是容易变形。 一般而言,人脸识别系统批判地依靠流形学习方法。一个灰度人脸图像的 矩阵 可表示为原始图像空间中的一个 AxB维的向量。通常,在模式识别问题中,普遍认 为高维数据向量是 冗余测量值的潜在来源 。 流形
3、学习的目的是通过一种从高维数据向低维数据适当的转变方法,揭示这种所谓的“潜在来源”。因此 ,在特征提取阶段,面部空间的图像要转化成低维数据向量,主要的目标就是找到一个进行转化的基函数, 能够区分面部空间的代表性面部 。然而,由于噪声的存在,这是一个极富挑战性的任务。有编码理论指出,迭代测量可以安全地修复存在噪声的信息。因此,在低维特征空间中维护外貌的鲁棒性实际上是目标识别中一个急切的问题, 文献 中称这些方法为降维。联系到关于鲁棒性的语境,这些方法被广泛地分为两大类,即重构和 可识别性方法。重构方法 (如 PCA、 ICA和 NMF)据称 与丢失和污染的像素有关,这些方法本质上是利用视觉冗余数
4、据生产足够的重构性能表现。形式上,给一个输出 x和一个标签 y,生成分类器会学习联合概率 p( x,y) 和 条件概率 p( x|y) 的模型,这种定义使用了贝叶斯定理。另一方面,我们已知可识别性方法 (如 LDA) 由于决策界限的灵活性 , 在“干净”的条件下具有更好的效果 ,而 确定最优决策的界限取决于 使用直接来源于数据的 p( x|y) ,因此 其 对 异常值 更加敏感。同传统的方法相比,它最近还被证实有许多独特的特点,如图像下采样和随机投 影一样可以处理得很好。事实上 ,选择的特征空间可能不再是那么重要,真正重要的是特征空间的维度和分类器的设计。 华中农业大学本科毕业论文
5、(或设计)外文翻译 2 在范式的人脸识别中,光照变化被认为是 影响鲁棒性的 一个主要问题,相关文献也中提出了几种方法来应对这个问题 。一个复杂的方法就是使用人物面部姿势固定但使用不同的光照照射的模型,因此一部分人脸的测试图像就在不同的光照条件下被用于重构成不同的形状和面部的反射率。尽管这一方法取得了不错了成果,但在实际中,由于大量极端的射线,精确照明的成本是十分昂贵的。 研究表明 ,不同亮度条件下面部图像可以转化为低维线性空间,根据这 一目的可以获得 3 D 模型下基于球面谐波漫射光照的基础图像, 可以利用物理照明的 设置 ,以便获得可直接用于低维线性空间的基向量的图像。 另一个可
6、行的方向就是通过预处理来 规范 /补偿 某种 照明效果 ,如 直方图均衡 、 伽马校正和对数变换。然而,这些初级 的 加工技术 对于非均匀光照变化的存在并没有多大帮助。此外,一些最新的方法,如直线边缘地图和 Face-ARG 匹配显示了对不利光照变化的良好忍耐性,利用 几何 /结构信息的人脸区域 可以 证明这些方法的鲁棒性。 除了照明问题,一些文献中显示传统的人脸识别方法不能很好地处理存在严重的随机噪声这一 问题。文献中提到的大部分 针对随机像素的 方法,是 神经网络分类 方法 的变种 。 而一项重要的工作就是融合各个处理严重噪声的核心方法 。对比传统的支持向量机方法,令人 满意
7、的结果已经证实了两个重要的加性噪声问题(椒盐噪声 )和乘性噪声 (斑点噪声 )。同 时 还表明, 神经网络分类 器在 加性高斯噪声严重的情况下优于传统的 PCA、 2DPCA、 LDA 和 laplacianfaces 方法。除了这些神经网络的方法,最近 还提出了 稀疏 表示 分类 方法 ( SRC) 。 而提出的存在噪声( 统一建模为随机变量 )的方法也优于传统的 PCA、 ICA 、 LNMF 和 L2 +NS,然而 ,其他重要模式 ,如椒盐噪声、斑 点 噪声还是未做处理。 在这 次 研究中,我们提出了一种针对存在随机像素失真的人脸识别问题的鲁棒性分类算法。众所周知,从某个特定
8、的对象种类中取样依赖于一个线性空间。在先前的工作中,我们提议发展 专业的识别用户的模型 ,从而把人脸识别定义为一个线性回归问题。在这里介绍的工作中,我们把调查延伸到噪声问题中受污染的探针,其逆问题用来解决使用一种鲁棒线性 H 胡伯 估计的新应用,并且决定这种类标签是基于精确的估计的子空间。本文提出的方法,虽然在结构上非常简单,但演示了两种关键的剧烈光照变化和 随 机像素噪声 的 鲁棒性 示范结果。 虽然,在原则上,可以在学习或分类阶段补偿被污染或丢失的像素,分类鲁棒回归却很少在文献中被提到。该方向上的 研究 主要集中在鲁棒学学习方法的开发,旨在检测学习阶段的离群数据和潜在地影响干净
9、的学习数据 , 从而导致高故障点。大多数的鲁棒学习方法是基于通过替换传统位置适应判别模式和鲁棒副本适应 散射矩阵估计 ,如 MVE 微小量估计及投影寻踪方法 等。已经提出的某些 鲁棒的变体生成方法 是使用 鲁棒度量,而不是标准的最小二乘法计算 。 人脸 识别的鲁棒性问题 中的一个重要措施是通过引入一个假设和测试范式改进传统的特 征华中农业大学本科毕业论文(或设计)外文翻译 3 空间方法的学习过程。从根本上说,工作在像素点子集和的二次抽样一旦被引入,就会由鲁棒解的一组线性方程产生一种假说。基于最小描述长度 ( MDL) 的原则,我们进一步选择不相容的假说来确定的特征空间系数。最近所提
10、出的一个更加复杂的方法在本质上是结合可识别性方法和重 构 方法来构造一个子空间,其同时具有两种方法的可识别能力和重 构 性质。这就提出了一个重要的相关工作 ,即在生成概率成像模型时,建立 out-lier 和 in-lier 过程 。这项任务对于人脸识别被表示为最大后验 ( MAP) 估计问题,该方法应用于连续 闭 塞 问题 。据我们所知,这是第一次将随机丢失或破坏的像素问题 转化 为一个 线性鲁棒回归 的 任务。 全文的结构安排是这样的:第二部分讨论了最基本的鲁棒估计 问题 ,第三部分描述了面部识别问题,第四部分论证了本文提出的方法在剧烈光照变化条件下的有效性,第五部分演示了随机
11、污染像素的实验,最后一部分则对全文做了总结。 2 鲁棒估计问题 考虑一个线性问题 ey X ( 1) 其中,应变量 y q 1,回归变量 X q
12、 p,未知参数 p 1,误 差项 e q 1。鲁棒估计问题就是估计未知参数 用来最小化剩余量 y y-yr X ; ( 2) y 就是预测的应变量。在经典统计学中误差项 e 通常被作为零均值的高斯噪声。传统优化回归的方法是最小
13、二乘法 )( rmin arg q1j2j ( 3) 其中, )( rj 是残余向量 r 的第 j 个成分。然而,由于异常值的存在,最小二乘法是低效且有偏差的,虽然它们被
14、声称为经典分 析法,但其实它们只是鲁棒意义上的型错误。型错误相当于当虚假设为真时却拒绝虚假设。可以很明白地看出,古典统计中,当有误差项存在时,型错误率往往低于标称值。这就被称为保守古典统计法。然而,由于数据污染,型错误会急剧增加。型错误就是当虚假设为假时却没有拒绝。这个缺陷被称为不被接受的经典分析法。此外,传统的统计方法众所周知和同方差的数据模型表现一样良好。然而,在实际情况上,这种假设是不正确的,异方差性是必不可少的,所以我们要强调鲁棒估计的必要性。 有几种鲁棒估计方法,如 R-estimators 和 L-estimators 等。然后, M-estimators由于其普遍性和高故障点,已经显示出了优越性。基本 M-estimators 是基于一个