1、译文一 基于 PAC 的实时人脸检测和跟踪方法 1 摘要: 这篇文章提出了复杂背景条件下,实现实时人脸检测和跟踪的一种方法。这种方法是以主要成分分析技术为基础的。为了实现人脸的检测,首先,我们要用一个肤色模型和一些动作信息 (如:姿势、手势、眼色 )。然后,使用 PAC技术检测这些被检验的区域,从而判定人脸真正的位置。而人脸跟踪基于欧几里德( Euclidian)距离的,其中欧几里德距离在位于以前被跟踪的人脸和最近被检测的人脸之间的特征空间中。用于人脸跟踪的摄像控制器以这样的方法工作:利用平衡 /( pan/tilt)平台, 把被检测的人脸区域控制在屏幕的中央。这个方法还可以扩展到其他的系统中
2、去,例如电信会议、入侵者检查系统等等 。 1.引言 视频信号处理有许多应用,例如鉴于通讯可视化的电信会议,为残疾人服务的唇读系统。在上面提到的许多系统中,人脸的检测喝跟踪视必不可缺的组成部分。在本文中,涉及到一些实时的人脸区域跟踪 1-3。一般来说,根据跟踪角度的不同,可以把跟踪方法分为两类。有一部分人把人脸跟踪分为基于识别的跟踪喝基于动作的跟踪,而其他一部分人则把人脸跟踪分为基于边缘的跟踪和基于区域的跟踪 4。 基于识别 的跟踪是真正地以对象识别技术为基础的,而跟踪系统的性能是受到识别方法的效率的限制。基于动作的跟踪是依赖于动作检测技术,且该技术可以被分成视频流( optical flow)
3、的(检测)方法和动作 能量( motion energy)的(检测)方法。 基于边缘的(跟踪)方法用于跟踪一幅图像序列的边缘,而这些边缘通常是主要对象的边界线。然而,因为被跟踪的对象必须在色彩和光照条件下显示出明显的边缘变化,所以这些方法会遭遇到彩色和光照的变化。此外,当一幅图像的背景有很明显的边缘时,(跟踪方法)很难提供可靠的(跟踪 )结果。当前很多的文献都涉及到的这类方法时源于 Kass et al.在蛇形汇率波动 5的成就。因为视 1 Do-Joon Jung, Chang-Woo Lee, Yeon-Chul Lee, Sang-Yong Bak, Jong-Bae Kim, Hyun
4、 Kang, Hang-Joon Kim. International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC02) 频情景是从包含了多种多样噪音的实时摄像机中获得的,因此许多系统很难得到可靠的人脸跟踪结果。许多最新的人脸跟踪的研究都遇到了最在背景噪音的问题,且研究都倾向于跟踪未经证实的人脸,例如臂和手。 在本文中,我们提出了一种基于 PCA 的实时人脸检测和跟踪方法,该方法是利用一个如图 1 所示的活动摄像机来检测和识别人脸的。这种方法由两大步骤构 成:人脸检测和人脸跟踪
5、。利用两副连续的帧,首先检验人脸的候选区域,并利用 PCA 技 术来判定真正的人脸区域。然后,利用特征技术( eigen technique) 跟踪被证实的人脸。 2.人脸检测 在这一部分中,将介绍本文提及到的方法中的用于检测人脸的技术。为了改进人脸检测的精确性,我们把诸如肤色模型 1,6和 PCA7,8这些已经发表的技术结合起来。 2.1 肤色分类 检测肤色像素提供了一种检测和跟踪人脸的可靠方法。因为通过许多视频摄像机得到的一幅 RGB 图像不仅包含色彩还包含亮度,所以这个色彩空间不是检测肤色像素 1,6的最佳色彩图像。通过亮度区分一个彩色像素的三个成分,可以移动亮度。人脸的色彩分布是在一个
6、小的彩色的色彩空间中成群的,且可以通过一个 2 维的高斯分部来近似。因此,通过一个 2 维高斯模型可以近似这个肤色模型,其中平均值和变化如下: m=(r ,g ) 其中 r N1 Niri1, g N1 Nigi1 ( 1) ( 2) 一旦建好了肤色模型,一个定位人脸的简单方法是匹配输入图像来寻找图像中人脸的色彩群。原始图像的每一个像素被转变为彩色的色彩空间,然后与该肤色模型的分布比较。 2.2 动作检测 虽然肤色在特征的应用种非常广泛,但是当肤色同时出现在背景区域和人的皮肤区域时 ,肤色就不适合于人脸检测了。利用动作信息可以有效地去除这个缺点。为了精确,在肤色分类后,仅考虑包含动作的肤色区域
7、。结果,结合肤色模型的动作信息导出了一幅包含情景(人脸区域)和背景(非人脸区域)的二进制图像。这幅二进制图像定义为 ,其中 It(x,y) 和 It-1(x,y)分别是当前帧和前面那帧中像素( x,y)的亮度。 St 是当前帧中肤色像素的集合,(斯坦) t 是利用适当的阈限技术计算出的阈限值 9。作为一个加速处理的过程,我们利用形态学(上)的操作( morpholoical operations)和连接成分分 析,简化了图像 Mt。 2.3 利用 PCA 检验人脸 因为有许多移动的对象,所以按序跟踪人脸的主要部分是很困难的。此外,还需要检验这个移动的对象是人脸还是非人脸。我们使用特征空间中候选
8、区域的分量向量来为人脸检验问题服务。为了减少该特征空间的维度,我们把 N 维的候选人脸图像投影到较低维度的特征空间,我们称之为特征空间或人脸空间 7,8。在特征空间中,每个特征说明了人脸图像中不同的变化。 为了简述这个特征空间,假设一个图像集合 I1, I2, I3, IM,其中每幅图像是一个 N 维的列向量,并以此构成人脸空间。这个 训练(测试)集的平均值用 A M1 Mi Ii1来定义。用 i I I A 来计算每一维的零平均数,并以此构成一个新的向量。为了计算 M 的直交向量,其中该向量是用来最佳地描述人脸图像地分布,首先,使用 CM1 Mi 1 i ir YYr ( 4)来计算协方差矩阵 Y 1 2 M。虽然矩阵 C 是 N N 维的,但是定义一个 N 维的特征向量和 N 个特征值是个难处理的问题。因此,为了计算的可行性,与其为 C 找出特征向量,不如我们计算 YTY中 M 个特征向量 vk和特征值 k, 所以用 u kkYvk*来计算一个基本集合,其中 k 1, M。关于这 M 个特征向量,选定 M 个重要的特征向量当作 它们的相应的最大特征值。对于 M 个训练(测试)人脸图像,特征向量W i w 1, w 2, w M用 w k u kT i,k=1,, M( 6)来计算。