1、中文 1.1 万字, 5820 单词, 3 万英文字符 出处: Dalal N, Triggs B. Histograms of oriented gradients for human detectionC/Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005, 1: 886-893. 外 文 译 文 基于方向梯度直方图的行人检测 作者 : Navneet Dala
2、l , Bill Triggs 摘 要 我们采用基于线性 SVM(支持向量机)的行人检测作为测试案例来研究关 于健壮的实物视觉检测特征集的问题 。 在通过实验测试了现存的所有基于边缘与 直方图的特征描述子滞后,我们认为在行人检测的应用上,由 HOG(方向梯度 直方图 ) 提取的特征集明显优于现存的其它特征集 。 我们研究了各阶段计算对检 测性能的影响 , 得出了这样的结论 : 尺度精细的梯度 , 精确的方向分割 , 相对粗 略的空间分级以及在重叠的描述块中高质量的局部对比度归一化都对良
3、好的检 测结果起着重要的作用 。 新方法在检测原麻省理工学院行人数据库中的信息时几 乎给出了完美的区分,因此我们引入了一个更具挑战的数据集,它包含着超过 1800 幅标识的图像,在这些图像中行人的姿势不同,背景各异。 1.绪 论 鉴于在图像中人的相貌各不相同 、 姿势变化多端 , 要对其进行检测是一个富 有挑战性的任务 。 首先我们需要的是一个健壮的特征集 , 在这个特征集中 , 即使 是在在光照很差 、 背景杂乱的情况下 , 人形 也 能够清楚地辨认出来 。 我们对用于  
4、;行人检测的特征集问题的研究显示,相对于现存的包括小波在内的其他特征集, 基于局部归一化方向梯度直方图( HOG)的描述子表现出了极佳的性能。这一 描述子让人联想到边缘方向直方图 , SIFT 描述子和 shape context, 但它们的计算 是基于一个由均匀间隔的胞元所形成的密集网 格 , 而且为了提高性能 , 使用了重 叠的局部对比度归一化 。以 “ 行人检测 ” (对 大 多可见并呈直立姿势的人的检测)为一个测试案例,我们对各种实施的判断对检测器性能的影响做了细致的研究。为了使整个研究更为简单和快速,我们采用了线性 SVM 为一个基础的分类器。 新
5、的检测器在检测原麻省理工学院行人数据库中的信息时表现基本上完美 , 所以 我们创建了一个更具挑战的数据集,它包含着超过 1800 幅图像,在这些图像中 行人的姿势不同 , 背景各异 。 正在进行的工 作 表明 , 我们的特征集在进行其他的 基于形状的实物检测时同样表现良好。 在论文的第二部分 , 我们简要地讨论了在行人检测方面前人所做的工作 , 在 论文的第三部分 , 我们对自己的方法做了概述 , 在论文的第四部分 , 我们介绍了 自己的数据库 , 在论文的第五和第六部分 , 我们对检测过程的各个步骤给出了细
6、 致的描述和实验评价。而在论文的第七部分,则是我们得到的主要结论。 2.前 人 工 作 关于实物检测的文献为数众多 , 但在这里我们仅仅列举几篇与行人检测相关 的论 文 (见参考文献 18, 17, 22, 16, 20) 。 参考 文 献 6 是一份调查资料 。Papageorgio 等人在参考文献 18 中描述了一种基于多项式核函数 SVM 分类算法的行人检测 器 , 它使用修正 Haar 小波作为输入的描述子 , 并有一个基于参考文献 17 中的思  
7、;想变化而来的部件(子窗口 ) 。 而 Depoortere 等人在参考文献 2 中给出一个更优 化的版本。 Gavrila 和 Philomen 在惨老文献 8 中则采取了更直接的办法,他们提 取了边缘图像 , 并通过倒角距离 , 将它们与一 系 列已经通过学习的例子进行匹配。 这些已经在参考文献 7 提及的一个实用化的实时行人检测系统中得到了应用。 Viola 等人在参考文献 22 中创建一个高效的移动行人检测器,它使用 adaboost 算法来训练一个基于 Harr-like 小波和时空差异的逐步复杂的区域拒绝规则链。 Ronfard 等人在参考文献 19 中通过引入基于 SVM 算法和一二阶高斯滤波器的肢体分类器而创建了基于关节点的人体检测器 , 这些都处于一个 类似于 Felzenszwalb 和 Huttenlocher 在参考文献 3 以及 Ioffe 和 Forsyth 在参考文献 9