1、PDF外文: PDFhttp:/ North.International Society for Optics and Photonics, 2004: 410-419 1 FPGA实现实时适应图像阈值 Elham Ashari 电气与计算机工程系 ,滑铁卢大学 理查德 霍恩西 计算机科学和工程系 ,纽约大学 摘要 : 本文提出了一种基于实时阈值的通用 FPGA结构 。 硬件架构是基于一种加权聚类算法的架构 ,这种算法的重点就在于聚类的前景和背景像素的阈值问题。该方法采用聚类的 二值加权神经网络法 找到两个像素组的质心 。 图像的阈值
2、是两个质心的平均值。因为对于每个输入的像素,选定的最近的权值是用来更新的,因而推荐一种自适应的阈值技术。更新是基于输入像素的灰度级和相关权值的差额的,通过学习快慢因素来衡 量其速率。 硬件系统是在 FPGA 平台上实现的,它包含两个功能模块。第一个模块获得图像框架阈值,另一个模块将阈值应用于图像的框架。两个模块的并行性和简单的硬件组成部分使其适用于实时应用程序,并且,其性能可与经常用于离线阈值技术相媲美。通过利用 FPGA对无数的例子进行模拟和实验,得到该算法的结果。这项工作的基本应用是确定激光的质心,但接下来将会讨论它在其他方面的应用。 关键词 :实时阈值 ,自适应阈
3、值 ,FPGA实现、神经网络 1 简介 图像二值化是图像处理的一个主要问题。如果要从一张图像上提取有用的信息,我们需要将 它分成不同的部分(例如背景色和前景色)来进行更为详细的分析。一般来说,前景色的像素的灰度级与背景色的灰度级是不同的。现在已有一些较好的使图像二值化地算法,就性能而不是就速度而言, 这些算法的主要目标在于高效率,然而对于一些应用,尤其对是在那些定制的硬件和实时应用程序来说,速度则是最关键的要求。可实现的快速而简单的阈值技术在实际成像系统中得到广泛应用。例如,结合了 CMOS 图像传感器的片上图像处理技术普遍存在于各种各样的成像系统当中。在这样一个系统当
4、中,图像的实时处理及其得到的相关信息是至关重要的。实时阈值技术的 应用领域包括机器人、汽车、目标追踪以及激光测距。在激光测距,即确定目标的运动范围的过程中,所捕获的图像为二值图像。阈值技术被用来从背景色中分离耀斑以及质心的定位。本文接下来将重点描述该技术的应用。 实时阈值的另一个应用是文件处理及光学字符识别( OCR)。例如,一个高速的扫描仪每分钟可扫描并处理大约超过 100 页的文件。这个系统中,为达到速度的要求,利用一种专用硬件对图像进行处理和二值化。其中,最为典型的例子就是,通过 CMOS或 CCD相机,由扫描仪捕获的图像,都被转换为二值图像。再由文本文档来储存这些相对统一的
5、 背景色信息。由于将图像转换为二值图像,可以在不丢失图像的重要数据信息的基础之上,明显减少图像的存储空间,因此,更适合输出和存储。 以上所提到的所有的应用都有一个共同点,就是都是利用高性能、高精度的系统,通过快速算法来完成阈值的转换。此外,在对图像做进一步的处理之前,都将图像的二值化作为预处理步骤。因此,它们要将目标从背景色中分离出来,就必须先进行最佳阈值的计算,以免丢失重要的数据信息(例如,物体的尺寸或形状)。 本文介绍了一种在实时应用中的图像阈值的新技术。这一阈值技术是通过 FPGA 实现的。第二节 2 对图像的二 值化进行了概述。针对著名的图像阈值技术
6、以及它们各自的性能进行了讨论。第三节描述了该阈值技术的算法。并就算法的性能,和其它算法进行了比较。第四节给出了算法的 FPGA实现。重点讨论了硬件实现的功能性能的实验结果。同时,就速度和面积,阐述了硬件的性能。第五节结合本文所描述的工作,引出了一些关键性的结论。对研究的结果进行了总结,同时对该算法的优缺点进行了重点阐述。 2 陈述问题 图像二值化的目的就是将图像分成两个部分,即前景色和后景色。在图像处理应用中,被赋值给目标的灰度值是不同于背景色的灰度值的。因此,阈值可以被 视为是分离背景色和前景色最有效的方法。阈值处理的输出是一个二值图像,该二值图像是通过给不同的像素赋
7、值得到的,小于阈值的像素赋值为 0,其余像素的赋值为 1。让我们来看一下,大小为 MxN(M 行和 N 列),灰度级为 L,即灰度级范围为 0, L-1的图像。像素的灰度级和亮度分别用坐标( i,j)和 f( i,j)来表示。阈值 T是在 0,L-1范围内变化的值。基于预定义的测量,阈值技术确定一个最佳值为 T。因而有: g( i, j)= Tjiforf Tjiforf ),(1 ),(0 &nbs
8、p; (1) g(i,j)是二值图像的像素。在此例子中,我们关心的是一个亮色物体在一个暗色的背景当中,因此,在二值图像中,低于一定灰度值的像素点的灰度用 0表示,即表现为背景色,高于一定灰度值的像素点的灰度用 1表示,即表现为前景。有许多因素会影响到灰度阈值并使阈值复杂化。例如,对比度差、物体和背景大小的不一致、背景不均匀,以及相关噪声等。有时,二值图像会丢失很多区域而捕获很多不相干的背景像素。 因此图像二值化地成功与否取决于适当的阈值的选择。因此为寻找最优阈值,自适应算法是必要的。 自适
9、应算法基于图像的特点,例如,图像统计和图像的亮度,计算出图像的阈值。 基于对文献的全面调查 1,对阈值技术进行了分类,共分 6种,如下: 1.直方图法,图像的直方图被视为两种类型的与物体和背景相关的高斯分布的混合, 例如凸壳阈值 (罗森菲尔德 3),和峰、谷阈值 (Sezan4)。 2.基于聚类法, ,此方法中,灰度级像素主要分为两类,作为前景和背景。或者,作为两种高斯的交替混合模型, 如迭代阈值 (Riddler5)、聚类的阈值 (Otsu6),最小误差阈值 (Kittler7),应用模糊聚类的阈值 (Jawaher8)。 3.均值法是利用了前
10、景和背景区域的熵不同,例如 熵阈值 (Kapur9),和熵阈值 (Shanbag10)。 4.基于属性的方法 ,在灰度图像和二值图像中找到了相似性的度量 (模糊边缘形状相似性,边缘匹配等 ),如边缘阈值匹配 (赫兹 11)。 以及稳定的拓扑 l阈值 (Pikaz12)。 5.空间的方法 ,使用高阶概率分布和 /或像素之间的相关性 ,如高阶熵阈值 (Abutaleb13)。 6.局部法,根据局部图像的特征,计算出每一像素点的阈值,例如局部对比度的方法 (White14),表面 滤波 阈值法 (Yaowitz15)。 为定量性能评估
11、,Sezgin1对以上所述方法进行了具有比较性的调查研究,针对两种不同的环境提出一些有用的阈值的标准 ,即文档图像无损检测和无损检测的图像。 采用了五种平均性能准则 :分类错误、边缘匹配错误、相对前景区域的误差 ,改进的距离 ,以及区域的非均匀性聚类方法和基于聚类的 3 阈值方法都是最常用的方法。这个排名同时也被认为是对提取对象的视觉轮廓的主观评价。 从硬件实现的角度来看 ,一个阈值方法的有效性也可以用其他参数来衡量,例如速度和复杂性。这些在实时图像处理应用过程中 ,都是非常重要的。所有的高素质技术集群在进行阈值计算之前,先对图像的一些属性进行估算 ,例如 ,直方图、
12、最大 /最小灰度值或者图像方差。因此 ,图片进行逐像素的预处理。对数计算在基于熵的技术复杂的计算程序中也是必需的。硬件对数实现和标准偏差计算使这些方法对硬件的要求复杂化。此外 ,在获得足以计算阈值的图片之 后, 这种方法仍需要大量的处理时间。虽然我们所讨论的这些方法都具有良好的性能 ,但他们一般不适合实时实现。或者我们可以增强或修改这些技术。 对于阈值法最基本的要求就是其适应性和高效性。它应该也对图像的与处理存在一定的依赖 性。 3 提出的方法 Clustering-based方法仍是一个很常用的阈值技术 1。在该方法中 ,图像的灰度像素被分为两个集群,即前景和背景。
13、有几种方法可得到聚类的一组输入灰度像素。人工神经网络 (ANN)技术对解决分类和聚类问题是非常有用的。 Talukdar 和 Sridhar18使用一种神经网络结构作为一个聚类技术 ,称为weighted-based WCT聚类阈值 )。 weighted-based聚类方法 使用的人工神经网络的聚类特性来计算一个阈值 ,其阈值为两个聚类质心的均值。 人工神经网络就是原 始节点简单聚类。聚类通过创建层产生,并且相互连接。网络的处理能力储存在层间连接处 ,称为权、是通过从一组训练模式中学习获得的每个节点的输入都乘以了一个连接的权值。 在最近几十年里 ,研究人员提出了不同的类别神经网络。每个类别都有其适用的一个特定的域 ,因而提出一个通用的神经网络来解决所有的问题似乎是不可能的。其中提出一种有关自适应分类和图像分割问题的解决方案,就是非监督的竞争学习 19。