1、 PDF外文:http:/ 2065 字 外文翻译 学生姓名 学 号 指导教师 职称
2、 讲师 专 业 信息工程 二零一零年六月 2009 年第二届基 于相似性搜索和应用的研讨会 在 Flickr 网站上的基于文本和基于内容的图像检索 : 演示 胡安曼努埃尔巴里奥斯 ,本杰明布斯托斯 计算机科学系 智利大学,圣地亚哥 邮箱: jbarrios,ddiaz,bebustosdcc.uc
3、hile.cl 摘要 我们提出基于文本和内容相结合的图像检索系统。我们的想法是在原来标准的内容检索基础上,利用文本表示图像标题,描述图像并且标识每个图像来提高检索结果。这个系统包含两种不同的用户界面:终端用户必须在 Flickr 网站的浏览器侧边栏输入要搜索图片的 URL 地址,然后,系统从收集到的图像集合里面搜索相似的图像。另一种用户界面是为有经验的高级用户设计的,可以为不同搜索特征定义距离函数和权值,以得到更好的搜索效果。 关键词 : 图像库,信息检索 1. 简介 基于文本的图像检索,提供语 义相似度较近的搜索结果,然而,基于内容的图像搜索
4、提供视觉相似度较近的搜索结果。由于两种方法的独立性,很可能它们的结合能够提高搜索系统的性能,依靠两种方法的益处。在目前的工作,我们提出了一个文本和内容相结合的图像检索系统。 2. 系统概述 目前图像搜索系统已经实现用 Java 1.6, C+和 PostgreSQL 完成。这个图像对象的集合使用 SAPIR3从 Flickr 网站分离出来。在离线阶段,使用 SAPIR 集合提供的 URL 地址把图片从 Flickr 网站下载下来。从图像中提取的基于内容的描述有:使用 3 3 3RGB 色彩空间的颜色直方图( 27D 矢量), Gabor 小波( 48D矢量),使用 R
5、GB 色彩空间的 8*1 高效颜色描述( ECD)( 32D 矢量),使用 HSV色彩空间的 8*1 高效颜色描述( ECD)( 32D 矢量),和边缘局部 4*4( 80D 矢量)。颜色直方图和 Gabor 小波描述基于 C+的 OpenCV 库完成,并且其它的基于 Java完成。基于文本的描述(标题,描述,标签)提取于 SAPIR 集合。特征向量计算通过向量模型和 tf-idf 加权算法 1。为每幅图像建立六种特征向量,三个使用词干提取算法,三个不使用。一个词表,非索引字表 ,文本特征的反向文件(有 词干或者没词干)都会被计算和存入 PostgreSQL 数据库。在联网阶段,用户为每个可获
6、得的特征输入示例图片,一个搜索文本和一个权重距离函数。这个距离函数能够被测量(像欧几里得距离)或者不能度量(像 DPF 和余弦距离)。然后,系统用距离函数的加权组合和相对于原始图像的最大距离做的归一化操作之后执行一个 k-NN 搜索。为了有效地检索一个小的图像子集所有基于文本和基于内容的特征(最高达 11 个特征 /每个图像)存储在PostgreSQL 数据库,并且每幅图像有一个相应地二进制文件做线性扫描。当前,这个系统包含超过 115,000 图像在这个集合并且二进制文件的大小大约达到了130MB。这个系统包含了两种不同的图形用户界面:一种浏览器侧边栏(为终端用户设计),一种高级查询(为有经验的用户设计)。 3.浏览器侧边栏 这个界面为终端用户设计,它在浏览器上包含一个侧边栏(如图片 1 所示)。当用户在 Flickr 站点正在浏览图片并且想执行一个搜索,他必须复制正在查看的图像的 URL 并且粘贴到浏览器侧边栏的 URL 文本输入区域。最终返回给用户的结果按相似性大小排序返回给用户,这个相似性的计算是通过度量图像库中每个特征元素 相对于示例图像特征元素的距离实现的。之后,用户能够单击获得的图像,并将它显示在 Flickr 站点上。