手持设备图像智能检索文献综述

 2022-11-30 14:43:13

1 研究背景和意义

随着多媒体技术和互联网技术的高速发展,每天人们都会上传和下载大量的图片,海量的图片被存储在各大高速存储系统中,如何从网上巨大的图像数据库中精准、快速地检索到用户感兴趣的图片成了多媒体信息检索领域的一大研究热点。

早期基于文本的图像检索随着大规模数字图像库的出现渐渐变得不再适用,而基于内容的图像检索(CBIR)就有效地解决了这一问题,这是一种近似匹配技术,由计算机自动提取用户想要查询图像的可视特征,并在数据库中进行相似匹配,最后按匹配程度由高到低将检索结果返回给用户,很好地避免了人工描述的主观性。随着CBIR的发展,国内外的众多学者也提出了各种特征提取算法和相似匹配算法来提高图像检索的精度和查全率,使得用户能够得到预期的查询结果。但是,即使越来越多高效的算法被提了出来,图片检索的查询准确率和检索速度也不能够让所有用户满意,所以更加鲁棒的特征描述符和更加快速的检索算法还亟待人们提出,所以在基于内容的图像检索领域还需要人们继续探索。

CBIR经过十几年发展,已经被广泛应用于电子商务、搜索引擎、医疗诊断、皮革布料、版权保护、街景地图等生活的方方面面。同时,随着手持设备的普及,移动端的图像检索也进入了人们的视野,提高了图像检索的实时性和移动性,比如阿里巴巴的拍立淘闪拍购物应用,用户可以用手持设备抓拍自己心动的物品,然后所拍图片会自动上传到服务器端,在服务器端运行图片检索应用从而为用户找到相同或者相似的物品并且提供购买的店铺链接,让用户能够很快地购买到自己想要的物品,极大地方便了人们的生活。有关CBIR的发展可见文献[1]。

2 研究历史和现状

CBIR系统实现的关键是图像视觉特征(如颜色、纹理、形状等)提取和匹配,由于图像都是由特征向量进行表示,并且这些特征向量都是高维向量,所以为了适应庞大的图像数据库,提高检索效率,提取后的图像特征必须进行索引和降维的处理,同时由于不同的用户对同一张图片存在认识的差异以及低层的特征并不反应图像真正的语义信息,所以检索的结果并不能让所有用户满意,所以引入了相关反馈技术[2][3][4]来逐渐提高检索结果,从而提高系统的检索性能。

基于内容的图像检索步骤为:

  1. 预先分析、提取和存储数据库中各图像视觉的底层特征;
  2. 用户提交需要查询的图片,系统采用某种方法提取该图片的特征向量;
  3. 选取相似性比较方法,将需要查询的图片的特征与特征库中的特征进行比较匹配;
  4. 将与查询特征相似的图像,按相似度由大到小排列结果返回给用户;
  5. 系统反馈的结果用户可以筛选或者从候选结果中选择一个示例,经过特征调整后,形成一个新的查询,直到得到一个满意的结果。

2.1 早期研究

在CBIR发展的早期,人们大多基于图像的全局特征进行研究,如颜色、纹理、形状、空间位置等特征,其中颜色特征是人们最先采用的特征,它是一种重要的视觉特征,具有旋转不变性、平移不变性等优点,主要使用的方法有颜色直方图、颜色相关图等。纹理特征是对局部区域中像素之间关系的一种度量,常用方法有统计法、结构法、频谱法等,之后Haley等人使用Gabor小波模型提取了旋转不变性的纹理特征[5],Ojala等人提出了LBP[6]纹理分析方法等等,这些传统的方法在图像发生旋转、尺寸缩放、视角变换、亮度变换等改变的时候都不能很好地兼顾。总之,全局特征对图像的区分力不是很强。2000年便是早期传统方法的终结[7]。

1999年David Lowe提出了尺度不变特征变换(SIFT)[8],并经过整理完善后于2004年发表相关论文[9]于IJCV上,引起了人们的强烈关注,SIFT特征是图像的局部特征,其对旋转、尺寸缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性,同时其因为信息量丰富,所以区分性很好,适用于在海量特征数据库中进行快速、准确的匹配,它还具有多量性、高速性和可扩展性等优点。局部特征对图像的区分力很强,但数目太多,所以各种编码的方式也被提出,如BOF(特征袋)[10],FV(Fisher向量)[11],VLAD[12]等。

与此同时,由于图像描述方法的限制,图片视觉低层特征同高级语义特征间的映射问题始终没办法很好地解决,所以图像查询效率极低,为了填补低层视觉特征与高层语义特征之间的鸿沟,引入了交互式检索,即相关反馈技术。相关反馈技术通过人来引导计算机进行图像检索,所以语义鸿沟可以得到很好的填补。人们也提出了很多相关反馈的算法,其基本策略是改变相似度中的权重,另一方面改变检索向量,使其向理想的方向转移。其中,比较经典的算法思想如下:

  1. 权值调整算法:对图像的不同特征赋予不同的权重,然后根据用户要求,将用户认为与图像相关的特征值赋予更大的权重,而与图像无关的特征值赋予较小的权重,然后根据调整的权重计算图像的相似度。
  2. 查询向量转移算法:根据用户反馈信息,改变数据库中每幅图像与查询图像之间的距离,使相似的点靠近查询图像,不相似的点远离查询图像。
  3. 基于模式分类算法:将数据库中的图像根据特征进行划分类别,通过用户反馈的信息,再形成不同的类。再计算查询图像与各类在特征空间上的距离,并将距离最短的类作为目标类。

QBIC图像检索系统就是上世纪90年代著名的基于相关反馈的图像检索系统。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。