面向视觉注意机制的显著性检测方法文献综述

 2022-11-30 15:24:29

文献综述

随着大数据时代的来临,海量的数据虽然给人们带来了许多潜在的有价值的信息,但也存在着许多冗余、无用的信息。如何从海量的图片数据信息中快速获取并处理有用的信息就是当前计算机视觉领域面临的一个重大问题。尽管近年来计算机硬件得到了很大的发展,但仍然无法满足海量的数据处理的需要,并且处理所有的信息也是一种硬件资源的浪费,因此把有限的资源应用在最重要的方面是当前的一个重要研究课题。自1998年Laurent Itti提出第一种视觉显著性检测方法以来,视觉显著性检测技术得到了越来越多的关注。近些年来,越来越多的科研人员加入到视觉显著性的研究当中来,提出了各种有关视觉显著性的理论和方法,希望能提高、优化或开创出通用高效的视觉显著性算法。

我们感知到的外界信息有大约80%是来自视觉的,然而人的视觉通路是有瓶颈的[1],人脑的处理能力也是有限的,因此我们大脑在接收和处理信息时,仅有少数的刺激能够进入视觉系统得到进一步加工处理。在这个过程中,视觉注意机制扮演着重要角色,视觉注意机制是人类视觉系统内在的一个重要机制[2]。它使得我们在面临一个复杂的场景时,能够迅速选择感兴趣的或与任务相关的区域进行优先处理。视觉显著性的研究就是基于这些人类机制产生的。

1.根据信息处理层次不同,视觉显著性算法可以分为三大类:

第一类是自底向上基于数据驱动的显著性区域检测算法,它依赖于视觉特征本身的刺激,通常是与周围有较强对比度的特征,如颜色、亮度、梯度等。具有代表性的是Itti等提出的模拟生物体视觉注意机制的以特征整合为基础的的选择性注意算法(简称IT算法)。

第二类是自顶向下任务驱动的显著性目标检测算法,该算法依赖于场景内部结构,事物本身的先验知识等,如Goferman等提出的CA算法[3],Oliva[4]采用Gist特征与场景语义关联作为显著性检测的上下文,引导注意资源的分配。

第三类是结合自顶向下和自底向上的方法,目前应用较为广泛,两大优势是:一可保持对象分组假设的一致性,二可避免穷举搜索和误报。

个人认为第三类的算法是最有效的,因为这符合了人类在进行视觉任务时的状态:

自底向上的算法符合人类无意识状态或自由状态下观察事物的特点,而自顶向下的算法符合人类任务式的搜索或偏好搜索下的状态。二者的结合实际上可以看作是两个特征选择的过程,先选出感兴趣区域,再根据底部特征进一步选择出显著目标,从而大大降低数据处理量,达到显著性检测的的目的。

2.根据研究对象的不同,视觉显著性算法分为以下两类:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。