基于深度学习的快速目标检测技术研究文献综述

 2022-11-30 15:24:49

1.1 论文名称

基于深度学习的快速目标检测技术研究与嵌入式计算机的应用

1.2 论文研究的目的

一个好的目标识别算法能兼有各种较高的性能指标。但是在实际应用中,我们更期望某项性能达到较高的标准,可以牺牲其余指标保持在一个可接受的范围。本项目将在学校无人自动驾驶电动巴士的目标识别情景中,应用刘亚洲、曹森发表的专利[2]中提到的一种轻量级卷积神经网络ThinNet模型。在无人车自动驾驶过程中,能准确实时地识别无人车周围的人、汽车以及自行车这三类目标。

以成熟的智能化技术支撑的无人驾驶车的普及,能够解放人的大脑和四肢,将会大幅减少交通事故;有利于节能减排,减少环境污染;将给交通行业迎来新的变革,使人们生活更方便和智能化[3]。作为目标检测技术的一个具体应用方向,国内外许多科研机构和专家逐渐开始了对车辆检测的相关研究[4]

1.3 综述

目标检测应用了模式识别、图像处理以及机器学习等许多前沿领域的技术。目标识别旨在像人们的眼睛一样了解识别外界的信息,通过传感器等各种硬件模拟人的眼睛,接收和处理来自外界的图像和视频,像人的视觉系统进行目标识别和定位,反馈识别到的信息。近年来,深度学习的快速发展使得卷积神经网络技术在目标识别领域得到广泛应用 [1]。卷积神经网络仿照生物视觉认知机制,在大型图像处理的应用情景中表现出色。这项技术的发展更新,使得交通系统智能化、军事目标检测、监控安全系统智能化以及医学导航手术等领域得到更好的发展。

目标检测的目标是确定在某些给定图像中是否存在来自给定类别的对象实例(如人类、汽车、自行车、狗和猫),如果存在,返回每个对象实例的空间位置和范围。作为图像理解和计算机视觉的基石,目标检测是解决更复杂或更高级视觉任务的基础,如分割、场景理解、对象跟踪、图像字幕、事件检测和活动识别。目标检测在许多人工智能和信息技术领域有广泛的应用,包括机器人视觉、消费类电子产品、安全、自动驾驶、人机交互、基于内容的图像检索、智能视频监控和增强现实。

历史上,物体探测领域的大部分工作都集中在单个类别(如人脸和行人)或几个特定类别的探测上。相比之下,在过去的几年里,研究界已经开始朝着建立通用目标检测系统的挑战目标迈进,目标检测能力的广度与人类相当。

在计算机视觉领域,目标检测主要目的是能够检测出图片或视频上目标的位置和其所属类别,目标检测的发展历程也经历了几个阶段的发展。

传统目标检测通过滑动窗口的方式,在输入图像上选择窗口并提取特征(HOG/DPM,SIFT等),最后用分类器对这些特征进行分类(SVM, Adaboost等)。传统目标检测存在的两个主要问题:一个是基于滑动窗口的区域选择策略没有针对性,窗口冗余,时间复杂度高;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性[5]

近几年,深度学习在视觉识别、语音识别[6]和自然语言处理[7]等许多领域展现了非常好的性能,在深度学习模型中,卷积神经网络(Convolutional neural network CNN)的发展给目标检测领域带来了革新。

较早应用CNN的网络模型是“LeNet-5”[8],在1998年,由“卷积神经网络之父”LeCun设计,应用于手写字符的识别,之后许多年银行用这项技术识别支票上的手写数字,取得很好的商业效果。它只有七层网络,包括2个卷积层,2个池化层以及3个全连接层。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。