基于卷积神经网络的目标检测算法研究

chy50953389
2 ℃
2020-07-04

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

答辩人：胡长雨指导教师：王爱丽基于卷积神经网络的目标检测算法研究哈尔滨理工大学HarbinUniversityofScienceandTechnology哈尔滨理工大学-测通学院12CONTENTS142536研究背景研究方法2理论基础结论研究方法1科研成果RESEARCHBACKGROUNDSRESEARCHFRAMWORKRESEARCHMETHODSANALYSISANDDISCUSSIONCONCLUSIONSCIENTIFICACHIEVEMENTS哈尔滨理工大学HarbinUniversityofScienceandTechnology22020/7/41研究背景RESEARCHBACKGROUNDS内容简介BRIEFINTRODUCTION本文以智能交通为背景，针对智能视频监控系统进行剖析，对其中目标检测算法进行了具体的研究和改进。首先，针对目标检测特征提取环节，本文以卷积神经网络为基础，构建深度特征提取器，提取深度特征训练可变形部件模型，作为最终的检测模型，并有效的提高检测精度。另外，在目标后处理环节中，将抑制重复检测和误检的面积重叠率阈值动态化后，进一步的提高了检测精度，减少了误检和重检。32020/7/41研究背景RESEARCHBACKGROUNDSPPT模板下载：行业PPT模板：节日PPT模板：素材下载：背景图片：图表下载：优秀PPT下载：教程：教程：教程：资料下载：课件下载：范文下载：试卷下载：教案下载：论坛：智能交通中的目标检测传统的视频监控解决方案只是进行视频图像的记录、存储与调取等机械的操作，用来记录发生的事情，不具有针对异常情况进行预测和报警的作用。需要工作人员时时刻刻查看显示屏，才能进行预测和报警。由于传统视频监控技术的不足，所以智能视频监控被用来帮助工作人员发现异常情况并及时报警。1研究背景RESEARCHBACKGROUNDS智能视频监控的功能是让计算机模拟人类的大脑对图像的处理机制，利用摄像头模拟的人类的眼睛，运行图像处理算法，分析从摄像头中获取的图像序列，并对被监控场景中的内容进行理解，实现对异常行为的自动预警和报警。智能监控的智能化主要表现在对图像序列中的目标进行检测、目标识别，理解目标的行为。目前常用的智能监控系统主要包括视频获取、图像预处理、目标检测、目标分类、目标跟踪、目标行为分析和理解等七个部分，图1-1给出了智能监控系统具体的流程图。图1-152020/7/4国内现状大部分目标检测算法任然使用单一或者几种手工设计的特征。手工设计的特征，不仅计算开销大，降低算法的执行速度，对于目标多样性的变化并没有很好地鲁棒性，严格限制应用前提。因此亟需对特征提取进行改进。1研究背景RESEARCHBACKGROUNDS62020/7/4国外现状在国外，也经历了由人工设计特征到算法自动设计并提取特征的过程。2010年，Dalai等利用人工设计的方向梯度直方图特征，训练出来多视角的可变形的检测模型，虽然有效的提高了检测精度，但仍然存在计算复杂，对小目标鲁棒性不强等问题。2012年，卷积神经网络在全球图像分类比赛中得到最优的成绩，因此卷积神经网络自适应的提取图像特征受到重视，卷积神经网络通过反向传播算法进行网络参数的更新，通过自适应的调整不同特征的权重有效的组合特征，得到鲁棒性更好的高层特征。因此，如果让计算机主动学习图像的特征，相对于人工设计的特征而言，能够有效的提高检测精度，改善实验结果。1研究背景RESEARCHBACKGROUNDS72020/7/4国外现状1研究背景RESEARCHBACKGROUNDS82020/7/4研究目的目标检测；卷积神经网络；非极大值抑制本文研究的最终目的是将卷积神经网络应用到目标检测任务中：如何避免手工设计的特征，减少计算的复杂度，提高算法执行速度，最终提高检测精度。具体的基于现有的开发库，在现有的卷积神经网络模型的基础上，利用迁移学习和重新训练，更新模型参数，提取深度特征并训练分类器。同时在滑动窗口检测后，动态化面积重叠率阈值，进一步提高检测精度。目标检测针对不同场景图像，能够对不同类目标进行自动检测和识别，定位目标的位置和识别目标的类型。卷积神经网络一种模拟人类大脑皮层视觉处理机制，由多个神经元连接并列成一层，多层神经元构成多层视觉处理结构。非极大值抑制检测过程得到的重复检测和误检，需要利用非极大值抑制算法来减少，对于不同类的目标需要动态化面积重叠率阈值。1研究背景RESEARCHBACKGROUNDS92020/7/4研究内容深度学习研究了深度学习的背景知识：包括深度学习的概念，以及典型的常用的深度学习模型。卷积神经网络研究了卷积神经网络的基本原理，组成和连接方式。基于深度特征的目标检测研究了基于现有的卷积神经网络模型Alexnet,通过迁移学习，获得深度特征提取器，提取特征训练多组件的可变形部件模型，对不同类目标的多样姿态进行检测。基于动态阈值的非极大值抑制研究了目标检测后处理过程，分析了其中的非极大值抑制算法，对核心的阈值进行了动态化，实现了自适应的抑制重检和误检。1研究背景RESEARCHBACKGROUNDS102020/7/42理论基础RESEARCHFRAMWORKS112020/7/4理论基础123深度学习卷积神经网络的连接方式卷积神经网络2研究框架RESEARCHFRAMWORKS深度学习概念典型的深度学习模型卷积神经网络基本原理前向传播和反向传播局部感受野和权值共享多核卷积122020/7/42研究框架RESEARCHFRAMWORKS在大数据，大模型，大计算的驱动下，深度学习属于一种深度学习模型。其实深度学习实质就是将低层特征进行有效的组合从而生成更丰富的深层特征，现有的许多识别和分类模型都是浅层模型，限制较多，在样本数量较少，计算机计算单元不足的情况下，对高非线性的复杂函数的逼近能力不足，所以应用于识别和检测问题时，会出现分类准确率不高，泛化性不足等问题。而利用深度学习框架则不同，通过训练深层非线性的多层网络模型，学习到的最优模型参数可以将样本的最本质的特征表示出来。深度学习最经典的模型就是全连接的神经网络，如自适应编码器，深度置信网络，还有就是卷积神经网络。1.深度学习深度学习的基本概念深度学习的典型结构132020/7/42研究框架RESEARCHFRAMWORKS2.卷积神经网络卷积神经网络的基本原理卷积神经网络是第一个真正训练多层神经元连接的深度学习模型，该模型构造方式是受到人类视觉系统处理机制的影响，利用权值共享的神经元在输入图像上进行卷积计算，则能获得同一种特征，当利用多种不同权值的神经元在输入图像上进行卷积操作，则能获得多种特征。该网络可以直接输入原始图像，避免了对图像进行复杂的前期预处理，因而得到广泛的应用。142020/7/42研究框架RESEARCHFRAMWORKSCNN模型AlexNet，是由多层神经元构成，其中前5层为卷积层，因为这些层神经元的连接方式是通过卷积核模板连接，是非全连接的方式连接，所以称为卷积层。后三层为全连接层，采用的连接方式为全连接，所以称为全连接层。卷积神经网络的基本原理卷积层，每一层和前一层之间依靠卷积核连接，每一个卷积核都在前一层特征映射图的局部感受野进行卷积操作，同时由于卷积核表示的是神经元权重。卷积模板为22，上一层的特征图分辨率是44，用这个卷积核在特征图上按固定的步长和顺序遍历计算一遍，计算得到33的特征图池化层也是CNN模型中重要的一层，对于降低特征向量的维数，避免维数灾难有重要的作用。所以一般情况下，池化层都是跟随在卷积层的后面。图像在某一区域的特征分布与其他区域的特征分别类似。所以在描述大的图像时，可以对不同位置的特征进行聚合统计，聚合统计后在求均值或者最大值，均值或者是最大值即为池化后的结果。2.卷积神经网络152020/7/42研究框架RESEARCHFRAMWORKS**大学**学院**University2.卷积神经网络卷积神经网络的基本原理从人类大脑角度理解神经网络，卷积神经网络中的神经元与我们的大脑无关，是通过函数f将输入图像转变成类别评分。162020/7/42研究框架RESEARCHFRAMWORKS2.卷积神经网络卷积神经网络的基本原理从人类大脑角度理解神经网络，卷积神经网络中的神经元与我们的大脑无关，是通过函数f将输入图像转变成类别评分。172020/7/42研究框架RESEARCHFRAMWORKS卷积神经网络的基本原理2.卷积神经网络182020/7/42研究框架RESEARCHFRAMWORKS前向传播和反向传播2.卷积神经网络192020/7/42研究框架RESEARCHFRAMWORKS前向传播和反向传播2.卷积神经网络202020/7/42研究框架RESEARCHFRAMWORKS局部感受野和权值共享2.卷积神经网络（a）神经元在感受野全连接（b）神经元在感受野局部连接212020/7/42研究框架RESEARCHFRAMWORKS多核卷积2.卷积神经网络边缘特征LBP特征222020/7/43研究方法1RESEARCHMETHODS232020/7/43研究方法1RESEARCHMETHODS1研究方法11基于深度特征的目标检测提取深度特征训练分类器目标检测结果与分析迁移学习深度特征金字塔训练LSVMPASCAL数据集单组件目标检测多组件目标检测242020/7/43研究方法1RESEARCHMETHODS13.基于深度特征的目标检测Felzenswalb等人[40]研究了基于可变形部件模型DPM，通过提取目标的HOG特征，对组成目标的局部模型建模，采用多样本学习并进行推理，最后利用根滤波器和部分滤波器对测试图像进行匹配检测实现目标检测。该方法为基于模型的检测方法提供了新的思路,但是局部判别式模型只采用了HOG特征，忽略的一些可靠的高层和底层特征，在一定程度上制约了检测的精度。本章利用CNN对DPM算法进行改进。首先通过迁移学习获取CNN模型AlexNet，然后将其截断获得AlexNet的卷积层，用来提取丰富的高层特征，具体是利用模型的前5层卷积层来获取深度特征，然后利用特征金字塔的每一层特征训练隐藏变量的支持向量机LSVM得到DPM的全局检测器和局部检测器。检测的过程中要对测试图像构造全局特征映射图和局部特征映射图，再对局部特征映射图进行池化，之后级联全局特征映射图得到新的特征映射图，然后用训练好的判别式模型去卷积级联后的特征映射图，得到检测结果。实验表明，利用CNN获取深度特征，训练可变形部件模型，有效的改进了算法的检测精度。252020/7/43研究方法1RESEARCHMETHODS13.基于深度特征的目标检测迁移学习262020/7/43研究方法1RESEARCHMETHODS13.基于深度特征的目标检测迁移学习通过分析AlexNet模型中的隐层可以发现，其中的底层的功能的是图像通用特征的提取，并在高层生成图像的深度特征。这一发现暗示，如果将AlexNet的底层看做一个特征提取器，则可以在其他的视觉任务重复中使用。因此最终用ImageNet