基于深度卷积神经网络的监控视频目标检测算法研究2018.4.17CONTENTS01目标检测02深度学习发展史03基于深度卷积神经网络的监控视频目标检测算法目标检测目标检测基本概念基于计算机视觉技术的目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。应用领域智能视频监控;基于内容的图像、视频检索;基于计算机视觉的人机交互;自动驾驶等重点1.识别目标2.确定位置深度学习发展史人工智能vs机器学习vs深度学习基于深度卷积神经网络的监控视频目标检测算法目标检测参考论文:卷积神经网络在图像分类和目标检测应用综述_周俊宇等基于区域推荐的深度卷积神经网络的物体检测算法区域推荐算法R--CNNSPP--NETFaster--R--CNNFast--R--CNNR--FCNRegionProposal4个步骤1.候选区域生成:一张图像生成1K~2K个候选区域(采用SelectiveSearch方法)2.特征提取:对每个候选区域,使用深度卷积网络提取特征(CNN)3.类别判断:特征送入每一类的SVM分类器,判别是否属于该类4.位置精修:使用回归器精细修正候选框位置R--CNN改进点在最后一个卷积层后,设计一个金字塔池化层,然后,将特征图像固定到要求的尺寸。SPP--NET改进点1.很大程度上实现了endtoend(除了regionproposals的产生还是用的selectivesearch)。2.不再是将regionproposals依次通过CNN,而是直接输入原图,来提取特征(这样一张图只会CNN一次)。3.网络同时输出类别判断以及bbox回归建议(即两个同级输出),不再分开训练SVM和回归器。Fast--R--CNN改进点1.卷积生成候选区域“RPN(RegionProposalNetwork)网络”代替了SelectiveSearch算法2.完全实现了端到端的训练,实时检测Faster--R--CNN改进点将全连接层看作是整个特征图的卷积,卷积层替代了全连接层R--FCN基于回归算法的深度卷积神经网络的物体检测算法回归算法YOLOFast--YOLOSSDEndtoEnd改进点仅用一个神经网络,相对于基于候选区域的2个卷积网络检测速度大大提高YOLO改进点以VGG-16为基础,在最后一个卷积层后额外加入卷积层,大小逐层递减,在每个卷积层上做滑动窗口,在不同尺度的特征图下找锚定框SSD小结1.基本实现实时检测1.只用一个神经网络,检测速度大大提高基于候选区域方法基于回归方法2.同时训练2个卷积网络,仍存在训练参数多,训练时间长,网络结构复杂等问题(本质上仍用传统“三步走”思路)2.小目标识别效果不好THANKYOU!