龙源期刊网视频中行人快速检测计数方法研究作者:孙洋来源:《数字技术与应用》2013年第11期摘要:为了解决智能监控中对行人在实时帧中检测并计数的问题,提出一种快速高效的检测计数方法。采用高斯背景建模和边缘检测获取运动区域及其轮廓信息,形成检测区域;同时根据头部和肩部的组合形态构建行人检测模版,最后对检测区域进行模版匹配,统计行人数目。实验结果表明,该方法快速高效,有较高的正确率和较低的统计误差,同时对行人遮挡有一定的区分能力,对阴影也有较强的抗干扰能力。关键词:行人检测行人计数模版匹配中图分类号:TP391.41文献标识码:A文章编号:1007-9416(2013)11-0084-03行人检测[1]是智能视频监控系统中的一个关键技术,近些年视频行人检测在智能小区监控,智能室内监控,智能校园监控等方面得到了广泛的应用。而行人计数又是在行人检测中的一个典型应用,例如,对于商场、超市或者是车站等客流量较大的场所,可以对不同时间段的客流量进行统计分析,采取有效的措施帮助其提高服务质量、加强安防保障等措施。通常在公共场所的视频监控设备的安装位置都较高,目的是为了获取更大范围的监控区域。所以由于角度方面的问题,视频中行人的形态较水平视角的形态有较大的差异,甚至有些监控的视角是垂直向下的,行人的形态差异更大,所以一些传统的行人检测方法如HOG[2]并不适合这类的监控应用。因此,针对位置较高的俯拍监控,本文提出一种针对行人头部和肩部组合形态检测方法来达到行人检测并计数的目的。1行人检测并计数方法描述1.1检测方法框架图本文将行人检测计数方法分为三个部分,包括获取运动目标区域,建立行人检测模版和行人检测计数,总体方法框架如图1所示。1.2获取运动目标区域目前,常见的运动目标检测方法有背景建模、帧差法以及光流法等,考虑到视频检测的实时性及后续对运动目标的处理时间消耗,本文采用背景建模中的单高斯方法[3]提取视频中的前景点。实时获取视频帧转换为灰度图,再建立灰度图各个图像点的高斯分布模型,其中下标t表示时间,表示t时刻高斯分布的均值,表示高斯分布的协方差矩阵,判断前景点公式如下:龙源期刊网若当前像素灰度为,当大于P(P为阈值),则判定该点为前景点,否则为背景点。之后针对前景点做一些形态学图像处理[4]:首先二值化前景点图像,然后进行开运算消除一些噪音点,断开狭窄的连接,平滑对象轮廓,去掉细小的突出部分;再进行闭运算,填充前景区域细小的空洞,连接邻近块;最后进行孔洞填充,使获取的前景区域信息更完整,并将区域面积小于一定阈值的前景块滤去(这里我们认为是非行人区域)。将以上处理后的前景区域作为待检测的运动目标区域Z[Z1,Z2,…Zn],其中Zi表示第i块运动目标区域。1.3建立行人检测模版通常情况下,监控设备的位置较高,向下俯拍的画面跟水平拍摄的画面中行人的成像形态有较大的差异,所以一些传统的行人检测模版并不适合如HOG。通过观察发现,在这种情况下,行人的头部和肩部具有相对固定的组合姿态,因此本文针对行人头部与肩部的组合模态构建行人检测模版,方法步骤如下:Step1:从训练视频序列N中选取头部与肩部模态明显的行人彩色图片,行走路线包含各个方向,构成行人样本集S[S1,S2,…Sn],其中Si表示第i个样本。Step2:将Si(i(1,n))转换为灰度图像,然后用canny算子进行边缘检测,再将得到的轮廓图片缩放到相同尺寸,记为[,]。Step3:将(i(1,n))样本二值化,然后将所有样本二值图像按照头部位置对齐重叠的方式进行叠加处理,构成一个头部与肩部匹配响应较高的概率模版,记为行人检测模版M,过程如图2所示,其中(a)表示行人彩色样本集,(b)表示带对齐标记的样本轮廓二值图,(c)表示构建的行人检测模版的灰度图以及在matlab上二维和三维的显示。1.4行人检测与计数本文为了加快检索速度,满足视频检测的实时性要求,根据构建的模版特性,具体实现步骤如下:Step1:将提取出的运动区域Z对应的彩色图像转换为灰度图像,然后进行边缘检测,得到待检测区域图像。Step2:用行人检测模板M对带检测行人区域进行匹配计算,公式如下:其中R表示在中的一块类似模板形态的圆形待检测行人区域,Score()计算模板大小的运动区域与模版M的匹配度,当其大于阈值,就判定该区域为行人,为1,否则为0,的取值是通过训练视频序列,校正视频序列和测试视频序列学习而来,表示运动区域中检测的行人数目。所以对视频每一帧的行人统计公式如下:其中Z表示中的运动区域。通过这一系列处理,我们能够对视频中的行人进行快速的检测计数。龙源期刊网实验结果为了验证方法的可行性,文中搭建的实验环境如下:一台操作系统为WindowsXP32位的PC机(处理器为IntelCorei3,内存为2GB,显卡为ATIMobilityRadeonHD6450),测试环境为MATLAB2010和VisualStudio2010。视频序列图像的大小为320*240,速率每秒30帧,训练视频序列总时长10小时,测试视频序列平均时长5分钟(总计约1小时)。图3和图4为实验结果图,其中在图3中,横轴表示视频时长,纵轴表示当前时刻的人数,蓝色线表示实际人数,红色线表示本文方法的检测人数;在图4中,横轴表示视频的帧数(这里相邻帧在视频序列中的实际间隔为5帧),纵轴表示当前帧实际人数减去检测人数的绝对值。本文也对不同视频序列的检测正确率和平均误差人数做了统计,结果如表1所示:从以上实验结果可以看出,本文提出的方法具有可行性,在保证实时性的情况下能够获得较高的检测精度,实时场景中检测人数的平均误差较小,正确率较高,而且由于监控的视角向下,行人的遮挡区域大部分集中在身体部位,所以本文提出的方法能够在一定程度上解决遮挡问题,同时也有较强的抗阴影干扰能力。但是也存在一些不足,比如穿着复杂的行人,跟随行人移动的具有圆形特征的物体,行人在场景中驻留过久等都可能对检测造成误差影响。3结语本文提出了一种高效快速的对视频中行人进行检测计数的方法。采用高斯背景建模提取运动区域,再利用canny算子进行边缘检测提取运动区域的轮廓信息,形成检测区域。同时根据头部和肩部的组合模态构建行人检测模版,然后对待检测的区域进行模版匹配,行人计数。并通过实验验证了该方法的可行性,不仅对行人遮挡有一定的区分能力以及对阴影的较强抗干扰力,还能保证较高的正确率和较低的平均误差。参考文献[1]PDollar,CWojek,BSchiele,PPerona.”PedestrianDetection:AnEvaluationoftheStateoftheArt”.PatternAnalysisandMachineInteligence,IEEETransactions,743-761,2012.[2]DalalN,TriggsB.”Histogramsoforientedgradientsforhumandetection[A]”.InProc.IEEECVPR[C].886-893,2005.[3]M.Piccardi.”BackgroundSubtractionTechniques:AReview,”IEEEInternationalConferenceonSystems,ManandCybernetics,4,pp.3099-3104,2004.[4]RafaelC.Gonzalez,RichardE.Woods.”DigitalImageProcessing,ThirdEdition”523-535,2011.龙源期刊网