视频监控系统中运动目标识别方法研究Researchonm

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1视频监控系统中运动目标识别方法研究兰利宝,董慧颖,高岚(沈阳理工大学信息科学与工程学院沈阳110168)摘要:运动目标识别是对场景实现有效视频监控的必要环节。本文结合自适应背景更新算法和加权增强阈值选择方法有效地分割运动目标,选用区分性好且易于提取的面积、复杂度、长宽比、速度作为目标的识别特征。采用模糊识别方法和BP神经网络识别方法对利用静止的摄像机从高处俯视采集的目标进行仿真,其结果表明:两种方法均具有较高的识别率,分别为94.58%和98.75%;BP神经网络识别方法识别率较模糊识别方法高,但模糊识别方法运算简单、识别速度快。关键词:运动目标分割;特征提取;模糊识别;BP神经网络识别Researchonmovingobjectrecognitionalgorithmsinvideo-basedmonitoringsystemLANLi-bao,DONGHui-ying,GAOLan(SchoolofInformationScienceandEngineering,ShenyangLigongUniversity,Shenyang110168,China)Abstract:Movingobjectrecognitionisanecessarystepinvideo-basedmonitoringsystem.Self-adaptivebackgroundupdatealgorithmcombiningwiththeweightedenhancedthresholdselectionmethodcansegmentthemovingobjectseffectively.Wechoosearea,shapecomplexity,length-widthratio,velocityasrecognitionfeaturesbecauseoftheireasyextractionandgooddistinction.FuzzyrecognitionalgorithmandBPneuralnetworkrecognitionmethodareusedtoacquisitobjectsidentity.Theexperimentresultsshowthatbothmethodshaveahighrecognitionrate.Therateswere94.58%and98.75%respectively.TherecognitionrateofBPneuralnetworkmethodishigher.Butfuzzyrecognitionalgorithmiseasierandfaster.Keywords:segmentationofmovingobject;featureextraction;fuzzyrecognition;BPnueralnetworkrecognition1引言视频监控系统是图像处理、人工智能、模式识别、计算机技术的综合应用,在近二十年里得到了很大的发展。对路段进行视频监控能及时掌握准确的交通信息,当交通目标发生违规行为时自动做出判断和响应,能大大减少人的工作量。目前的交通视频监控系统主要针对车辆的检测和识别,往往对行人、自行车/摩托车不加考虑,对车辆、行人、自行车/摩托车的识别研究很少。车辆、摩托车/自行车、行人的识别分类是一个复杂的过程,传统的模板匹配识别方法计算量大,很难满足实时有效的监控要求。模糊识别方法最大的优点就是建模简单、计算量小,能够充分利用各个特征的特点实现目标信息的有效融合。人工神经网络具有很强的自组织、自学习能力,对网络进行充分的训练和学习后,就可以用它对未学习过的模式进行快速、准确的识别[1,2]。两种方法都具有较强的抗干扰能力。基金项目:国防预研课题:基于多模信息融合的目标识别技术和跟踪技术研究.作者简介:兰利宝(1982-),女,湖南,硕士研究生,主要研究图像处理、模式识别联系电话:13840521846,通讯地址:辽宁沈阳理工大学2005级研究生3班,邮编:110168;Email:fantasy8819@163.com22运动目标分割及特征提取2.1运动目标分割运动目标分割的目的是从视频序列图像中准确地提取运动目标,它是实现目标识别的基础。背景差分法只要构建好背景就能完整的分割运动目标,实时性好。背景差分法实现运动目标分割需要解决两个关键问题:一个是确定精确的背景模型,另一个是分割中阈值的选择。受刮风、日照等的影响,图像灰度会发生变化,因此需要适时地更新背景。文中采用自适应背景更新算法,它具有很好的适应性和鲁棒性[3]。由于场景和物体的动态性,导致在整个过程中很难选取一个合适的阈值进行分割。针对此问题,文中采用文献[4]提出的加权增强阈值分割方法,它的本质是增强前景抑制背景,计算简单,分割效果较好。图1是对一段视频进行实验第247帧的分割效果图。图(a)是当前帧图像,图(b)是当前帧背景,图(c)是汽车分割放大图,图(d)是自行车、行人分割放大图。图1目标分割2.2特征提取及分析特征提取是目标分割和目标识别之间的桥梁,选择一组少而精的分类特征是实时运动目标识别的关键步骤。充分考虑三类运动目标的特点后,提取以下四个特征:(1)目标面积A:理想状态下,目标的面积大小与其实际大小成正比,但受拍摄距离和角度的影响,目标的成像大小会与实际大小有些差别。对同一场景下拍摄的视频序列图像,车辆的面积一般要比行人、自行车/摩托车大很多。(2)形状复杂度C[5]:在平面图像中,该特征具有目标平移、旋转、伸缩不变的性质,能够较好地区分各种复杂程度不同的目标。一般而言,车辆的形状复杂度较小,而行人的形状复杂度较大,自行车/摩托车的形状复杂度较一般。(3)长宽比r:长宽比是指二值目标最小外接矩形的宽和长之比,它很容易区分出细长目标。行人属于细长目标,长宽比小;摩托车/自行车的长宽比大;车辆的长宽比一般也比较大,但是货车、加长的车、大型巴士的长宽比会小一点。(4)速度v:考虑到采集的图像时间间隔很小,故可以近似认为目标在极短时间内的运动轨迹是直线,可以利用目标重心的实际位移和时间间隔来计算目标的运动速度。速度特征具有很好的区分性,行人的速度很慢,摩托车/自行车的速度较快,汽车的速度很快。提取的特征参数由于量纲不同导致它们之间不具有可比性,故在识别前先用如下所示效用函数对特征参数进行归一化处理,将其转化成为[01]区间的无量纲值。minmaxmin'xxxxx−−=(1)式中:'x是归一化后的特征值,x是输入的某一特征分量,minx和maxx分别指所采集特征分量的最小值和最大值。(a)(b)(c)(d)33模糊识别对车辆、摩托车/自行车、行人这三类运动目标而言,每一类都包含繁多的个体,不同类的个体之间由于结构、型号的不同存在一定的差异性,同类个体在某些方面又具有一定的相似性。因此提取的特征信息可能存在不精确性、不完整性和不完全可靠性。采用模糊识别方法可以对提取的特征信息进行融合,提高抗干扰力。为提高运算速度,先用简单的特征组合对易于识别的目标进行判决。货车、加长车、大型巴士往往具有面积特别大且速度较快的共同特点,当目标同时满足这两个条件时直接输出目标类型为车辆。另外,当目标的形状复杂度特别大,且速度特别慢时,目标类型直接输出为行人。对于不满足初次判决条件的目标,用模糊识别方法来实现,其主要过程为:(1)输入归一化特征向量),,,(4321xxxxX=(2)特征向量的模糊化每个特征分量采用高斯型隶属函数表述,因为它具有光滑平稳的过渡特性,能很好的表述模糊的概念。其表达式为:2)exp()(σμcxx−−=(2)式中x是输入的特征分量,c是隶属函数中心,σ是宽度,)(xμ是输入特征分量的隶属度。隶属函数中心利用模糊C均值聚类得到。隶属函数宽度由隶属函数中心和相邻模糊子集的临界分界点之间的距离决定。最后得到的各个隶属函数参数如表1。表1隶属函数参数表特征参数大中小中心0.7/0.05A宽度0.55/0.15中心0.890.440.09C宽度0.20.20.2中心0.75/0.11r宽度0.4/0.24中心0.850.360.05v宽度0.30.20.1(3)模糊规则的生成对各类目标的特征数据进行分析,并且结合对车辆、行人、自行车/摩托车这三类目标的经验知识,归纳出表2所示六条简单有效的模糊推理规则。表中目标1是车辆,目标2是自行车/摩托车,目标3是行人。表2模糊规则表规则ACrv目标R1大小大快目标1R2大小大中目标1R3小中大中目标2R4小中大慢目标2R5小大小慢目标34R6小中小慢目标3(4)基于规则的模糊推理实现采用Mamdani模糊蕴含最小运算和最大-最小合成法,依据模糊规则进行推理,得到输出量的模糊集合'C为:U61''==iiCC(3)式中'iC为每条规则输出的模糊集合。对输出量的模糊集利用重心法解模糊判决得到目标的输出值。4BP神经网络识别BP网络是一种典型的前向多层神经网络,由于具有算法简单、便于实现、可拟合任意连续函数等特性,在目标识别领域中得到了大量的应用。BP网络将信息分布式存取于连接权系数中,使网络具有很高的容错性和鲁棒性,有效解决了模式识别中普遍存在的噪声干扰和输入模式的部分损失问题。BP网络用于目标识别时,其实现过程为:(1)网络模型的建立,主要是选择网络的层数和每层的单元数。理论证明,一个具有无限隐层节点的三层BP网络可以实现任意从输入到输出的非线性映射,因此对于不太复杂的映射关系,应采用少的隐层数,文中采用三层BP网络模型。目前,隐含层节点数的选取大多数还是以经验为依据。文中参照如下经验公式确定:51.035.077.054.212.043.02+++++=nmnmnS(4)式中:S为隐层节点数,m为输入层节点数,n为输出层节点数。输入层神经元节点数等于输入特征矢量的维数,输出层节点数由识别的类别数决定。最后确定BP网络的拓扑结构为4-5-3。网络的传输函数均选用非线性S型函数Sigmoid函数,以完成输入模式到输出模式的非线性映射。(2)选择一定的学习算法用训练样本集对网络进行训练,使网络的实际输出与理想输出满足一定的误差范围。Levenberg-Marquardt算法是梯度下降法和牛顿算法的结合,与其他的BP学习算法相比其收敛速度最快,训练效果最好[6]。(3)将已知数据样本分为训练集和检验集两部分,训练样本集用于对神经网络进行训练,检验样本集用于对训练好的网络进行检验。(4)用检验样本集对网络进行检验,把检验样本的输入量输入网络,如果网络得到的实际输出与理想输出在容许的误差范围之内,说明此神经网络结构能够用来识别目标,进行第5步;否则,回到步骤1重复进行。(5)用训练好的网络进行目标识别和分类。5实验结果和分析在阴天情况下采集图像,视频流为25帧/秒(PAL制式),图片规格为320×240。从视频图像中对三类目标各任意抽取200个样本提取特征数据,分别用模糊识别方法和BP神经网络识别方法进行实验。模糊识别方法运算简单,速度快。从输入一组特征数据到输出结果只需要0.0026s。从提取的5数据集中各任取80组数据,得到的识别结果如表3。从200组数据中任意抽取120组对BP神经网络进行训练,允许误差为0.001,对网络训练一次需要0.8s~2.3s,一共训练了110次。用剩余的80组数据作为检验样本集,测试结果如表4。从输入一组特征数据到输出结果需要的时间为0.00602s。表3和表4中目标1、目标2、目标3含义同表2。表3模糊识别结果目标样本数正确数正确率(%)误判数误判率(%)目标1807897.522.5目标2807492.567.5目标3807593.7556.25合计24022794.58135.42表4BP网络识别结果目标样本数正确数正确率(%)误判数误判率(%)目标1808010000目标2807897.522.5目标3807998.7511.25合计24023798.7531.25由表3和表4可见车辆的识别率比行人、自行车/摩托车的识别率高。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功