学生学号:1272406056计算机学院本科毕业论文开题报告运动检测方法的研究学生姓名:胡万俊指导教师:孙红光所学专业:计算机科学与技术专业类别:师范年级:2006级研究方向图象处理东北师范大学计算机学院2010年03月填表说明和要求1.封面的专业类别按师范类或普通类填写。2.文献综述报告不少于1200字,报告总体为3000字左右。3.参考文献一般不少于10篇,须包含相当比例的学术研究论文,不可全部为图书类文献。4.报告书写要参照本模板的规范,正文部分使用宋体5号字;报告采用计算机打印,左测装订,开题报告评审表装订在报告的最后一页。5.成果形式的类别可包括方法、算法理论、系统软件、硬件系统、应用软件系统等。6.完成论文的截止日期为毕业学期的5月31日,可按此日期安排论文进度。一、文献综述(选题研究意义、国内外研究现状、主要参考文献等1.题目来源(问题的提出随着社会经济和科学技术的飞速发展,人们对安全技术防范的要求也越来越高。二十世纪八十年代末到九十年代中期,随着各种新型安保观念的引入,社会各部门、各行业及居民小区纷纷建立起了各自独立的闭路电视监控系统。然而,传统的视频监控受到当时技术发展水平的限制,监控系统大多只能在现场进行模拟电视监视,视频信息存储到录像带上,如果是监控的地点比较多,要求录像的数据保存时间长,录像带的数量就会变的惊人,整个查询、检索工作变的很复杂,管理运营成本增加,而且还会出现录像带时间长了或转录次数多了时图像质量变差的问题。随着编解码技术的发展,特别是MPEG4/H264编解码技术的成熟,越来越多的用户采用了数字视频监控系统,实时压缩多路视频,并存储到硬盘上,录像信息以数字形式存放在硬盘上。由于计算机屏幕尺寸有限,在同时显示多路视频时每一路预览的画面都比较小,这一点不利于工作人员及时发现一些细小的隐蔽的安全隐患问题;而且智能化在数字安全防范领域也得到越来越多的应用,在某些监控的场所对安全性要求比较高,需要对运动的物体进行及时的检测和跟踪,因此我们需要一些精确的图像检测技术来提供自动报警和目标检测。2.选题的目的和意义目的:继承前人视频图像研究的成果,熟知几种普遍视频处理技术,着重掌握其视频检测方法,在理解掌握的基础上编程实验,完成基本的视频检测的代码意义:a了解数字视频与人们的密切关系,随着科技的发展,视频通信中的“面对面”信息交流方式是一种最直接、最直观、最生动的交流方式,给人们的生活带来的巨大的变化。b理解并掌握图象处理分支的视频处理的一般方法,如:运动估计,运动补偿等。尤其重要的一点就是,掌握运动检测的相关算法。c利用所学的知识,结合视频处理技术,为人们的生活做贡献。3.国内外的研究现状国外研究现状:图象视频通信技术的发展经历了几个不同的发展阶段,最初的视频同例子是1964在美国纽约的国际博览会上展出的模拟可视电话,并在20世纪70年代初提出了传送黑白静止或活动图象的点对点可视电话业务的商业应用。之后在20世纪80年代初,日本制定了在模拟网上传送黑白静止图象的可视电话的TTC标准,并研发出满足该标准的图象通信设备,图象显示清晰度为100×100,每5~6秒钟传送一幅图象。然而20世纪70年代初和80年代初这两次视频通信研究,发展的高潮由于种种原因未能持续,在随后的一段时间里,图象,视频发展的步伐比较缓慢。一直到20世纪到90年代,计算机技术,信息技术,网络技术以及其他的相关技术的饿发展突飞猛进,进入了信息的数字化时代,在这阶段,视频压缩技术得到快速的发展,特别是视频,音频编解码,多媒体通信等方面的国际标准不断推出,有利促进了视频通信技术走出实验室,进入了实用化阶段。如:视频会议,可视电话,视频监控等应用日益广泛。国内研究现状:目前国内数字化视频监控系统发展迅速,嵌入式系统更是由于其成本低、稳定性高、可维护性强等优势而成为新的发展方向。就压缩技术来看,主要采用MJPEG、MPEG-1和MPEG-4,其中MPEG-4在压缩方法上远远优于其他2种,在录像存储容量、清晰度、帧率可调及网络传输上都有大幅度的提高,因此已成为目前发展的热点。运动目标的检测和跟踪是视频监控中的重要技术,现在的运动目标检测和跟踪技术包括帧差法、光流法、统计学方法和贝叶斯分割法等,在视频监控中主要应用的是帧差法。这些方法都是基于象素进行处理的,而且脱离了压缩技术,运算量和复杂度都比较大,不适合嵌入式视频监控系统。由于MPEG-4将对象按运动、形状、纹理三类信息进行编码,运动信息编码主要是通过运动估计和补偿来完成。其中运动估计就是在参考画面上搜寻最相似的方块,并确定二块相对位置的变化,即确定运动矢量MV的过程。而运动目标的检测就是要将运动的物体与背景进行区分。所以可以充分利用二者的联系,将MPEG-4编码中运动估计所得到的运动矢量信息作为检测依据的基本信息,这样无须再增加额外的运算和存储就能获取整帧图像的所有运动信息。运动检测是指在指定区域能识别图像的变化,检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来,还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测成为一项相当困难的工作。(格式运动检测原理:早期的运动检测如MPEG1是对编码后产生的I帧进行比较分析,通过视频帧的比较来检测图像变化是一种可行的途径。原理如下:MPEG1视频流由三类编码帧组成,它们分别是:关键帧(I帧,预测帧(P帧和内插双向帧(B帧。I帧按JPEG标准编码,独立于其他编码帧,它是MPEG1视频流中唯一可存取的帧,每12帧出现一次。截取连续的I帧,经过解码运算,以帧为单位连续存放在内存的缓冲区中,再利用函数在缓冲区中将连续的两帧转化为位图形式,存放在另外的内存空间以作比较之用,至于比较的方法有多种。此方法是对编码后的数据进行处理,而目前的MPEG1/MPEG4编码都是有损压缩,对比原有的图象肯定存在误报和不准确的现象。4.主要参考文献[1]郝彦斌基于视频序列图象的运动目标检测与跟踪.大连理工大学,2008[2]许正荣运动目标的模拟.合肥工业大学,2004[3]刘庆涛红外运动目标分割技术方法研究与电路系统实现.南京理工大学,2004[4]高大山智能交通系统中运动目标检测方法的研究.清华大学,2002[5]王频佳REAL-TIMEPCR检测弓形虫方法学的建立及初步应用.重庆医科大学,2005[6]刘峰视频图象编码技术与国际标准[7][英]IainE.G.RichardsonH.264和MPEG-4视频压缩:新一代多媒体的视频编码技术》[8]卢峰数字视频设计与制作技术[9]精英科技视频压缩与音频编码技术[10][英]IainE.G.Richardson视频编解码器设计:开发图象与视频压缩系统[11]胡晓峰等多媒体技术教程二、研究方案1.研究目标、研究内容和拟解决的关键问题研究目标:在认真研读各方面的相关资料,著作和论文的基础上,参考MPEG4运动视频图象处理标准,着重研究视频运动检测方法,进行编程实验,最终完成运动检测方法的完整代码。研究内容:本课题主要以数字图象处理技术和数字信号理论为基础,利用MATLAB为实现软件,主要研究运动估计和运动补偿等运动检测方法。a.运动估计:根据桢间的运动信息得到桢内像素点的运动矢量(MotionVector,MV。视频处理系统中,运动估计是非常重要的一个环节,它可以广泛应用于视频压缩,格式转换和滤波等。在去隔行中,运动估计好坏直接影响到变换后的效果。b.运动补偿:基本原理是假设像素沿着一个轨迹运动时,它的亮度依然保持不变。运动补偿的核心和前提是运动估计,运动估计用方向和大小两个参数描述检测到的视频流中的运动,并把检测到的运动和产生此运动的物体的具体位置一一对应,从而产生二维运动矢量场。c.主要的运动检测方法如下图:运动检测方法思想可以不写因为研究内容各小点已经写了这个自己衡量吧运动估计的思想:1基于像素的运动估计:是要每一个像素的MV,运算量非常大,进而提出了像素递归算法。在像素递归算法中,MV是递归得出的。当前像素的MV是由在此之前已经编码的邻近像素的MV值或当前像素邻场内的运动估计线性组合来表示的,依据该像素上的位移桢差(DFD的梯度最小值对预测作进一步修正。2基于块的运动估计:是把图象分割成许多小块,只要每一个块足够小则每个块内的运动变化就可以很好的用一个简单模型表征,块内的像素看作具有相同的运动矢量。相位相关法和块匹配法都可以确定块位移。3多分辨率运动估计:各种运动估计的方法可以简化为求解一个误差最小化问题。但是最小化函数遗憾有许多局部最小,不容易达到全局最小,除非它接近所选择的初试解,而且最小化过程所涉及的计算量很大。用多分=分辨率的方法一依次精细的分辨率搜索最优化问题的解。运动补偿的思想:1多假设运动补偿:不仅对预测信号进行补偿,而且同时对几个线性重叠的预测图象进行运动补偿,这样可以增加运动补偿的精确性,在编码上可以提该编码效率。如H.263和MPEG2中提到的PB模式,就是一种简单的多假设运动补偿形式,它利用了B桢前后的两桢作为参考桢进行预测,能够有效的降低编码的比特率。重叠块运动补偿也是基于多假设运动补偿的思想。2重叠块运动补偿(OBMC:是一种基于插值窗函数的方法,它通过考虑相邻块的运动矢量间的运动估计运动补偿基于像素基于块的多分辨率重叠可变块重叠块多假设相关性来进行预测插值,而插值的加权由窗口函数来决定,通过加权得到更加平滑化的运动场。3重叠可变快运动补偿:根据桢内运动内容自适应的把桢划分为较大快和较小的块,其中较大的块用于运动一致的区域,较小的块用于包含复杂运动的区域。通常实现方法是把一桢图象啊分割,并且用二叉树或四叉树结构来表示。拟解决的关键问题:a.编码端实现运动目标的分割b.解码端实现运动目标的检测c.运动目标跟踪d.基于某种检测方法实现结果e.静态背景的视频流中检测运动目标f.态背景的视频流中检测并跟踪运动目标2.拟采取的研究方法、技术路线、实验方案及可行性分析研究方法:本课题使用MATLAB工具进行编程,本文主要研究运动估计和运动补偿等运动检测方法。通过对MPEG-4编码中的运动矢量进行阈值分割,形态滤波等,实现运动物体的检测。技术路线:本文利用MATLAB软件作为实现平台,并结合C和C++编程。具体思路如下:1鉴于运动检测,涉及视频压缩和编码,对视频图象处理,即运动的图象处理,它将利用MPEG-4运动图象处理标准,对视频分成单帧。2本文提出的检测运动物体的方法就是在编码端,对提取的运动信息进行分析,滤除噪声区域,以准确分割运动物体,将目标块聚类在最小的外接矩形框内。并且将此时划分出来的运动目标块进行标记,随编码流输出。3在解码端,从码流中读取相应运动块标志信息,判断边缘块,在解码图像上叠加边框后输出显示。对运动物体的跟踪则主要通过将每帧识别出的运动图像质心相连来实现,其中重点还是单帧的运动目标检测。4运动目标的跟踪,MPEG-4将图象桢分为I,P,B三种类型。利用运动编码,对整个物体运动进行跟踪。实验方案:(1安装MATLAB软件(2分析并设计编码端的算法(3分析和设计解码端算法(4设计好后,着手程序的编写(5程序完成后使用模拟器进行调试、测试运行,并生成相应的软件包,运行,找BUG,调试。可行性分析:本研究主要使用MATLAB编程语言。基于学过C和C++程序设计,有较好编程基础,而MATLAB编程语言和C、C++较相似,因此,目前最需要做的仅是学会运用运动检测算法以及熟练掌握MATLAB编程语言,故而该研究是可行的。3.预期研究成果及成果形式认真学习并理解各种视频处理技术,如:MPEG2,MPEG4,H.263等,了解各种编码标准,如:熵编码,变换编码,预测编码等,及掌握运动检测方法进行运动检测。最主要的是按照算法过程编程实现完整的运动检测的视频处理代码。包括:架构设计、详细设计、编码