基于MATLAB的人体姿态的检测课程设计

霸王神龙
6 ℃
2020-06-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

山东建筑大学信电学院课程设计说明书1基于视频的人体姿态检测一、设计目的和要求1.根据已知要求分析视频监控中行人站立和躺卧姿态检测的处理流程，确定视频监中行人的检测设计的方法，画出流程图，编写实现程序，并进行调试，录制实验视频，验证检测方法的有效性，完成系统软件设计。2.基本教学要求：每人一台计算机，计算安装matlab、visio等软件。二、设计原理2.1图像分割中运动的运用（运动目标检测）首先利用统计的方法得到背景模型，并实时地对背景模型进行更新以适应光线变化和场景本身的变化，用形态学方法和检测连通域面积进行后处理，消除噪声和背景扰动带来的影响，在HSV色度空间下检测阴影，得到准确的运动目标。噪声的影响，会使检测结果中出现一些本身背景的区域像素点被检测成运动区域，也可能是运动目标内的部分区域被漏检。另外，背景的扰动，如树枝、树叶的轻微摇动，会使这部分也被误判断为运动目标，为了消除这些影响，首先对上一步的检测结果用形态学的方法进行处理，在找出经过形态学处理的后的连通域，计算每个连通域中的面积，对于面积小于一定值的区域，将其抛弃，不看做是前景运动目标。2.2bwlabel函数用法：L=bwlabel(BW,n)[L,num]=bwlabel(BW,n)，这里num返回的就是BW中连通区域的个数。返回一个和BW大小相同的L矩阵，包含了标记了BW中每个连通区域的类别标签，这些标签的值为1、2、num（连通区域的个数）。n的值为4或8，表示是按4连通寻找区域，还是8连通寻找，默认为8。四连通或八连通是图像处理里的基本感念：8连通，是说一个像素，如果和其他像素在上、下、左、右、左上角、左下角、右上角或右下角连接着，则认为他们是联通的；4连通是指，如果像素的位置在其他像素相邻的上、下、左或右，则认为他们是连接着的，连通的，在左上角、左下角、右上角或右下角连接，则不认为他们连通。2.3regionprops统计被标记的区域的面积分布，显示区域总数山东建筑大学信电学院课程设计说明书2函数regionprops语法规则为：STATS=regionprops(L,properties)该函数用来测量标注矩阵L中每一个标注区域的一系列属性。L中不同的正整数元素对应不同的区域，例如：L中等于整数1的元素对应区域1；L中等于整数2的元素对应区域2；以此类推。返回值STATS是一个长度为max(L(:))的结构数组，结构数组的相应域定义了每一个区域相应属性下的度量。Properties可以是由逗号分割的字符串列表、包含字符串的单元数组、单个字符串'all'或者'basic'。如果properties等于字符串'all'，则表4.1中的度量数据都将被计算；如果properties等于字符串'basic'，则属性：'Area'，'Centroid'和'BoundingBox'将被计算。'Area'——图像各个区域中像素总个数'BoundingBox'——包含相应区域的最小矩形'Orientation'与区域具有相同标准二阶中心矩的椭圆的长轴与x轴的交角（度）三、设计内容3.1理论依据3.1.1应用背景与意义随着监控系统到位，以帮助人们甚至完成监控任务。可以减少人力和财力的投入，由于就业监视人员进行。另外，如果长时间不运动图像信息记录，保存几下，就失去了意义和视频监控系统的存储资源浪费存储空间。因此，传统的监视系统浪费了大量的人力，并有可能引起报警，性能差的实时监控的泄漏。监控等实时行为分析系统来识别人体，不仅可以替代监控人员的工作的一部分，提高监测系统的自动化水平，同时也提高监视存储的效率，还有一个广泛的应用，并在视频监视系统的潜在经济价值之前。由于人的行为具有自由的伟大程度，因为身体宽松长裙不同程度和它的外貌和从图像捕获设备位置不同距离的表现风格将是一个很大的分歧，这是人的行为分析，找出了一定的难度。但是，人类行为的实时分析，智能监控系统，以确定关键技术及其广阔的前景药，安全性，虚拟现实，军事和潜在的经济价值，国内外研究机构和学者越来越多的关注，并在许多全球领先的刊物和会议专题讨论。美国和欧洲都进行了一些相关的研究项目。3.1.2运动分割算法首先利用统计的方法得到背景模型，并实时地对背景模型进行更新以适应光线变化和场景本身的变化，用形态学方法和检测连通域面积进行后处理，消除噪声和背景扰动山东建筑大学信电学院课程设计说明书3带来的影响，在HSV色度空间下检测阴影，得到准确的运动目标。本次采用了基于累积差分和数学形态学处理的运动区域提取算法。在时域窗口内，首先对图象进行降级处理得到灰度带图象，对灰度带差分图象累积并进行数学形态学处理得到运动目标的轨迹模版，将轨迹模版与当前帧差分图象与运算得到当前帧运动目标象素，最后进行多级数学形态学处理得到当前帧运动区域。实验结果表明，该算法不仅能够对静止背景序列运动区域有较好的分割结果，而且在没有进行全局运动补偿的情况下，对部分运动背景序列也能成功的提取出运动区域。3.1.3研究人体姿态的特征描述'BoundingBox'——包含相应区域的最小矩形'Orientation'与区域具有相同标准二阶中心矩的椭圆的长轴与x轴的交角（度）3.2方案设计根据设计要求确定视频监控中行人分割和人体姿态识别的方法，选择确定运动目标检测、行人人体姿态特征信息提取实现方法。画出流程图见附录2并对各部分功能进行说明。（1）判断是否为人体在目标提取之前，首先要对输入的图片进行检测。本文通过连通域的面积来检测判断目标是否为人体。（2）人体目标提取如果是人体导入背景图片与背景图片做差，再通过背景差阈值分割法进行提取。（4）行为识别在解决了以上的问题之后，接下来就是要选择一种合适的算法来进行人体姿态识别，这也是本文研究的重点和难点。本文采用人体目标的连通区域的长宽比例和方向角的方法来对人体行为进行识别。3.3程序设计根据设计要求确定视频中行人检测和人体姿态特征信息提取方法，进行程序设计，编写实现程序，使用matlab等软件。3.3.1图像分割中运动的运用（运动目标检测）运动目标检测首先利用统计的方法得到背景模型，并实时地对背景模型进行更新以适应光线变化和场景本身的变化，用形态学方法和检测连通域面积进行后处理，消除噪山东建筑大学信电学院课程设计说明书4声和背景扰动带来的影响，在HSV色度空间下检测阴影，得到准确的运动目标。该段程序读取了视频从100帧到400帧的图像。先对导入视频采用近似中值滤波背景模型参考图像实现运动目标分割，然后创建边长为3的方形结构元素，用于对分割结果形态学滤波。原视频、近似中值滤波后的视频以及采用形态学滤波后的视频如图3.3.1—1所示图3.3.1—1原视频、近似中值滤波后的视频以及采用形态学滤波后的结果videoObj=VideoReader('gyz.avi');本程序使用了VideoReader函数，该函数用于读取视频文件对象。函数调用格式：obj=VideoReader(filename)obj=VideoReader(filename,Name,Value)其中obj为结构体，包括如下成员：Name-视频文件名Path-视频文件路径Duration-视频的总时长（秒）FrameRate-视频帧速（帧/秒）NumberOfFrames-视频的总帧数Height-视频帧的高度Width-视频帧的宽度se=strel('square',3);本程序通过创建方形结构元素，用于对分割结果形态学滤波。pixInc=find(Idiff0);fmed(pixInc)=fmed(pixInc)+beta;pixDec=find(Idiff0);fmed(pixDec)=fmed(pixDec)-beta;山东建筑大学信电学院课程设计说明书5背景差分法别名背景减法，背景差分法的原理是将当前的图像与背景图像进行差分来得到目标区域，这种方法能很好的识别和提取运动目标，是目前运动分割中最常用的一种方法。但是需要构建一幅背景图像，这幅背景图像必须不含要检测的目标或其他不需要检测目标，并且应该能不断的更新来分辨当前背景的变化。运用阈值法原理进行分割，阈值法是比较简单的图像分割方法，是一种常常运用的并行区域的技术。阈值是用运在区分目标图片和背景图片的灰度门限。如果要检测的图像只有目标和背景两类，那么只需要选取一个阈值这种方法称为单阈值分割，这种方法是将图像中每个像素中的灰度值与阈值相对比，灰度值大于阈值的算一种，灰度值小于阈值的为另一种。如果图像中存在多个检测目标或无关目标，那么就选多个阈值将每个目标及背景区分开，这种方法称为多阈值分割阈值，由于本人只有一个目标则采用单阈值分割。fg2=imopen(fg,se);fg2=imclose(fg2,se);对分割结果进行形态学滤波先进行了开操作，再进行闭操作。开操作是一般使对象的轮廓变得光滑，断开狭窄的间断和消除细的突出物。闭操作可使轮廓线更光滑，但与开操作相反的是，闭操作通常消弥狭窄的间断和长细的鸿沟，消除小的空洞，并填补轮廓线中的断裂。3.3.2用bwlabel函数对连通域进行标号，并得到最大连通域[L,num]=bwlabel(fg2,4);%对连通域进行标记，num=6Bwlabel函数的用法：L=bwlabel(BW,n)[L,num]=bwlabel(BW,n)，这里num返回的就是BW中连通区域的个数。返回一个和BW大小相同的L矩阵，包含了标记了BW中每个连通区域的类别标签，这些标签的值为1、2、num（连通区域的个数）。n的值为4或8，表示是按4连通寻找区域，还是8连通寻找，默认为8。本程序使用的是4连通。四连通或八连通是图像处理里的基本感念：8连通，是说一个像素，如果和其他像素在上、下、左、右、左上角、左下角、右上角或右下角连接着，则认为他们是联通的；4连通是指，如果像素的位置在其他像素相邻的上、下、左或右，则认为他们是连接着的，连通的，在左上角、左下角、右上角或右下角连接，则不认为他们连通。all=[img_reg.Area];%求出6个连通域的像素个数[d,ind]=max(all);%得到面积最大的连通域山东建筑大学信电学院课程设计说明书6本段bwlabel函数是对连通域进行标号，标完号后利用“Area”属性的参数找到面积最大的连通域，这个连通域即为视频中的人。3.3.3根据regionprops函数的boundingbox和orientation的阈值分别检测视频中人体的站姿和躺卧两种姿势or=[img_reg.Orientation];函数regionprops语法规则为：STATS=regionprops(L,properties)该函数用来测量标注矩阵L中每一个标注区域的一系列属性。L中不同的正整数元素对应不同的区域，例如：L中等于整数1的元素对应区域1；L中等于整数2的元素对应区域2；以此类推。返回值STATS是一个长度为max(L(:))的结构数组，结构数组的相应域定义了每一个区域相应属性下的度量。Properties可以是由逗号分割的字符串列表、包含字符串的单元数组、单个字符串'all'或者'basic'。如果properties等于字符串'all'，则表4.1中的度量数据都将被计算；如果properties等于字符串'basic'，则属性：'Area'，'Centroid'和'BoundingBox'将被计算。bo=cat(1,img_reg.BoundingBox);cat：用来联结数组用法：C=cat(dim,A,B)按dim来联结A和B两个数组。C=cat(dim,A1,A2,A3,...)按dim联结所有输入的数组。Boundingbox用来表示包含相应区域的最小矩形，它有四个参数分别为[x,y,width,height]。根据regionprops函数的boundingbox和orientation的参数，我们可以获得每一帧的图像的长宽比和方向角的参数。然后跟据这些数据来判断人体站立和躺卧来设置长宽比和方向角的范围，通过多次比对与测试