A3

Maoandwei
2 ℃
2020-02-14

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

0人脸朝向识别人脸朝向识别1摘要本文针对人脸应用研究中的人脸朝向识别问题，建立多种数学模型，以期更准确地判定图像中的人脸朝向。模型一：首先对图像进行预处理，将图像划分为的网格。采用图像的直观特征，图像的统计特征和代数特征相结合的方法，利用SOBEL算子进行图像边缘检测，计算每一网格的边缘点数，提取图片信息特征。进而将提取的数字特征作为样本指标值，综合模糊数学知识利用个体模糊模式识别方法来判别人脸朝向，其识别结果人如表0-1所示。模型二：基于模型一的思想将图片现分为的网格，然后利用主成分分析法做图片特征提取，将提取的八个主成分（其信息保留率为92.11%）带入到模型一中，综合模糊数学知识利用个体模糊模式识别方法来判别人脸朝向，识别准确率较模型一明显提高，结果如表0-1所示。模型三：最后我们采用智能优化算法—神经网络算法，将模型二中的八个主成分作为神经网络输入层分别采用BP神经网络和LVQ神经网络做人脸朝向识别，其结果准确率如表0-1所示。表0-1三种模型的结果对比样本数10152025303540检验数40353025201510模型一准确率65%65.71%100%100%100%100%100%模型二准确率82.50%88.57%90%100%100%100%100%BP平均准确率\\72%\85%\94%LVQ平均准确率\\89%\93%\100%最后综合评价分析三个模型，并改进模型。关键字：图像特征提取主成分分析方法个体模糊模式识别BP神经网LVQ神经网络人脸朝向识别2一、问题重述人脸朝向识别是人脸应用研究中重要的一步，在众多研究领域中，人脸朝向识别是一个无法回避的问题。对于给出的人脸朝向不同角度时的图像数据，图像中人脸是朝向左方、左前方、前方、右前方和右方，建立人脸朝向识别模型，对人脸的朝向进行识别。二、问题分析2.1图像特征的提取在人脸朝向分类和识别过程中，首先根据被研究的对象产生出一组基本特征，好的特征会使分类器的设计变得简单，从而使分类器运行得更快和更加可靠。人们时常会陷入的一个误区就是认为获取的特征越多，分类效果就会越好，而Watanabe的丑小鸭定理(uglyducklingtheorem)说明了特征形成的过程需慎重，因为通过编入充分多的冗余特征，我们可以使得任意两个模式相似。因此，我们希望选择或提取的特征应具有以下特点:(1)简约性:在用很少的特征标识目标的条件下，保持信息(或信息丢失可以控制)；(2)可分性:来自同一类的不同模式的特征非常接近，而不同类的模式的特征相距甚远；(3)可靠性:提取具有鲁棒性的特征，即对噪声或其它干扰不敏感。pxxx,,,f211x2x1pxpx1f2f图2-1特征提取示意图目标图像的识别特征一般分为四类：视觉特征、统计特征、变换系数特征和代数特征。由于单一特征表达的不全面性，我们将采用多种特征结合的方法。2.2图像模式识别模式识别分为两个阶段：学习和识别阶段。前者是对样本进行特征选择，寻找分类的规律，后者是根据分类规律对未知样本集进行分类和识别。3图2-2模式识别框架图用于解决图像识别的方法概括起来可分为统计模式识别、结构模式识别、模糊图像识别和智能模式识别(主要是人工神经网络模式识别)4类。我们可以采用多种识别方式，将结果对比分析，寻找最优的方法。三、模型假设1）本文所建模型在所给图像均为灰度图像基础上；2）假设题目中所给图像均为正面拍摄；3）假设题目所给照片都是在同等光强下拍摄；4）假设题目中所给图像只有五种朝向，即朝向左方、左前方、前方、右前方和右方；5）假设图像中各种人脸朝向的位置服从正态分布四、符号说明1）U全集2)、模糊子集3）（X）的从属函数4）（X）的从属函数5）(X)的均值6）(X)的均值7）(X)的方差8）(X)的方差9）P(,)(X)与(X)曲线交点10）观察个体的变量指标411）原变量指标的第m主成分12）样本均数13）样本标准差14）对应特征值15）R对应特征向量16）第i朝向的第j项指标的中间型正态模糊子集17）待识别人面朝向B的第j项指标的模糊子集18）(X)的从属函数19）(X)的从属函数五、模型建立5.1个体模糊模式识别模型5.1.1图像特征提取与选择本模型我们采用图像的直观特征，图像的统计特征和代数特征相结合的方法：图像的直观特征为了降低图像信息的维数，我们选择了具有代表性的部位—眼睛。原因如下：（1）人脸不同朝向时，眼睛部分的位置始终在同一高度上（如图5-1所示），这是最重要的一个原因；（2）人面部眼睛部位图像像素灰度值变化差异较为明显，它直接决定了图像特征提取的好坏；（3）人面不同朝向时，眼睛部分的位置变化比较明显；5图5-1图像特征提取眼睛部位代数特征：为了能够定量地提取图像特征，首先，我们利用SOBEL算子进行图像边缘检测，用阈值算法检测和连接边缘，将图像中像素灰度值相差比较大的边缘检测出来，像素灰度值相差比较大的记为1，像素灰度值相差比较小的记为0。然后，将图像划分为的网格，将网格中边缘差异作为图像的识别指标，同时又使各网格检测到的边缘差异最大，即各项指标值最大，以有利于模糊识别，提高识别准确率。经过多次尝试，最终我们选择了清晰度较好，指标值差异较大的的网格，如图5-2所示：图5-2的网格中提取的眼睛部位图像的统计特征:在利用模糊分析法时，我们用前30张图片作为样本集，统计各类人脸朝向图片八个指标的均值和方差值。5.1.2个体模糊模式识别为了判断两个概率分布的“接近”程度，我们定义二个模糊子集之间的两种运算和贴近度：定义内积与外积：设全集为U。和为U上的两个模糊子集，它们的从属函数分别为（X）和（X）。定义和的内积为=其中∨表示取最大，∧表示取最小。定义和的外积为×=若(X),(X)是正态型从属连续函数：6(X)=(X)=其中分别表示(X),(X)分布的均值和方差我们可用图形求其内积和外积，不妨设0,(X)和(X)的图形如图5-3所示：图5-3(X)和(X)的图形设两条曲线的交点为P(,)(图中的蓝圆点)，容易求出=,==显然图中P点以下的部分曲线是(X)∧(X)的图形，以上部分曲线是(X)∨(X)的图形。则(X)∧(X)的最大值就是P点的纵坐标，即=因为当x时，交点以上部分曲线的极限等于零，所以×定义贴近度：7下面定义和两个模糊子集之间的贴近度为（,）=[×]对于正态型模糊子集，因为×=0，所以（,）=[+1]假设已知m个人脸朝向,,…,,每种人脸朝向有n项指标，记第i种的第j项指标为模糊子集。一个待识别人脸朝向B的n项指标为模糊子集,,…,，则可用下面的择近原则对B进行识别。择近原则令=,)(i=1,2,…,m)若存在k{1,2,…,m},使=,则将B识别为朝向。5.2主元分析模型在进行主成分分析前，我们对图像重新进行处理：由于进行主成分分析时指标数应该小于样本数，所以我们将图像分为的网格，然后构成个指标，进行主成分提取。主成分分析：（1）设观察个体的变量指标为x1，x2，…，xp，它们的综合指标——主成分为z1，z2，…，zm（m≤p），则111112211122ppmmmmppzlxlxlxzlxlxlxz1，z2，…，zm分别称为原变量指标x1，x2，…，xp的第一，第二，…，第m主成分。（2）收集原始数据，得50个样本的36个指标值表见附表1所示：设有随机变量x1，x2，…，xp，其样本均数记为1x，2x，…，px，样本标准差记为S1，S2，…，Sp。首先作标准化变换SXXx由于本题中数据的量纲和属性完全相同，因此采用原始数据误差值会同比例8增大，误差控制效果会更好，模型识别准确率更高。（3）计算相关系数矩阵，对应的特征值1p(按从大到小排列)及其对应的特征向量R=111212122212............pppppprrrrrrrrr其中12211()()()()mijkikjkijmmijkjkjkkxxxxrxxxx（4）第i个主成分的贡献率是1×100ipjjλλ（5）前m个主成分的累计贡献率是：11×100miipjjλλ其结果如表？所示。5.3人工神经网络模型为了模拟生物神经元，一个简化的人工神经元如图5-4所示。该神经元是一个多输入单输出的非线性元件，其输入输出关系可描述为:9......22w11wmkw连接权1x2xmx阀值kb求和激活函数输出kykuf图5-4人工神经元模型5.3.1BP神经网络初始化给定输入的向量和目标函数求隐含层、输出层各单元输出求目标值和实际输出偏差EE满足要求全部Ei满足EndYY计算隐含层单元误差NN计算梯度误差权值学习图5-5BP算法的流程图输入和目标向量设计神经网络输入的确定实际上就是特征量的提取。该BP网络的输入为图像，输入单元可取为模型二所求得的8维指标值。将每张图像转换成8个排列的指标值，在输入神经网络之前应该首先进行归一化处理。这样一来，网络的输入就是一个8维的向量。接下来确定网络的输出模式，由于人脸图像包括5种朝向，因此可以采用如下的形式来表示输出:左方:(1);左前方:(2);前方:(3);右前方:(4);右方:(5)。10BP网络设计对于BP网络，存在一个重要的结论，即单隐层的BP网络可以逼近任意的非线性映射，前提是隐含层的神经元个数可以随意调整，也即对于一般的模式识别问题，3层网络可以很好地解决。这里采用单隐层的神经网络，而中间层的神经元个数需要通过实验来确定。经过多次实验确定中间层神经元输为12，网络准确率比较高，由此，可按照如下的方式设计网络:网络的输入层神经元个数为8个，输出层神经元个数为1个，隐含层的神经元个数为12个。隐含层的神经元的传递函数采用S型正切函数tansig，输出层神经元传递函数采用纯线性函数purelin，以提高网络容错能力，其余参数取默认值。5.3.2LVQ神经网络模型LVQ神经网络有输入层，隐含层和输出层三层组成，输入层与隐含层间为完全连接，每个输出层神经元与隐含层神经元的不同组相连接。隐含层和输出层神经元之间的连接权值固定为1.在网络训练过程中，输入层和隐含层神经元间的权值被修改。当某个输入模式被送至网络时，最接近输入模式的隐含神经元因获得激发而赢得竞争，因而允许它产生一个“1”，而其他隐含层神经元都被迫产生“0”。与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”，而其他输出神经元均发出“0”。学习向量量化网络主要用于解决分类问题。该网络由两层神经元组成，网络的第一层为竞争；第二层中的每个神经元只与竞争层中的部分神经元相连，网络中的每个神经元都没有阈值。网络第一层神经元的传递函数为compet，加权函数为negdist，权值初始化函数为midpoint；网络第二层神经元的传递函数为purelin，加权函数为dotprod，权值都为1.网络使用trains和trainr函数进行自适应调整和训练，这两个函数使用指定的学习函数对竞争层神经元的权值进行修正。六、模型求解6.1模型一求解6.1.1构造隶属函数：为了确定朝向B是5个已知朝向,,…,中的哪一种。先构造第i朝向的第j项指标的中间型正态模糊子集的隶属函数：(X)=待识别人面朝向B的第j项指标的模糊子集的属函数(X)=11经matlab编程计算，我们发现模糊子集与（i=1,2,…,5j=1,2,3,…,8）的贴近度相差甚小,为了提高结果区分度,对隶属函数重新进行改进，我们采用隶属函数：(X)=(X)=这样可以削弱的指数作用，进而拉大贴近度差异，结果如表？所示。6.1.2模型求解从50张图片中随机地抽出一定数量图片作为样本集，其余图片作为检验集。不失一般性地，我们用前30张图片作为样本集，后20张图片作为检验集为例求解模型：（1）计算各种不同面部朝向情况下八项指标的平均值，方差值如表6-1所示：表6-1前30个样本的标准差和期望左方μ116.1667111.0000122.8333281.166754.16670.50002