第十二章目标检测与识别Lecture12ObjectDetectionandRecognition目标检测和识别怎样检测和识别图像中物体,如汽车、牛等?目标识别的应用难点之一:如何鲁棒识别?类内差异(intra-classvariability)类间相似性(inter-classsimilarity)难点之二:计算量大一幅图像中像素个数多,目前每秒约产生300G像素的图像/视频数据。-Google图片搜索中已有几十亿幅图像-全球数字照相机一年产生180亿张以上的图片(2004年)-全球一年销售约3亿部照相手机(2005)人的物体识别能力是强大的-灵长类动物约使用大脑皮层的一半来处理视觉信息[FellemanandvanEssen1991]-可以识别3,000-30,000种物体-物体姿态可允许30度以上的自由度。难点之三:如何在小样本条件下学习物体识别方法检测(detection)vs.不检测表示(representation)-颜色、纹理、边缘、梯度、局部特征、深度、运动等等。分类(classificationorcategorization)-K近邻(KNN)-神经网络(NN)-支持向量机(SVM)-Boosting(Adaboost等)-隐马尔科夫模型(HMM)-其他生成学习(Generativelearning)vs.判别学习(discriminativelearning)生成学习vs.判别学习两种分类器学习模式生成学习---目标是学习到符合训练数据的类别模型---如EM算法(MaximumLikelihood)判别学习在训练阶段即考虑类别之间的判别信息包括SupportVectorMachines(SVMs),Boosting,MinimumClassificationError(MCE),MaximumMutualInformation(MMI),LagerMargin(LM),andetc.判别学习算法比生成学习算法表现出更好的分类性能。判别学习方法第二节人脸检测与识别131.物体检测Car/non-carClassifierYes,car.No,notacar.基于二分类器14物体检测Car/non-carClassifier在复杂背景下,通过滑动窗口(slidingwindows)搜索感兴趣的物体。物体检测Step1.获取训练数据Step2.提取特征Step3.训练分类器Step4.利用分类器进行检测人脸检测(Facedetection)Viola-Jones人脸检测算法(基于AdaBoost)Viola-Jones人脸检测算法(2004)滤波器设计AdaboostAdaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特徵,并将关键放在关键的训练数据上面。BoostingExampleBoostingExampleBoostingExampleBoostingExampleBoostingExampleBoostingExampleAdaboost学习目标:选择能够最有效地区分人脸与非人脸的矩形特征及其阈值Adaboost组合弱分类器(weaklearners),得到更为精确的集成分类器(ensembleclassifier)。弱分类器:性能仅比随机分类稍好根据矩形特征定义弱分类器:Adaboost算法步骤初始给每个训练样本以同等权重循环执行以下步骤:根据当前加权训练集,选择最佳弱分类器提升被当前弱分类器错分的训练样本的权重按照各弱分类器分类精度对其加权,然后将各个弱分类器形成线性组合,得到最终分类器。Viola-Jones算法中的AdaBoost每一次boosting迭代如下:评价每一个样本上的每一种矩形特征为每一种矩形特征选择最佳分类阈值选择最优的矩形特征及其阈值组合改变样本权重计算复杂度:O(MNT)M:特征数,N:样本数,T:阈值数级联分类器(CascadingClassifiers)训练级联分类器Viola-Jones检测算法-总体流程用5K正样本,350M反样本学习得到38层(共使用6060个特征)级联分类获得实时性Viola-Jones人脸检测结果Viola-Jones人脸检测结果Viola-Jones人脸检测结果2.人脸识别(facerecogntion)Zhaoetal.,FaceRecogniton:aliteraturesurvey.ACMComputingsurvey,2003FaceRecognition:2-Dand3-D图像=像素的集合将由n个像素构成的图像视为n维空间中的点最近邻分类器Eigenfaces使用主成分分析技术(PrincipleComponentAnalysis,PCA)减少维数主成分分析(PCA,K-L变换)降低特征向量的维数获得最主要特征分量,减少相关性;避免维数灾难主成分分析(PCA,K-L变换)主成分分析(PCA,K-L变换)Eigenfaces学习1.计算训练图像的均值和协方差矩阵.2.计算协方差矩阵的特征值,取前k个最大特征值对应的特征矢量.3.将图像投影到k-维特征空间(Eigenspace)。识别1.将测试图像投影到Eigenspace.2.在特征图像上执行分类.Eigenfaces:训练图像EigenfacesPCA方法的不足可能损失重要的细节信息方差最小的方向也可能是重要的没有考虑判别任务希望得到最具判别能力的特征但判别能力最佳并不等同于方差最大Fisherfaces:类特定的线性投影PCA&Fisher的线性判别函数PCA&Fisher的线性判别函数Fisherfaces示例(ORLDatabase)基于eigenfaces/fisherfaces的识别训练:-根据训练图像,利用PCA或Fisher方法确定投影矩阵-将每个训练图像投影到子空间(eigenspace或fisherspace)。识别:-将测试图像投影到eigenspace或fisherspace。-子空间中距离测试图像最近的训练图像对应的类别为识别结果。Project5:人脸合成平均人脸平均就是美Project5:人脸合成Project5:人脸合成Project5:人脸合成Project5:人脸合成Project5:人脸合成FantaMorph,人脸合成软件Project5:人脸合成FantaMorph,人脸合成软件手动标定人脸Project5:人脸合成FantaMorph,人脸合成软件手动标定人脸Project5:人脸合成FantaMorph,人脸合成软件产生多张合成图像,随机或者平均输出Project5:人脸合成Task:利用人脸检测算法,将上述过程改为自动完成,实现自动人类合成。第三节深度学习导引第三节深度学习导引第三节深度学习导引第三节深度学习导引第三节深度学习导引第三节深度学习导引第三节深度学习导引第三节深度学习导引神经网络的基本结构神经网络的大量参数神经网络的表现能力神经网络的表现能力神经网络的表现能力神经网络的表现能力卷积神经网络卷积神经网络卷积神经网络卷积神经网络卷积神经网络卷积神经网络卷积层的作用卷积神经网络卷积神经网络卷积神经网络池化层的作用卷积神经网络卷积神经网络激活函数卷积神经网络卷积神经网络卷积神经网络卷积神经网络Softmax层的作用卷积神经网络卷积神经网络网络的预处理卷积神经网络的实例Alexnet卷积神经网络的实例Alexnet卷积神经网络的实例FCN网络卷积神经网络的实例FCN网络卷积神经网络的实例FCN网络卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法卷积神经网络的训练方法递归神经网络RecurrentNeuralNetworks递归神经网络LSTM