对目标识别的一些算法的学习与思考对BP人工神经网络的详细介绍对蛇模型的简要介绍对一个目标跟踪视频的思考人工神经网络人工神经网络简介:人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。人工神经网络是目标识别的重要方法神经网络有上百种,世界各地专许多专家、教授都在研究,但目前神经网络发展依然是初级阶段BP神经网络是最基本的也是应用最广泛的神经网络一个三层、三输入、一输出bp网络的例子:颜色纹理形状2131颜色2代表:肉色纹理1代表:皮肤纹理形状3代表:椭圆形输出1代表:人脸物体类别理想状态如果第一次输入3214如何使系统自动从4调节到1?4代表猴子的脸权值RumelhartHinton和Williams于1986年发表文章,提出了误差逆向传播神经网络,也称BP神经网络。BP网络思路:利用实际输出与理想输出的差值(称为误差)反馈到前面的网络,从而改变各层权值,权值改变后,使误差减小。通过不断输入同样的输入值(学习),使输出值逼近理想值。例子中误差是4-1=3利用3去改变各层权值使误差减小。假设输入一次“2、1、3”,误差减小1那么第二次输入输出为3第三次输入输出为2第四次输入输出为1达到目标,不再输入。ij共四次输入通过例子可知,BP神经网络的关键是寻找这么一个函数权值=f(误差)如果改变上述函数使得,每次输入,输出减少1.5则如图颜色纹理形状2134第一次输入颜色纹理形状2132.5第二次输入颜色纹理形状2131第三次输入共三次输入改变f(误差)之后,网络学习能力增强!如何选取函数f?网络如何后向反馈的?()j1j2j3ji1z2z3zizjajzjjiiia=zjjz=a()定义E为误差函数jjijjia=aEEjj=aEjijia=z定义:jjijia=zjzka()kykk=='()akkEEaykkjkja=aaajEEjjkjkk='a()利用以上公式,推导出重要公式:输出y改变最外层E,最外层E改变最外层是前向传播时已经得到的ja最外层改变次一层,以此类推,网络中的全部被改变与如何建立联系?梯度下降法思路:沿误差E下降最快的方向将权向量移动一个很小的距离。重复这一过程,将产生一系列权重向量()+1kjkjkj=-E()()为学习速率参数直接引用梯度下降法的结论:jiji=-z公式意义:权值改变量为时,E减小的最快ji通过前向传播确定每层的和误差EjaE改变各层各层改变各层使E减小学习完成学习完成后的神经网络能做什么?神经网络在目标识别中做分类器颜色纹理形状2131假如神经网络学习100次后第101次输入:是人脸45650不是简介参数活动轮廓模型参数活动轮廓模型又称为蛇模型,最初由Kass等于1987年提出。经典的蛇模型是在内力、图像力和外部约束力共同作用下移动的变形轮廓线C(s)=(x(s),y(s)),其中s[0,1]为曲线参数,它通过最小化如下能量函数来达到锁定图像特征的目的:1int0(s=[(())(())(())]imgconECECsECsECsds())1int0(s=[(())(())(())]imgconECECsECsECsds())调节内力参数图像力参数外部约束力参数intE为内部能量项,用于控制曲线的弹性和刚度,由下式定义:222int122(())||||CCECsssimgE为与图像有关的外部能量项,将蛇吸引到图像特征附近。用于定义目标边缘的典型外部能量项一般定义为:2(())|(())|imgECsICsconE为用户定义的能量项,与具体应用有关利用蛇模型进行计算的步骤如下:(1)根据具体的应用,定义适当的能量函数,并设置适合的初始曲线;(2)利用变分方法,得到能量函数的欧拉方程;(3)迭代求解欧拉方程,直到得到最小能量函数为止,此时得到的曲线即为最终求解结果。近十年来,蛇模型已经被众多研究者成功地应用于计算机视觉的许多领域,如边缘提取、图像分割与分类、运动跟踪、3D重建、立体视觉匹配等。但国内对其研究比较少。优点:(1)图像数据、初始估计、目标轮廓以及基于知识的约束统一于一个特征提取过程中;(2)经适当初始化后,它能自主地收敛于能量极小值状态。(3)尺度空间中由粗到精的极小化能量可以极大地扩展捕获区域和降低计算复杂性。缺陷:(1)对初始位置敏感,需要依赖其他机制将蛇放置到感兴趣的图像特征附近;(2)由于蛇模型的非凸性,它有可能收敛到局部极值点,甚至发散。(3)无法收敛到轮廓的深度凹陷部分。(4)不具备自动拓扑变换能力。对蛇模型的改进:Balloon模型GVF蛇模型基于动态规划的蛇模型具有拓扑变化的蛇模型这些模型都是对基本蛇模型某一方面缺陷作出的一些改进,仍未从根本上解决蛇模型存在的困难对一段目标跟踪视频算法的思考对鼠标圈定的任何物体的跟踪是如何实现的?我感觉是不是可以充分利用视频的连续性去实现视频和图片的最大不同是一个是连续的,一个是静止的。即视频一秒有许多帧,这一帧和下一帧的变化会非常小,可以利用被鼠标圈定的部分作为模板去匹配下一帧图像,然后把下一帧识别出来的图像作为新的模板去匹配再下一帧的图像。不断进行远近、旋转变化的过程可能是让系统不断学习新的图像的过程。圈定的目标消失后,再次出现如何识别?学习的方法:可能是神经网络将所有模板存储提取相应特征,然后不断的学习;也可能是直接利用所有的模板全图扫描(可能性不大)。使得当目标再次出现能够识别跟踪。视频让我很好奇,所以看完视频后产生了一点小想法,希望老师同学多多批评指正。