卡尔曼滤波(KalmanFilter)与粒子滤波(PF:ParticleFilter)•卡尔曼全名RudolfEmilKalman,匈牙利数学家,1930年出生于匈牙利首都布达佩斯。1953,1954年于麻省理工学院分别获得电机工程学士及硕士学位。1957年于哥伦比亚大学获得博士学位。我们现在要学习的卡尔曼滤波器,正是源于他的博士论文和1960年发表的论文《ANewApproachtoLinearFilteringandPredictionProblems》(线性滤波与预测问题的新方法)。卡尔曼滤波(KalmanFilter)whatiskalmanfilter?•卡尔曼滤波的一个典型实例是从一组有限的,包含噪声的,对物体位置的观察序列(可能有偏差)预测出物体的位置的坐标及速度。在很多工程应用(如雷达、计算机视觉)中都可以找到它的身影。同时,卡尔曼滤波也是控制理论以及控制系统工程中的一个重要课题。•例如,对于雷达来说,人们感兴趣的是其能够跟踪目标。但目标的位置、速度、加速度的测量值往往在任何时候都有噪声。卡尔曼滤波利用目标的动态信息,设法去掉噪声的影响,得到一个关于目标位置的好的估计。这个估计可以是对当前目标位置的估计(滤波),也可以是对于将来位置的估计(预测),也可以是对过去位置的估计(插值或平滑)。•对于解决很大部分的问题,他是最优,效率最高甚至是最有用的。他的广泛应用已经超过30年,包括机器人导航控制,传感器数据融合甚至在军事方面的雷达系统以及导弹追踪等等。近年来更被应用于计算机图像处理,例如人脸识别,图像分割,图像边缘检测等等。•现代汽车中的悬架分为从动悬架和主动悬架两种。从动悬架即传统式的悬架,是由弹簧、减震器、导向机构等组成,它的功能是减弱路面传给车身的冲击力,衰减由冲击力而引起的承载系统的震动。其中弹簧主要起减缓冲击力的作用,减震器的作用是衰减震动。从动悬架是由外力驱动而起作用的。主动悬架是近十几年发展起来的由电脑控制的一种新型悬架。主动悬架的控制环节中安装了能够产生主动力的装置,采用一种以力抑制力的方式来抑制路面对车身的冲击力及车身的倾斜力。汽车的液压主动悬架系统在控制过程中不可避免的受到噪声的影响。应用卡尔曼滤波对系统的状态向量做最优估计,并应用到系统的全状态反馈控制中,可以有效的提高系统的鲁棒性卡尔曼滤波器应用举例•我们先要引入一个离散控制过程的系统。该系统可用一个线性随机微分方程(LinearStochasticDifferenceequation)来描述:X(k)=AX(k-1)+BU(k)+W(k)再加上系统的测量值:Z(k)=HX(k)+V(k)上两式子中,X(k)是k时刻的系统状态,U(k)是k时刻对系统的控制量。A和B是系统参数,对于多模型系统,他们为矩阵。Z(k)是k时刻的测量值,H是测量系统的参数,对于多测量系统,H为矩阵。W(k)和V(k)分别表示过程和测量的噪声。他们被假设成高斯白噪声(WhiteGaussianNoise)(跟时间是没有关系的而且符合高斯分布(GaussianDistribution))。他们的covariance分别是Q(过程),R(测量)(这里我们假设他们不随系统状态变化而变化)。对于满足上面的条件(线性随机微分系统,过程和测量都是高斯白噪声),卡尔曼滤波器是最优的信息处理器。1.首先我们要利用系统的过程模型,来预测下一状态的系统。假设现在的系统状态是k,根据系统的模型,可以基于系统的上一状态而预测出现在状态:X(k|k-1)=AX(k-1|k-1)+BU(k)…(1)(预测结果)式(1)中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果,U(k)为现在状态的控制量,如果没有控制量,它可以为0。2.到现在为止,我们的系统结果已经更新了,可是,对应于X(k|k-1)的covariance还没更新。我们用P表示covariance:P(k|k-1)=AP(k-1|k-1)A’+Q………(2)(预测系数)式(2)中,P(k|k-1)是X(k|k-1)对应的covariance,P(k-1|k-1)是X(k-1|k-1)对应的covariance,A’表示A的转置矩阵,Q是系统过程的covariance。式子1,2就是卡尔曼滤波器5个公式当中的前两个,也就是对系统的预测。3.现在我们有了现在状态的预测结果,然后我们再收集现在状态的测量值。结合预测值和测量值,我们可以得到现在状态(k)的最优化估算值X(k|k):X(k|k)=X(k|k-1)+Kg(k)(Z(k)-HX(k|k-1))………(3)(预测与测量组合结果)=(1-Kg(k)H)*X(k|k-1)+Kg(k)*Z(k)4.其中Kg为卡尔曼增益(KalmanGain):Kg(k)=P(k|k-1)H’/(HP(k|k-1)H’+R)………(4)(增益系数)5.到现在为止,我们已经得到了k状态下最优的估算值X(k|k)。但是为了要另卡尔曼滤波器不断的运行下去直到系统过程结束,我们还要更新k状态下X(k|k)的covariance:P(k|k)=(I-Kg(k)H)*P(k|k-1)„„„(5)„„(更新预测系数)其中I为1的矩阵,对于单模型单测量,I=1。当系统进入k+1状态时,P(k|k)就是式子(2)的P(k-1|k-1)。这样,算法就可以自回归的运算下去。卡尔曼滤波器的介绍•例子理解这5条公式。•假设我们要研究的对象是一个房间的温度。根据你的经验判断,这个房间的温度是恒定的,也就是下一分钟的温度等于现在这一分钟的温度(假设我们用一分钟来做时间单位)。假设你对你的经验不是100%的相信,可能会有上下偏差几度。我们把这些偏差看成是高斯白噪声(WhiteGaussianNoise),也就是这些偏差跟前后时间是没有关系的而且符合高斯分配(GaussianDistribution)。另外,我们在房间里放一个温度计,但是这个温度计也不准确的,测量值会比实际值偏差。我们也把这些偏差看成是高斯白噪声。好了,现在对于某一分钟我们有两个有关于该房间的温度值:你根据经验的预测值(系统的预测值)和温度计的值(测量值)。下面我们要用这两个值结合他们各自的噪声来估算出房间的实际温度值。•假如我们要估算k时刻的是实际温度值。首先你要根据k-1时刻的温度值,来预测k时刻的温度。因为你相信温度是恒定的,所以你会得到k时刻的温度预测值是跟k-1时刻一样的,假设是23度(公式1*),同时该值的高斯噪声的偏差是5度(5是这样得到的:如果k-1时刻估算出的最优温度值的偏差是3,你对自己预测的不确定度是4度,他们平方相加再开方,就是5(公式2))。•然后,你从温度计那里得到了k时刻的温度值,假设是25度,同时该值的偏差是4度。由于我们用于估算k时刻的实际温度有两个温度值,分别是23度和25度。究竟实际温度是多少呢?相信自己还是相信温度计呢?究竟相信谁多一点,我们可以用他们的covariance来判断。因为Kg^2=5^2/(5^2+4^2)(公式4),所以Kg=0.78,我们可以估算出k时刻的实际温度值是:23+0.78*(25-23)=24.56度(公式3)。•可以看出,因为温度计的covariance比较小(比较相信温度计),所以估算出的最优温度值偏向温度计的值。•现在我们已经得到k时刻的最优温度值,下一步就是要进入k+1时刻,进行新的最优估算。•在进入k+1时刻之前,还要算出k时刻那个最优值(24.56度)的偏差。算法如下:((1-Kg)*5^2)^0.5=2.35(公式5)。这里的5就是上面的k时刻你预测的那个23度温度值的偏差,得出的2.35就是进入k+1时刻以后k时刻估算出的最优温度值的偏差(对应于上面的3)。就是这样,卡尔曼滤波器就不断的把covariance递归,从而估算出最优的温度值。•滤波限制条件比较苛刻,它要求系统模型精确以及系统误差模型和观测误差模型已知,这在实际应用中是很难满足的,或者在系统工作过程中,模型发生变化,这些都导致传统KF的滤波发散或精度下降。•计算机字长的限制,这种情况可能导致计算过程中出现舍入误差,从而导致方差阵P(k|k)不对称引起滤波发散。•观测数据发生突变,由于传感器故障或外部条件发生改变,极有可能出现数据突变,即野值,这会对滤波器的收敛性产生严重影响,甚至导致发散,可以说,野值是对滤波器稳定性的一个考验。卡尔曼滤波器的不足之处•针对上述不足,很多学者提出了不同的方法加以克服,如限定记忆法、平方根滤波、渐消记忆滤波、自适应卡尔曼滤波(AKF)、抗野值滤波等。其中,AKF因为具有自适应特性非常适合动态系统滤波而受到广泛重视。因此,在采用卡尔曼滤波处理动态测量数据时,一般都要考虑采取适当的自适应滤波方法来解决这一问题。卡尔曼滤波的发展自适应卡尔曼滤波相关自适应卡尔曼滤波多模型自适应卡尔曼滤波基于信息的自适应卡尔曼滤波神经网络自适应卡尔曼滤波模糊逻辑自适应卡尔曼滤波•最基本的一种AKF方法,相关法分为两类:输出相关法和信息相关法。•输出相关法的主要思想是利用观测向量的相关性M(k)=E[Z(k)ZT(k)]自适应调整增益矩阵K(k)。缺陷:这种方法的主要缺陷是计算复杂,实时性难以满足要求。•信息相关法自适应滤波的主要思想是利用信息的相关性M(k)=E[(V(k)VT(k)]自动调整增益矩阵K(k),其中V(k)=Z(k)-C(k)X^(k)。信息相关法比输出相关法更加有效,因为信息更能反映观测数据特性,但是信息相关法计算复杂度却有所增加,很难满足工程需要。相关AKF•它由一组卡尔曼滤波器组成,每一个卡尔曼滤波器使用不同的系统模型,各个卡尔曼滤波器并行运行,根据观测向量估计各自的状态。随着时间的不断增加,系统会选出最优的一个滤波器并将其权值增大,而其它权值相应减小。多模型AKF性能最优的前提条件是所用的模型集包含了系统所有可能的模式,但是这个前提条件往往是很难满足的。多模型AKF•基于信息的AKF主要是通过调整噪声统计特性达到自适应的目的,解决了因为噪声统计特性不明确或噪声发生变化的情况。但是对于系统其它模型发生变化不能达到自适应的目的。基于信息的AKF•神经网络作为人工智能技术中的一个领域,其主要优点在于它对系统的模型没有特别要求,只要有足够的用于训练的先验数据,就可以用训练的神经网络近似代替原系统。神经网络AKF可以满足系统其它模型不正确或者发生变化的问题。神经网络AKF•卡尔曼滤波器通常要求系统动态过程和噪声都是确定的,且系统噪声和量测噪声都是零均值白噪声,如果系统存在模型误差或噪声不确定就有可能导致卡尔曼滤波器发散。模糊逻辑自适应卡尔曼滤波器,它能够连续调整滤波器模型中的噪声力度,从而防止滤波器发散。模糊逻辑AKF粒子滤波(PF:ParticleFilter)粒子滤波是从上世纪90年代中后期发展起来的一种新的滤波算法,其基本思想是用随机样本来描述概率分布,然后在测量的基础上,通过调节各粒子权值的大小和样本的位置,来近似实际概率分布,并以样本的均值作为系统的估计值,有效克服了推广卡尔曼滤波的缺点。但自身也有一些弱点,粒子滤波的计算量较大;然而,随着计算机处理能力的不断增强,早期限制粒子滤波应用的硬件运算能力等障碍正逐渐消失。粒子滤波技术在非线性、非高斯系统表现出来的优越性,决定了它的应用范围非常广泛。另外,粒子滤波器的多模态处理能力,也是它应用广泛的原因之一。国际上,粒子滤波已被应用于各个领域。在经济学领域,它被应用在经济数据预测;在军事领域已经被应用于雷达跟踪空中飞行物,空对空、空对地的被动式跟踪;在交通管制领域它被应用在对车或人视频监控;它还用于机器人的全局定位。粒子滤波(PF)粒了滤波是指:通过寻找一组在状态空间中传播的随机样本对概率密度函数进行近似,以样本均值代替积分运算,从而获得状态最小方差估计的过程,这些样本即称为“粒子”。采用数学语言描述如下:对于平稳的随机过程,假定k一1时刻系统的后验概率密度为,依据一定原则选取n个随机样本点,k时刻获得测量