第五章马尔可夫过程马尔可夫过程是前苏联数学家A.A.Markov首先提出和研究的一类随机过程.经过世界各国几代数学家的相继努力,至今已成为内容十分丰富,理论上相当完整,应用也十分广泛的一门数学分支.它的应用领域涉及计算机、通讯、自动控制、随机服务、可靠性、生物、经济、管理、气象、物理、化学等.马尔可夫(1856年6月14日——1922年7月20日)马尔可夫对数学的最大贡献是在概率论领域作出的.十九世纪后二十年,他主要是沿着切比雪夫开创的方向,致力于独立随机变量和古典极值理论的研究,从而改进和完善了大数定律和中心极限定理.二十世纪初,他的兴趣转移到相依随机变量序列的研究上来,从而创立了以他命名的著名概率模型——马尔可夫链.王梓坤院士(1929年—)江西吉安人,1952年大学毕业后,被分派到天津南开大学数学系任教.是一位对我国科学和教育事业作出卓越贡献的数学家和教育家,也是我国概率论研究的先驱和学术带头人之一。1954年,他又以优异的成绩考取了赴苏研究生。踏进世界著名学府-莫斯科大学,在这个学府世界概率论的奠基人柯尔莫哥洛夫院士正领导看一个强有力的概率研究集团。柯尔莫高洛夫慧眼识英才,非常信赖这位由中国选派的年轻人的能力,把他选作自己的研究生,去攻概率论的中心问题随机过程理论。当时中国近代数学才刚刚起步,大学也没有概率课程。此时苏联的概率论水平已届于世界最前列。王梓坤也根本不知道什么是概率,可他的研究方向又恰恰被定为概率论,著有《概率论基础及其应用》、《随机过程论》、《生灭过程与马尔科夫链》等9部数学著作.马尔可夫过程的定义马尔可夫链的转移概率与概率分布齐次马尔可夫链状态的分类转移概率的稳定性能本章主要内容一马尔可夫过程的定义1.马尔可夫性通俗地说,就是在知道过程现在的条件下,其将来的条件分布不依赖于过去,则称}),({TttX具有马尔可夫(Markov)性。定义设}),({TttX是一个随机过程,如果}),({TttX在t0时刻所处的状态为已知,它在时刻0tt所处状态的条件分布与其在t0之前所处的状态无关。0tt现在0tt将来0tt过去2.马尔可夫过程定义设}),({TttX的状态空间为S,122,,nntttT如果对(),,1,2,,1iiiXtxxSin在条件下)(ntX的条件分布函数恰好等于11()nnXtx在条件下的条件分布函数,即11221111(),(),,()(()((,))())nnnnnnnnnPXtxPXtxXtxXtxXtxXRtxx{(),}XttT马尔则称为可夫过程.3.马尔可夫链定义参数集和状态空间都是离散的马尔可夫过程称为马尔可夫链。注只讨论马尔可夫链的状态空间为有限或可列无限.则马尔可夫性可表示为12122,,,,,,nnntttTiiiS对11111122()(),((())(()()),),,nnnnnnnnnPXtiPXtixXtiXtiRXtiXti有特别对取T={0,1,2,···}的马尔可夫链,记为}0),({nnX或}0,{nXn此时的马尔可夫性为011,,,,,nniiiS对有0111(1))(1)(0),(1(()(())),,nnnnPXniPXiXiXniXXniin10110111,),,(()nnnnnnnnXPXiPXXiXiiXii或今后,记{1,2,3,},{0,1,2,}ST{,0}nXn马尔可夫链记为马氏链也称,或系统二马尔可夫链的转移概率与概率分布1.转移概率定义设}0,{nXn是马尔可夫链,称条件概率{,0}nXnni(它表示系统在时处于状态的条件下经过k步转移,于n+k时到达状态j的条件概率).()()(,,,0,)1kijnknpnPXjXijSnik{,0}nXn为在n时的k步转移概率.()()kijipnj称以为第行底列元素的矩阵))(()()()(npnkijkP{,0}nXn为系统在n时的k步转移概率矩阵.()()ijnpnP记为特别当k=1时,(1)()ijnpn为系统在时的一步转移概率,(1)(1)()(())ijnpnP为系统的一步转移概率矩阵()ijpn记为定义称可数维的矩阵)(ijpP为随机矩阵,如果0,(,)1,()ijijjpijpi显然,}0,{nXn在n时的k步转移概率矩阵)()(nkP是一随机矩阵.特别k=0时,约定(0)1,,,00ijijijpijSnij(0)()I.Pn此时为单位矩阵2.Chapman-kolmogorov方程定理(C-K方程)()()()()()(),,,0,,kmkmijilljlpnpnpnknmkijS或矩阵形式)()()()()()(knnnmkmkPPP(解决了k步转移概率与一步转移概率间的关系)证明()(){)kmijnkmnpnPXjXi{,())nkmnlnkPXjliXX,){()nkmnnklPXjXliX,)()nkmnnlkPXjXiXl)(,)(nnkmnnnklkPXiPXjXXlXil)(()nnkmnknklPXiPllXXjX()()()()kmilljlpnpnk系统在n时从状态i的出发,经过k+m步转移,于n+k+m时到达状态j,可以先在n时从状态i出发,经过k步转移于n+k时到达某种中间状态l,再在n+k时从中间状态l出发经过m步转移于n+k+m时到达最终状态j,而中间状态l要取遍整个状态空间S.C-K方程的直观意义:定理马尔可夫链的k步转移概率由其一步转移概率所完全确定.若取m=1,则由C-K方程的矩阵形式:)()()()()()(knnnmkmkPPP得(1)()(1)()()()kknnnkPPP(1)()(1)()knnknkPPP()(1)(1)()nnnknkPPPP分量形式11212(1)()()(1)()kkkijijjjjjjjjpnpnpnpnk(,0)nk(,0,,)nkijS1)初始分布(0)0(),iqPXiiS称为马尔可夫链的初始分布3.马尔可夫链的分布}0,{nXn称第i个分量为)0(iq的(行)向量)0(q为马尔可夫链的初始分布向量.即)()0()0(iqq2)有限维分布定理马尔可夫链}0,{nXn的有限维分布由其初始分布和一步转移概率所完全确定.证明12121,0,,,,,nnntttiiiiS对1212{,,,}ntttnPXiXiXi12120{,}(),,,ntnittPXiXiXiiX12201{,,(}),,nttitnPXiXXiiXi12012(,,,,)ntttniPXiXiXiXi121110200,()()()tttiXiXiPPXXiiPXiXi11110(,,,)nntnttnXiPXiXiXi12100121()()()tttiXiXiPPXiPXiXi11()nntntnPXiXi11211121(0)11(0)()().nninntttttiiiiiiniqpptpt又因为马尔可夫链的k步转移概率由一步转移概率所完全确定.所以马尔可夫链的有限维分布由其初始分布和一步转移概率所完全确定.3)绝对分布()(),0,njnqPXjnjS称为马尔可夫链的绝对分布}0,{nXn称第j个分量为)(njq的(行)向量)0(q为马尔可夫链}0,{nXn的绝对分布向量.即)()()(njnqq绝对分布、初始分布和n步转移概率有如下关系:()(0)()(0)0,,nnjiijiqqpnijS或矩阵形式)0()()0()(nnPqq()()njnqPXj(0)()(0)0,,niijiqpnijS0((),)niPXiXj0((,)niPXiXj0(,)niPXiXj00()()niPXiPXjXi4.齐次马尔可夫链定义{,0}nXn设是一马尔可夫链,如果其一步转移概率)(npij恒与起始时刻n无关,记为ijp{,0}nXn则称为齐次(时间其次或时齐)马尔可夫链.否则,称为非齐次马尔可夫链.为方便,一般假定时间起点为零.即显然对齐次马尔可夫链,k步转移概率也与起始时刻n无关.记为()kijp()0(),,0kijkpPXjXiijSk相应的k步与一步转移概率矩阵分别记为(k)PP与定理()()(0)(1),0;(2),0;(3){,0}kkkknkkXnPPqqP的有限维分布由其初始分布和一步转移概率所完全确定例1(天气预报问题)如果明天是否有雨仅与今天的天气(是否有雨)有关,而与过去的天气无关.并设今天下雨、明天有雨的概率为a,今天无雨而明天有雨的概率为b,又假设有雨称为0状态天气,无雨称为1状态天气.Xn表示时刻n时的天气状态,则}0,{nXn是以}1,0{S为状态空间的齐次马尔可夫链.其一步转移概率矩阵为bbaa11P5.马尔可夫链举例例2(有限制随机游动问题)设质点只能在{0,1,2,···,a}中的各点上作随机游动,移动规则如下:1{1,2,,1}ia()移动前处;1,0,,rqprqp0000,0,1prprii+1i-1pqr010p0r20i()移动前处3ia()移动前处a-1aqaar,0,1aaaaqrqr设Xn表示质点在n时刻所处的位置,则其一步转移概率矩阵为{,0}{0,1,,}nXnSa是以为状态空间的齐次马尔可夫链.aarqprqprqprqpr000000000000000000000000P例3设一个坛子中装有m个球,它们或是红色的,或是黑色的,从坛子中随机的摸出一球,并换入一个相反颜色的球.其一步转移概率矩阵为01000001010000000202000001010000010mmmmmmmmmP{,0}nXn是以},,1,0{mS为状态空间的齐次马尔可夫链.设经过n次摸换,坛中黑球数为Xn,则例4设}0,{nXn是具有三个状态0,1,2的齐次马尔可夫链,其一步转移概率矩阵为3104411142431044P初始分布,2,1,0,31)0(iqi试求:022(1)(0,1);(2)(1).PXXPX解020201(0,1)(0(10)PXXPXPXX())(2)0113p(2)01p其中为一个两步转移概率,在两步转移概率矩阵中是第一行第二列的元素.22PP()518165131621639116116645(2)01516p02(0,1)PXX15531648(0)(2)21(2)(1)iiiPXqp(2)(2)(2)0111211()3ppp1519()3162161124练习设}0,{nXn是状态空间为{a,b,c}的齐次马氏链.其一步转移概率矩阵为1112442103332055P712345602(1){,,,,,,}(2){},nnPXbXcXaXcXaXcXbXcPXcXb求