第二节齐次马尔可夫链一、齐次马尔可夫链的概念一个随机过程{Xn,n=0,1,2,…}就是一族随机变量,而Xn能取的各个不同的值,则称为状态。如果一个随机过程{Xn,n=0,1,2,…},由一种状态转移到另一种状态的转移概率只与现在处于什么状态有关,而与在这时刻之前所处的状态完全无关,即如果过程{Xn,n=0,1,2,…}中,Xn+1的条件概率分布只依赖于Xn的值,而与所有更前面的值相互独立,则该过程就是所谓马尔可夫(Markov)过程.马尔可夫链是指时间离散,状态也离散的马尔可夫过程。一个马尔可夫链,若从u时刻处于状态i,转移到t+u时刻处于状态j的转移概率与转移的起始时间u无关,则称之为齐次马尔可夫链,简称齐次马氏链。如果把从状态i到状态j的一步转移概率记为pij,则pij=P{Xn+1=j|Xn=i},i,j=0,1,2,…,且有转移概率矩阵P,这样,一个齐次马氏链,可以由一个转移概率矩阵P以及在时刻零时状态x=0,1,2,…的概率分布列向量Q=(q(0),q(1),…)完全确定。由齐次马氏链性质知道,第i状态的行向量Ai与第i+1状态的行向量Ai+1之间存在着关系式:Ai+1=AiP。二、齐次马氏链在评估教学质量中的应用教学过程是一个随机过程,也就是说,对于具有相同基础知识背景的学生(个体),在同时接受新知识时是随机的。我们可以把一个班(群体)的学生划分为不同的等级(譬如:优、良、中、及格、不及格五个等级),近似地认为处于同一等级的学生具有相同的基础知识,用齐次马氏链,通过学生学习状态的转移概率矩阵,最终可以预测一个班学生学习成绩的稳定状态。对教师而言,也就可用来评估、预测一个班的教学质量。在教学效果指标的量化过程中,齐次马氏链评估法是将一个群体(如一个班或一个年级)的学生在某次考试中获得优(90分以上)、良(80~89分)、中(70~79分)、及格(60~69分)和不及格(59分以下)各等级学生人数占总人数之比,作为状态变量,并用向量表示之。即R(t)=(X1(t),X2(t),X3(t),X4(t),X5(t)),由于齐次马氏链与t时刻前的状态无关(呈无后效性),可以研究当t变化时,状态向量R(t)的变化规律,从而对教学效果进行评估。设经第一次考试,一个班n个学生中,优、良、中、及格、不及格的学生数分别为ni(i=1,2,3,4,5),则状态向量称作初始向量。为考察教学效果,继续分析下一次考试时,上述学生的等级变化。若经第二次考试后,原来获优等成绩的n1名学生中,仍保持优等的是n11人,转化为“良”,“中”,“及格”,“不及格”的学生分别有n12,n13,n14,n15人,于是,第一次考试成绩优等的学生考试成绩转移情况是同样,其余各个等级的学生的考试成绩转移情况是向量中nij(i,j=1,2,3,4,5)表示从状态i变成状态j的人数。这一转移情况用矩阵表示为P为转移概率矩阵,简称转概阵。符合齐次马氏链学习状态转移概率矩阵的学生学习成绩最终必然趋于平稳状态X=(x1,x2,x3,x4,x5),即X=X·P,也即X(E-P)=0,解此线性方程组,可得状态R(t)时学生学习成绩的平稳分布X。下面,我们仍以第一节表5-1中的15名学生的成绩为例,分析这一群体在两次考试中学生等级的变化。按优、良、中、及格、不及格五等划分,分别是2人、4人、4人、5人和0人,因此,各个等级学生转移情况分别是第二次考试成绩分布状态按照这个变化规律,第三次考试成绩分布状态即在第三次考试后,学生中优等、良等的人数减少了,而中等的人数和及格的人数却在增加。这样,就可以分析这组学生群体的变化状态。设该过程的平稳状态分布列为X,由于(E-P)TX=0,从而可以断定,最终只有中等和及格两等级的学生,其人数分别占总数的56%和44%。三、齐次马氏链在评估解题状态中的应用解决问题是数学教育的一项主要任务。如果能够把一个题目,按学生解题的认知过程的发展,分解成几个不同层次的状态,那么就可以用齐次马氏链去测量一个群体(如一个班或一个年级的学生)解决问题的能力与状况。首先,我们认为解决一个问题的过程是由分析S1、设计S2、探究S3、实施S4和验证S5这样五个状态组成的,并且这五个状态存在如图5-2的关系。分成了上面五个状态,我们可以认为解决问题的后一状态只与它的前一个状态有关,而与它的更前面的状态无关。这就完全符合齐次马氏链所要求的条件。图5-2的关系流程图,存在一个状态转移概率矩阵其中p23+p24=1,p31+p32=1。如果图5-2的关系流程图第i阶段的行向量为Ai=(a1,a2,a3,a4,a5),由于A0=(1,0,0,0,0),从而A1=(0,1,0,0,0),A2=A1P=(0,0,p23,p24,0),A3=A2P=(p31p23,p23p32,0,0,p24),p24(P23P32+1)。应用齐次马氏链的关键在于找到一个转移概率矩阵中的pij,这就要从两个方面去控制,一是通过具体题目的解题过程划分几个不同状态(这一点相对来说是比较困难的),二是通过解题时间来控制解题过程,以分析整个群体a的解题状态。例如,要求40名学生在10分钟内完成一个题目:求证:P1(2,3),P2(4,6),P3(6,9)三点共线。当然,对于这个题目,如何比较客观去分析解题状态,即究竟做到哪一步才是从分析S1到设计S2,哪一步才算是从设计S2到实施S4,这是比较困难的。但是,如果运用时间去控制解题状态,还是切实可行的。设8分钟以后,有30名学生圆满地证明了这个题目,剩下的10名学生中,经过老师的适当提示,又有6名学生完成了该题。这样对照关系流A0=(1,0,0,0,0),A1=(0,1,0,0,0),由A1可见,这40名学生全部从分析状态S1转移到设计状态S2;由A2齐次马氏链,针对在规定的时间里,有相当一部分的学生完成解答,即处于图5-2关系流程图中验证状态S5,是比较有效的。但是,如果在规定的时间里,没有学生或者有很少学生顺利地完成解答,用控制时间的方法去测算解题状态是行不通的。这时,只能通过分析题目的解题状态,具体地分清楚状态S1、S2、S3、S4和S5,才能使用上面方法,确定转概阵中的pij,从而正确使用齐次马氏链测算解题状态。