徐海学院数学建模实践基地基于线性代数与差分方程方法的模型我们有多处对不连续变化的变量采取了连续化的方法,从而建立了相应的微分方程模型。但是由于以下原因:第一,有时变量事实上只能取自一个有限的集合;第二,有时采取连续化方法后建立的模型比较复杂,无法求出问题的解,从而只能求它们的数值解。也就是说,在建模时我们对离散变量作了连续化处理,而在求解时,又对连续变量作了离散化处理,使之重新变为离散变量。所以采取连续化方法的效果有时并不很好,因而是不可取的。电子计算机的广泛应用为我们处理大量信息提供了实现的可能,这就十分自然地提出了一个问题,对具有离散变量的实际问题直接建立一个离散模型是否更为可取?本章介绍的几个模型就是基于这种想法建立起来的。马氏链模型随着人类的进化,为了揭示生命的奥秘,人们越来越注重遗传学的研究,特别是遗传特征的逐代传播,已引起人们广泛的注意。无论是人,还是动、植物都会将本身的特征遗传给下一代,这主要是因为后代继承了双亲的基因,形成自己的基因对,由基因又确定了后代所表现的特征。本节将利用数学的马氏链方法来建立相应的遗传模型等,并讨论几个简单而又有趣的实例。马氏链(马尔柯夫链)研究的是一类重要的随机过程,研究对象的状态s(t)是不确定的,它可能取K种状态si(i=1,…,k)之一,有时甚至可取无穷多种状态。在建模时,时间变量也被离散化,我们希望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研究其变化规律,故马氏链研究的也是一类状态转移问题。问题1:设某商店经营情况可能有三种状态:好(S1:利润丰厚)、一般(S2)和不好(S3:亏损)。根据统计资料,上月状态为Si,下月状态为Sj的概率为pij(i=1,2,3;j=1,2,3),0≤pij≤1关系既可用一转移矩阵表示333231232221131211pppppppppA问题2研究某一草原生态系统中物质磷的循环,考虑土壤中含磷、牧草含磷、牛羊体内含磷和流失于系统之外四种状态,分别以S1,S2,S3和S4表示这四种状态。以年为时间参数,一年内如果土壤中的磷以0.4的概率被牧草生长吸收,水土流失于系统外的概率为0.2;牧草中的含磷以0.6的概率被牛羊吃掉而转换到牛羊体内,0.1的概率随牧草枯死腐败归还土壤;牛羊体中的磷以0.7的概率因粪便排泄而还归土壤,又以自身0.1的比率因屠宰后投放市场而转移到系统外。我们可以建立一个马尔柯夫链来研究此生态系统问题,其转移概率列表于下:1000S4流失系统外0.10.200.7S3羊体含磷00.60.30.1S2牧草含磷0.200.40.4S1土壤含磷i时段状态S4S3S2S1i+1时段状态状态转移概率相应的转移矩阵为:10001.02.007.006.03.01.02.004.04.0M且Sj+1=SjM马氏链模型的性质完全由其转移矩阵决定,故研究马氏链的数学工具是线性代数中有关矩阵的理论。首先,任一转移矩阵的行向量均为概率向量,即有(1)(I,j=1,…,n)(2)(i=1,…,n)这样的矩阵被称为随机矩阵。10igP11njigP常染色体遗传模型下面给出双亲体基因型的所有可能的结合,以及其后代形成每种基因型的概率,如表所示。在常染色体遗传中,后代从每个亲体的基因对中各继承一个基因,形成自己的基因时,基因对也称为基因型。如果我们所考虑的遗传特征是由两个基因A和a控制的,(A、a为表示两类基因的符号)那么就有三种基因对,记为AA,Aa,aa。1000aa010Aa0001AA后代基因型aa-aaAa-aaAa-AaAA-aaAA-AaAA-AA父体——母体的基因型双亲随机结合的较一般模型相对比较复杂,这些我们仅研究一个较简单的特例。问题3农场的植物园中某种植物的基因型为AA,Aa和aa。农场计划采用AA型的植物与每种基因型植物相结合的方案培育植物后代。那么经过若干年后,这种植物的任一代的三种基因型分布情况如何?(a)假设:令n=0,1,2,…。(i)设an,bn和cn分别表示第n代植物中,基因型为AA,Aa和aa的植物占植物总数的百分比。令x(n)为第n代植物的基因型分布:nnnncbax)(当n=0时000)0(cbax表示植物基因型的初始分布(即培育开始时的分布)问题3农场的植物园中某种植物的基因型为AA,Aa和aa。农场计划采用AA型的植物与每种基因型植物相结合的方案培育植物后代。那么经过若干年后,这种植物的任一代的三种基因型分布情况如何?(b)建模根据假设(ii),先考虑第n代中的AA型。由于第n-1代的AA型与AA型结合。后代全部是AA型;第n-1代的Aa型与AA型结合,后代是AA型的可能性为1/2,而第n-1代的aa型与AA型结合,后代不可能是AA型。因此当n=1,2…时1110211nnnncbaa1121nnnbaa即类似可推出1121nnncbbcn=0显然有(ii)第n代的分布与第n-1代的分布之间的关系是通过表5.2确定的。1000cba(2)(3)(4)将(2)、(3)、(4)式相加,得111nnnnnncbacba根据假设(I),可递推得出:1000cbacbannn对于(2)式.(3)式和(4)式,我们采用矩阵形式简记为,2,1,)1()(nMxxnn其中nnnncbaxM)(,00012100211(注:这里M为转移矩阵的位置)(5)由(5)式递推,得)0()2(2)1()(xMxMMxxnnnn(6)(6)式给出第n代基因型的分布与初始分布的关系。为了计算出Mn,我们将M对角化,即求出可逆矩阵P和对角库D,使M=PDP-1因而有Mn=PDnP-1,n=1,2,…其中nnnnD321321000这里,,是矩阵M的三个特征值。对于(5)式中的M,易求得它的特征值和特征向量:=1,=1/2,=0123123因此121011001,0000210001321eeeD所以100210111321eeeP通过计算,P-1=P,因此有)0(1)(xPPDxnn0001002101110000210001100210111cban=即00011)(000212102112111cbacbaxnnnnnnnn021212121010010000cbcbcbannnn=所以有0212121211010010nnnnnnnccbbcba当n时,021n,所以从(4.7)式得到0,0,1nnncba即在极限的情况下,培育的植物都是AA型。若在上述问题中,不选用基因AA型的植物与每一植物结合,而是将具有相同基因型植物相结合,那么后代具有三种基因型的概率如表所示。41214111/40aa01/20Aa01/41AA后代基因型aa-aaAa-AaAA-AA父体——母体的基因型并且)0()(xMxnn,其中141002100411MM的特征值为21,1,1321通过计算,可以解出与、相对应的两个线性无关的特征向量e1和e2,及与相对应的特征内量e3:12121,100,101321eee因此02101110211,1112001011PP)0(1)(xPPDxnn000021011102112100010001111200101cban解得:01000102121212121bccbbbaannnnnn当n时,021n,所以000021,0,21bccbbaannn因此,如果用基因型相同的植物培育后代,在极限情况下,后代仅具有基因AA和aa。问题4常染体隐性疾病模型现在世界上已经发现的遗传病有将近4000种。在一般情况下,遗传疾病和特殊的种族、部落及群体有关。例如,遗传病库利氏贫血症的患者以居住在地中海沿岸为多,镰状网性贫血症一般流行在黑人中,家族黑蒙性白痴症则流行在东欧犹太人中间。患者经常未到成年就痛苦地死去,而他们的父母则是疾病的病源。假若我们能识别这些疾病的隐性患者,并且规定两个隐性患者不能结合(因为两个隐性病患者结合,他们的后代就可能成为显性患者),那么未来的儿童,虽然有可能是隐性患者,但绝不会出现显性特征,不会受到疾病的折磨。现在,我们考虑在控制结合的情况下,如何确定后代中隐性患者的概率。(a)假设(i)常染色体遗传的正常基因记为A,不正常基因记为a,并以AA,Aa,aa分别表示正常人,隐性患者,显性患者的基因型(ii)设an,bn分别表示第n代中基因型为AA,Aa的人占总人数的百分比,记,n=1,2,…(这里不考虑aa型是因为这些人不可能成年并结婚)(iii)为使每个儿童至少有一个正常的父亲或母亲,因此隐性患者必须与正常人结合,其后代的基因型概率由下表给出:nnnbax)(1/20Aa1/21AA后代基因型AA-AaAA-AA父母的基因型(b)建模由假设(iii),从第n-1代到第n代基因型分布的变化取决于方程1121nnnbaa11210nnnbab所以,2,1,)1()(nMxxnn,其中210211M如果初始分布x(0)已知,那么第n代基因型分布为,2,1,0)(nxMxnn解将M对角化,即求出特征值及其所对应的特征向量,得pPPDnn1,1011,21001计算00)0(1)(1011210011011baxPPDxnnn=00000021212102111bbbabannnn,2,12121100nbbbannnn(8)因为100ba,所以当n时,1na,0nb隐性患者逐渐消失。从(8)式中可知121nnbb每代隐性患者的概率是前一代隐性患者概率的1/2。(9)(c)模型讨论研究在随机结合的情况下,隐性患者的变化是很有意思的,但随机结合导致了非线性化问题,超出了本章范围,然而用其它技巧,在随机结合的情况下可以把(9)式改写为2,1,21111nbbbnnn(10)下面给会出数值例子:某地区有10%的黑人是镰状网性盆血症隐性患者,如果控制结合,根据(9)式可知下一代(大约27年)的隐性患者将减少到5%;如果随机结合,根据(10)式,可以预言下一代人中有9.5%是隐性患者,并且可计算出大约每出生400个黑