1基于单因素试验对荨麻疹药物疗效的比较摘要本文引入5种治疗荨麻疹的药物,根据所给数据中30个病人从使用药物开始到痊愈的时间数据。在只考虑药物种类即不考虑其它如性别、年龄的情况下,我们考虑条件误差AS及试验误差ES对试验的影响,又根据2S=pjriijYYn112)(11,且TS=(n-1)2S。根据2—分布得2112ripjijaY,再根据F—分布得)1(12222nSnST~,记pnSSEE,1pSSAA得统计量F=),1()()1(22pnpFSSpnSpSEAEA~。对于给定的检验水平α,查附录可得临界值),1(1pnpFA;故检验当AFF1,则拒绝0H;并且利用Matlab软件计算出有关结果,以及运用矩法求出第j组的总体均值ja,以及j即水平jA的效应;在证明以上估计均为想应参数的无偏估计量的基础上,得出aj-ak=j-k(j≠k),最后经过我们的计算得出这5种药物的优良等级为3,2,4,5,1。关键字:药物疗效单因素方差分析2一、问题的提出治疗同一种疾病的药品是多种多样的。如何快速并准确的判定一种新型药物的疗效已逐渐成为数学分析的一个分支。现有5种治疗荨麻疹的药,要比较它们的疗效,课题组把30个患荨麻疹的病人随机分成五个小组,每个小组有6个病人并对每个病人编号,让同一个小组的病人都使用5种药中的一种,分别进行试验,记录每个病人从使用药物开始到痊愈所需的时间,通过每组中六个人的治愈时间来判断该种药物对荨麻疹治疗效果,实验结束后统计整理得到如下记录:(α=0.05)药物X治愈所需天数Y15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6表一由统计数据提出如下问题:(1)这五种药物的疗效是否存在差异?(2)若存在差异,哪种药物对荨麻疹疗效最好?二、问题的分析影响疾病治疗效果的因素通常有药物和机体两个方面。药物方面有药物种类、给药途径、给药剂量、给药时间等,机体方面有病理状态、年龄、性别、生理、遗传等。对于本题提出的荨麻疹问题的深入分析,可以发现以下几个问题:(1)对于相同年龄阶段同性别的荨麻疹病人病理状态相同的情况下,在给入不同种药物相同剂量的情况下,疗效也会不同。(2)由于荨麻疹病人的病理状态、年龄阶段、性别的不同,在给入同种药物相同剂量的情况下,治疗效果是不同的,从而影响药物疗效的判定。此外,疾病的治疗受心理、精神等多种因素的影响,但本问题中对于试验条件的限定为给药种类、给药剂量、性别、年龄、病理状态等都视为同等水平,仅研究药物种类对药物疗效的影响这一主要因素。把其它无法通过试验控制的不可预测的3因素作为不可观测的随机变量。三、模型假设1.假设试验条件中所有荨麻疹病人的性别和年龄阶段均相同;2.假设试验条件中给所有荨麻疹病人用药剂量、用药时间、用药途径均相同;3.假设试验条件中所有荨麻疹病人的病理状态均相同;4.把这5种药物对应的试验记录的治愈天数作为相对应的5个总体,假设这5个总体的方差都相同,这样的假设可用下述线性模型表示),0(2NaYijijiij~且各ij相互独立;5.0H:paaa21,:1H1a,2a,,pa不全相等;6.Y~N(2,ja),其中ja和2均为已知。四、符号说明i(1,2,,r)第i个人;其中r=6j(1,2,,p)第j个组;其中p=5ijY第j组第i个人治愈所需天数ja第j组的总体均值ij不可观测的随机变量2总体方差2ˆ总体方差的估计值jY每组的平均值4Y总平均TS总变差(所有数据与总平均的差异的平方和)ES各个组内不同患者对同种药物疗效的随机效应AS患者对药物疗效的条件效应2S样本方差jA药物的不同水平j水平jA的效应2自由度为n的2变量表二各个变量的符号说明六、模型的建立及求解(一)基本模型的建立若假设0H:paaa21为真时,即“所有药物的效果均没有差别”由每个条件下的总体Y~N2,ja,则所有样本ijY均可视为来自同一正态总体即Y~N2,ja,且ijY是相互独立的。假设它们具有方差齐性,即),0(2NaYijijiij~且各ij相互独立。这是一个单因素方差分析问题。因药物取5个不同水平:521,,,AAA,在每个水平均作6次相等的重复试验,在jA水平下对应样本为:jjjYYY62,1,,。这样共得5个容量为6的相互独立的样本,如下所示:5水平1A2A3A4A5A实验关测值111Y12Y13Y14Y15Y221Y22Y23Y24Y25Y331Y32Y33Y34Y35Y441Y42Y43Y44Y45Y551Y42Y53Y54Y55Y661Y52Y63Y64Y65Y则jA条件下总体为),(2jaNY~,且方差齐次。且Y=pjriijYpr111==,又pr=n=30根据MATLAB计算Y=[5877108466356644543746635935776];mean(A)Y=5.6333TS=211)(pjriijYY,代入数据得TS=94.9667记riijjYrY11;ES=211)(pjrijijYY=58.5000;AS=21)(pjjYYr=36.4667又2S=pjriijYYn112)(11=3.2747138根据F—分布及相关知识得)1(12222nSnST~同时)(),1(2222pnSpSEA~~;且22EASS与相互独立,记1,pSSpnSSAAEE(1)当0H:paaa21成立时,统计量6F=),1()()1(22pnpFSSpnSpSEAEA~则当0H为真时即各种药物疗效相同时,AS应较小,从而F取值也应较小,亦即F值应接近1;(2)当0H不为真时即各种药物疗效差异显著时,AS应较大,从而F取值也应较大,亦即F值也应较大。对于给定的检验水平α,查《应用概率统计》附录Ⅰ表5得临界值),1(1pnpF=2.76经以上分析当1FF,且由MATLAB程序附录二所示,则拒绝0H即认为药物改变对疗效有显著影响;当1FF,则拒绝0H。即认为药物改变对疗效无显著影响方差分析表如下:方差分析方差来源平方和S自由度自由度均方SF值组间(条件误差)AS=pjiYYr12)(=36.4667p-1=4p-11pSSAA=9.1167EASS=3.900组内(实验误差)ES=211)(pjrijijYY=58.5000n-p=25n-ppnSSEE=2.333总和(总误差)TS=211)(pjriijYY=94.9667n-1=29n-1由F=3,90),1(1pnpF=2.76故拒绝0H,认为这5种药物的疗效有显著差异。7(二)未知参数的估计2的估计2ˆ=snSE=2.3334;a的估计aˆ=Y=5.6333jY=piijYp11,ja的估计值jaˆ=jY及j的估计值YYjjˆ得ja的估计分布为:7.5,5,4.333,5.1667,6.1667j的估计分布为:1.8667,-0.6333,-1.3,-0.4666,0.5333容易证明,以上估计均为想应参数的无偏估计量。(三)5种治疗荨麻疹的药物疗效的比较当拒绝0H时,进一步比较),(2jaN与),(2kaN的差异,可以作ja-ka=j-k(j≠k)的区间估计。因为kjYYE=ja-ka,kjYYD=2kjnn11且kjYY..与2ˆ=snSE相互独立。故kjnn11SYYEk..j=pn~tpnSnnaaYYEkjkjkj2..11得ja-ka的1-α的置信区间kjEkjnnSpntYY112..由《应用概率统计》附录Ⅰ表3,0595.225975.021tpnt8819.011kjEnnS故ja-ka的置信区间分别为21aa(0.6837,4.3163)31aa(1.3504,4.983)41aa(1.5170,4.1495)51aa(-0.430,3.149573)32aa(-1.14927,2.483273)42aa(-1.98297,1.649573)52aa(-2.982970.649573)43aa(-2.64997,0.982573)853aa(-3.64997,-0.01743)54aa(-2.81627,0.816273)经以上比较可知,XXjj.ˆ所得数据是比较可信的这5种药物的优良等级为3,2,4,5,1。七、模型的评价(一)模型具有的优点1.本模型在建模过程中对五种药物的疗效判定做了合理的简化,充分利用所给出的统计数据,建立了单因素试验分析模型,数学推导严谨,理论可靠,建模清晰。2.模型考虑到了药物种类的因素,将多元数据简单化,证明了模型的实用性。3.该模型易于推广,可以对研究其他单因素影响的问题提供参考。4.本模型应用Matlab软件进行数据计算,数据结果准确。(二)模型存在的不足1.由于题目中给出的统计数据相对较少,在处理数据时和实际有一定差别。2.本模型只是从理论上说明了问题,未从患病者的个体差异角度分析,所以本模型也存在着一定的误差。八、模型的改进1.在实际情况下,影响荨麻疹药物疗效的因素很多,我们可以采用多因素试验分析此问题。同时具体考虑各个因素间存在的交互作用,可采用多重拟合,使模型更加符合实际情况。2.采用多因素试验对数据进行分析,考虑影响药物疗效的多种因素,在所给出的数据上进行拓展,建立出更加完善的模型。9参考文献[1]姜启源等,数学模型,北京,高等教育出版社,2003[2]牛莉,线性代数,北京,中国水利水电出版社,2007[3]何良材,田玉芳.应用概率统计,重庆,重庆大学出版社,2006[4]姜启源等,大学数学实验,北京,清华大学出版社,2005[5]范金城,梅长林,数据分析,科学出版社,200210附录一Togetstarted,selectMATLABHelporDemosfromtheHelpmenu.a=[5,8,7,7,10,8];[h1,h2]=cdfplot(a)h1=154.0045h2=min:5max:10mean:7.5000median:7.5000std:1.6432b=[4,6,6,3,5,6];[h1,h2]=cdfplot(b)h1=154.0052h2=min:3max:6mean:5median:5.5000std:1.2649c=[6,4,4,5,4,3];[h1,h2]=cdfplot(c)h1=154.0060h2=min:3max:6mean:4.3333median:4std:1.0328d=[7,4,6,6,3,5];[h1,h2]=cdfplot(d)h1=154.0067h2=min:311max:7mean:5.1667median:5.5000std:1.4720e=[9,3,5,7,7,6];[h1,h2]=cdfplot(e)h1=154.0082h2=min:3max:9mean:6.1667median:6.5000std:2.0412normrnd(5,1.2649,30,1);q=normrnd(4.3333,1.0328,30,1);mx=normrnd(7.5,1.6432,30,1);y=normrnd(5.1667,1.4720,30,1);n=normrnd(6.1667,2.0412,30,1);12附录二Togetstarted,selectMATLABHelporDemosfromtheHelpmenu.