数理统计期末复习题1

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2009期末复习题注:这份答案是在2009年最后一晚做出来的,时间比较紧,所以可能有些地方不严谨,有什么错误还请各位多包涵。处理一个问题有很多合理的办法,这份答案所列出的只不过代表个人的想法,仅供参考。这份答案算是送大家的新年礼物吧,预祝大家期末考试顺利,一年都有好运孟帅1.设随机变量X和Y相互独立,且都服从正态分布N(0,32),而921,,,XXX和921,,,YYY分别是来自总体X和Y的样本,则统计量U=292221921YYYXXX服从什么分布?为什么?解:分子分母同除以9得到服从N(0,1),服从X²(9)分布,因此U服从t(9)分布(课本92页)2.某大学来自A,B两市的新生中分别抽取10名和11名男生调查身高,测得他们的身高分别为cmx176,cmy172,样本方差分别为3.1121S,1.922S。不妨设两个城市的男生的身高分别服从正态分布),(21N和),(22N,求21的95%的置信区间,并请在0.05水平下判断两个城市的男生身高是否相等?解:但是未知,构造T=(111页)919211939iiiiXY9119iiX9213iiY222122121211XYSnn=。=10,=11,=11.3,=9.1,=176,=172。代入T表达式得到T=。T服从t(+-2)查附表7得到=2.093得到的置信区间为:(1.088,6.912)这个区间不包含0,可以直接判定在0.05水平下两城市男生身高不相等。如果想严谨一点就在进行假设检验:原假设:两城市男生身高相等;备择:两城市男生身高不等。检验统计量T=,和比较。如果T大于,拒绝原假设,否则接受。3.随机调查了某校200名沙眼患者,经用某种疗法治疗一定时期后治愈168人,试求总体治愈率的95%置信区间。解:样本率p=0.84,用大样本正态近似法求解,置信区间为:(,)(课本115页)S22112212112nSnSnn1n2n21S22SXY1n2n1241.391512219t1211XYSnn219t219t21pppun21pppunn=200,查附表4得=1.96095%置信区间为(0.789,0.891)4.假设从两个总体)1,0(~NX和)1,1(~NY等概率地抽取样本并进行分类,分类过程如下:如果样本值大于96.1则判定为总体Y,否则就判断为总体X,试问:将总体X错判为总体Y的概率是多少?将总体Y错判为总体X的概率是多少?解:P(总体X错判为总体Y)=P(X>1.96),查附表4,=1.96故P(X>1.96)=0.025P(总体Y错判为总体X)=P(Y≤1.96)=P(Y-1≤0.96),而Y-1服从N(0,1)查附表3得到Φ(0.96)=0.8315,故P(Y≤1.96)=0.83155.为测定某药的剂量x与血药浓度γ之间的关系,测得如下数据:剂量51015202530血药浓度15.231.746.758.976.982.8求γ关于x的回归方程,并检验方程的显著性(01.0)。解:求回归方程:可以用公式手算,2u2u61622166iiiiiXYXYXXaYX当然,考试时允许用计算器的,把上面的数据直接键入,很快便出结果了。回归方程:检验方程的显著性:原假设:无线性关系;备择:回归效果显著计算统计量,,(课本229-230页)剩下的就是狂按计算器。。F=343.88,查附表8得到=21.2,所以拒绝原假设,方程回归效果显著。当然,用r检验也可以,二者本质上是一样的,在此不再赘述。6.在诱发大白鼠鼻咽癌的试验中,一组用亚硝酸向鼻腔滴注(鼻注组),另一组在鼻注的基础上加维生素B12肌注(鼻注+B12),试验数据如下:发癌鼠数未发癌鼠数鼻注5219鼻注+B12393试问”鼻注”与”鼻注+B12”对大鼠诱发癌的作用是否有关联?用什么方法检验?假如上述数据列表中的第二格的数据变为6,该方2.7763.453x2UFnQ621iiU621iiiQ0.0114F法是否还适用?为什么?解:用X²检验。原假设:无关联;备择:有关联a=52,b=19,c=39,d=3,n=113计算统计量=5.287(课本166页)查附表6得到所以拒绝原假设。数据列表中的第二格的数据变为6,这个时候用X²检验就有点勉强了,四格表的数据画成柱形图时,成对角线斜坡状是最理想的,而此时出现了6和3两个很小的状态,正态性很差,因而不适合。此时应当用精确概率检验:a=52,b=6,c=39,d=3,n=100代入得P=0.244>0.05,故不拒绝原假设,既无关。7:随机抽取8名健康者的血液,将其的血滤液放置不同时间(0,45m,90m,135m),测定血糖浓度,每个受试者有4个测定值。请问,应该用什么方法分析血糖在不同放置时间的变化?假如要分析各个时间点的差异,应该如何判定?为什么?受试放置时间(分)220.5nadbcnabacbdcd20.0513.841abacbdcdPnabcd者编号014529031354(1)95958983(2)95948884(3)1061059790(4)98979590(5)102989788(6)11211210194(7)1051039788(8)95929080解:时间为单因素,不同时间为不同水平。原假设:;备择:不全相等。=1833.96875,=890.38,=943.59=9.89,F服从于F(3,28)分布查附表8得到=2.95,因此拒绝原假设,即时间对血糖浓度有影响。既然时间对血糖浓度有影响,那么就要进行两两比较,以分析各123448211TijjiSSxxeSSASS41324AeSSFSS0.05328F个时间点的差异。本题中只有四个水平,用单纯的t检验当然是可以的,但不推荐。下面将以Q检验法为例:=101,=99.5,=94.25,=87.125R=max{-}=13.875=5.639==13.929在0.05水平,k=4,f=28下查q表(相当郁闷的是,表里没有28自由度的数据,只好用内插法了)q(4,24)=3.90,q(4,30)=3.84。得到q(4,28)=3.86q=13.929>q(4,28)因此拒绝原假设。=3.848四个组的均值两两做差,绝对值大于的认为有显著性差异,发现从第二组到第三组就有显著差异了。(注:Q、S检验课本上没有细述,在第八章-方差检验的课件上)8:对一组胃炎病人先后服用两种药物,然后分别测定其最大排酸量(mmol/h),请问,应该用什么方法分析两种药的效果之间的差异。为什么?需要注意什么问题?1x2x3x4xixjx324eeSSS32eRqS443028304244302430qqqq42832TeDqSTD病例甲药乙药病例甲药乙药编号XY编号XY111.518.841214.5612.49212.0510.49139,468.04322.2622.281411.209.4443.111.781516.5314.1252.031.76168.056.6764.613.85174.543.8771.230.91189.227.9382.532.04196.084.9293.962.99208.657.52104.683.922113.9211.931111.769.932210.3614.68解:这是一组配对资料,可以考虑使用配对T检验(课本129页)。采用t检验首要数据考虑的正态性。当然,这一点一般是默许我们使用的。只有当数据波动特别明显是才考虑(第九题就不符合正态性)。配对T检验:设,D服从N(μ,σ²)原假设:μ=0;备择:μ≠0。=3.389t服从于t(22-1)分布。查附表7得到=2.080iiiDXY0.995455039.86114522DtSn0.05221t故拒绝原假设。采用符号检验或者秩检验也可以。例如符号检验,根据原始数据的大小定义+、-号:+、+、-、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、-。即使不计算也能看出来+太多了。S=min{}=2,在α=0.05,n=22情况下,查附表12得到=5,因而拒绝原假设。9:用两种方法测定同一批人血清样品中的黄体生成素(HCG-CH)含量(mg/L),试分析两法的效果,能否用固相法取代双抗体法。样品编号含量(mg/L)样品编号含量(mg/L)固相法双抗体法固相法双抗体法XYXY11.40.7571700150022.72.782400352034.11.3931003100428.013.7101184016680583.561.0111800016900610576.0121923018320解:这同样是配对资料的分析,但是和上一题不同,本体绝对不可以用T检验。数据的波动太大,要是这样的数据也能当做正态,那这个世界就和谐了。。可以考虑使用符号检验,wilcoxon符号秩检验。nns符号检验法:原假设:两种方法效果相同;备择:不相同。差值标记:+、0、+、+、+、+、+、-、0、-、+、+。差值为零的不计入。S=2,n=10,α=0.05。查附表12得到=1,S>,所以接受原假设。符号秩检验:差值绝对值序列:0.65、2.8、14.3、22.5、29、200、910、1100、(-)1120、(-)4840对应的秩为1到10=1+2+3+4+5+6+7+8=36,=9+10=19T=19根据n=10,α=0.05查附表13得到=8,T>,因而接受原假设。10:两组大鼠,一组为药物组、另一为空白对照组。两组大鼠在4个不同级别的压力(分别是20、40、60、80mmHg)下测量数据,所得数据为在不同压力作用下测量的计量资料(一只大鼠同时有四个不同的数据)。现要对两组大鼠的测量数据进行统计分析比较,以了解药物对不同压力下测量的数据有无影响。请问采用哪种统计分析方法?解:上课的时候老师说过10题和11题仅仅是提醒我们处理数据时要注意同质性原则,统计方法不作要求。老师给的方法是根据数据求出压力与数据的回归,来消除压力对ssTTTT于数据的影响,从而转化成用药与不用药的单因素分析。课本上讲到双因素方差分析时,有一种方法叫做“等重复双因素方差分析”,适用于这类问题,不过很繁琐,简单了解一下吧。11:假设测了一个细胞株在几个不同处理因素下的A指标,每组重复测量6次取均值。然后又测了这几个处理因素下的B指标,同样每组重复测量6次取均值。因为A指标受B指标的干扰,所以,要排除B的影响,最好比较A与B的比值。问题是,两者均数都算出来了,比值就只有一个,如何统计分析呢?是不是可以这么做:假设A指标检测结果是A1~A6,B指标检测结果是B1~B6,然后用A1/mean(B1+......+B6),A2/mean(B1+.......+B6),A3/(B1+…+B6)依此类推,得到6个比值后,再用方差分析进行各处理组间的比较?解:这一题很让人费解啊,既然A受B的影响,那A1,A2……A6同时除以一个相同的数能有啥作用呢。当然,如果B指标的微小波动就会对A产生显著影响的情况下是可行的。我向一些高人请教,他们多数认为直接平均带来的误差太大,建议使用校正平均。我就简介一下这种做法:首先,既然可以通过比值来消除干扰,那么A和B就应该有很好的同向性,即B大A也大,这样A/B才能相对稳定,才符合重复试验的特征(也许有人会提出,把A和B大小排序,对应相除。咋一听是很让人兴奋地,不过请不要忘了,

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功