2003级预防医学《卫生统计学》试题答案(B卷)1.以样本均数与总体均数比较的t检验为例,说明假设检验中两类错误、、1和P的含义。假设检验中的第一类错误是指“拒绝了实际上成立的H0假设”时所犯的错误,当H0成立时犯第一类错误的概率等于检验水准。假设检验中的第二类错误是指“不拒绝实际上不成立的H0假设”时所犯的错误,其概率通常用表示,其大小与抽样误差大小及设定的检验水准有关。1为假设检验的检验效能,也就是两个总体确实有差别时检出该差别的能力;P为在H0假设成立时获得现有统计量或者更极端值得概率。应用t检验进行样本均数与总体均数比较时,H0为样本均数所代表的总体与已知总体为同一总体,如果当H0成立时,因为某种原因(抽样误差、样本含量、同质性不好等等原因)而造成抽样误差增大,则计算的t值较大且大于t界值,从而使得我们拒绝实际上成立的备择假设H0,而接受H1,认为该样本不是来自已知总体,即为假设检验中的第一类错误;相反,如果H0不成立时,即该样本不是来自该已知总体,但是因为某种原因造成由该样本计算的t值较小且小于t界值,从而使得我们不拒绝实际上不成立的备择假设H0,认为该样本是来自已知总体,即为假设检验中的第二类错误;2.总体均数可信区间与医学参考值范围有何不同?①涵义不同:均数的可信区间是按一定的概率100(1-α)%估计的总体均数所在的范围。95CI:理论上讲,进行100次抽样,可算得100个可信区间,平均有95个可信区间包括总体均数,只有5个可信区间不包括总体均数。医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的波动范围。如95%的参考值范围包括了95%的观察值,而有5%的观察值不在这一范围内。②计算公式不同:未知且n小时:),(,2,2XXstXstX未知n足够大时:XsuX2(,)2XsuX已知时:XuX2/(,)2/XuX正态分布:双侧界值:suX2,单侧上界:suX,或单侧下界:suX对数正态分布:双侧界值:)(lglg2lg1xxsuX;单侧上界:)(lglglg1xxsuX,或单侧下界:)(lglglg1xxsuX。偏态分布:双侧界值:5.2P和5.97P;单侧上界:95P,或单侧下界:5P。③用途不同:均数的可信区间用于估计总体均数。医学参考值范围用于判断观察对象的某项指标正常与否。3.完全随机设计多样本比较的分析思路(含主要公式)。根据资料类型及其分布特征,选用合适的分析方法。(一)数值变量资料1.小样本时①两样本来自正态分布总体且总体方差相等时,用成组设计的两样本均数比较的t检验;②两样本来自非正态总体或总体方差不等时,可通过变量变换使数据呈正态或方差齐后,再用成组设计的两样本均数比较的t检验;若仍达不到t检验的应用条件时,可选用't检验或成组设计的两样本比较的秩和检验。2.大样本时用成组设计的两样本均数比较的u检验。(二)分类变量资料1.两样本率的比较根据假设检验的应用条件,合理选用二项分布或Poisson分布资料的u检验、四格表资料的2检验、Fisher精确概率法。2.单向有序且属性不同资料的比较(1)若比较各样本的不同等级的疗效情况,可用秩和检验、Ridit分析、CPD分析、有序变量的logistic回归模型和有序变量的对数线型模型等。(2)若比较各样本的不同等级的构成情况,可用2检验。3.双向有序且属性不同资料的比较(1)若分析两变量是否存在线性相关关系时,可用等级相关分析或Pearson列联系数。(2)若分析两变量是否存在直线变化趋势时,可用线性趋势检验。4.2004年在某地随机抽取116名正常成年女子,其血清甘油三酯(mmol/L)测量结果如下表,请充分利用此资料进行分析。0.831.101.001.401.291.361.511.201.100.901.200.721.111.011.351.131.261.550.910.881.161.210.761.121.021.431.330.921.241.371.301.001.220.791.131.030.931.441.361.111.221.151.011.230.800.941.041.251.181.541.411.021.391.170.950.811.141.051.451.231.031.421.140.961.181.240.631.151.061.461.341.040.971.131.321.191.250.841.161.071.210.981.051.371.671.471.191.260.851.170.991.311.491.061.281.121.381.181.080.861.530.931.270.971.070.821.111.090.871.271.161.521.151.330.951.08答案:①该资料为数值变量,原始数据,且样本含量较大,需先编制频数表。组段频数0.6~10.7~30.8~90.9~131.0~191.1~251.2~181.3~131.4~91.5~51.6~1.71合计116②由频数表可见,该资料近似正态分布;宜用均数和标准差对其描述。16.111619.134ffXX(mmol/L)20.0115116/)10.134(8300.1591/)(222fffXfXs(mmol/L)③可用该资料估计该地正常成年女子血清甘油三酯总体均数的95%可信区间:因该资料样本含量较大,可用)96.1(XSX估计:)116/20.0(96.116.1),116/20.0(96.116.1(=则,该地正常成年女子血清甘油三酯总体均数的95%可信区间为(1.12,1.23)(mmol/L)。④可用该资料估计95%医学参考值范围,因血清甘油三酯过高、过低均为异常,故估计其双侧血清甘油三酯:)55.1,77.0()20.096.116.1,20.096.116.1()96.1,96.1(sXsX则,其95%医学参考值的下限为0.77mmol/L,上限为1.55mmol/L。5、某研究人员测定了12名健康妇女的年龄x(岁)和收缩压y(KPa),测量数据如表1;试对y与x之间的关系进行回归分析。编号123456789101112x(岁)594272366347554938426860y(KPa)19.6016.6721.2815.7319.8617.0719.9319.3315.3318.6720.1920.59答案:1、先作散点图:10152025304050607080有散点图可知,存在直线趋势,可以进行回归分析。相关系数(r)=0.896286542、求直线回归方程:92.15801263134761222nXXlXX96.2341225.22463177.12026nYXXYlXY47.431225.224141.4234222nYYlYY④求回归系数和截距:1486.092.158096.234XXXYllb87.10XbYa故所求直线回归方程为XY1486.087.10ˆ。3、回归系数的假设检验:①方差分析0H:总体回归系数等于0,即β=01H:总体回归系数不等于0,即β≠005.0双侧)nYYYYSS222总=43.47XXXYXYllblSS2回归=34.92回归总剩余SSSSSS=8.55剩回剩剩回回MSMSSSSSF//=40.85结论:经假设检验,得P=0.0001,按05.0水准拒绝Ho,接受H1,可以认为回归方程成立。②回归系数t检验0H:总体回归系数等于0,即β=01H:总体回归系数不等于0,即β≠005.0(双侧)102122,3911.6nsbtbb查表得P=0.0001结论:经假设检验,得P=0.0001,按05.0水准拒绝Ho,接受H1,可以认为回归方程成立。③相关系数的假设检验:0H:总体相关系数等于0,即ρ=01H:总体相关系数不等于0,即ρ≠08963.047.4392.158096.234YYXXXYlllr;102,3911.62102nnrrsrtr结论:经假设检验,得P=0.0001,按05.0水准拒绝0H,接受1H,故可认为自变量和因变量之间有直线关系.6、某医师研究A、B和C3种药物治疗肝炎的效果,将32只大白鼠感染肝炎后,按性别相同、体重接近的条件配成8个配伍组,然后将各配伍组中4只大白鼠随机分配到4个组。对照组不给药物,其余3组为实验组,分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表2。问4组大白鼠的血清谷丙转氨酶浓度是否相同?表24组大白鼠血清谷丙转氨酶浓度(IU/L)配伍组对照组实验组合计A药组B药组C药组1845.1652.4624.3445.12566.92834.7741.3772.3432.52780.83826.5675.6632.5362.72497.34812.8582.8473.6348.72217.95782.8491.8462.8345.92083.36745.6412.2431.8312.81902.47730.4494.6484.9296.32006.28684.3379.5380.7228.41672.9答案:1.建立检验假设,确定检验水准0H:四个处理组大鼠的血磷含量相同总体均数,3211H:四个处理组大鼠的血磷含量是否相同总体均数不等或不全相等,各i不等或不全相等0H:八个配伍组大鼠的血磷含量相同总体均数,1H:八个配伍组大鼠的血磷含量是否相同总体均数不等或不全相等,各i不等或不全相等05.02.计算统计量F值287.10628092CxSS总;7784.766562)(211CnxSSiijnjkij处理7597.244047)(2a1ib1jCnxSSiij配伍;749.52198配伍处理总误差SSSSSSSS311231--总n,3141a处理,7181b配伍,21)1)(1(ba误差926.255520处理MS,966.34863配伍MS,655.2485误差MS80.102/误差处理处理MSMSF;03.14/误差配伍配伍MSMSF表第六题的方差分析表变异来源SSMSFP总变异1062809.28731处理变异766562.77843255520.9261102.800.01配伍变异244047.7597734863.965714.030.01误差变异52198.749212485.655查F界值,得05.0P,按05.0检验水准拒绝0H,接受1H,可认为各处理组间及各配伍组间的差别均有统计学意义。7.某研究者为研究ADI药物预防肠道传染病的效果,欲在甲、乙幼儿园的大、中、小班共进行300名儿童的试验;已知两个幼儿园的规模、儿童的饮食、作息时间和体育活动完全相同,请写出试验设计方案。答案:根据研究内容及研究目的,可以用完全随机设计实现本研究;可以把所有受试者随机分为两组,一组应用药物,另一组应用安慰剂或者某种常规药物;分组方法可以按照300名儿童的学号编号后利用随机数字表或者随机排列表分为两组,也可以采用分层随机分组的方法,先按大、中、小班分层,然后把每一层的儿童再随机分为两组进行研究。