山东大学公共卫生学院(2005——2006学年第二学期)2002级预防医学专业《卫生统计学》试题答案(A卷)一.简答题1、描述定量资料集中趋势的描常用指标有均数、几何均数、中位数等。①均数(mean,average):常用X表示样本均数,表示总体均数。a、直接法:样本含量较少时,其公式为:nXXXnXXn21b、加权法:用于频数表资料或样本中相同观察值较多时,其公式为:ffxfffxfxfxfxkkk212211适用范围:正态或近似正态分布的数值变量资料。②几何均数:用G表示。a、直接法:nnXXXG...21或)lg(lg)lg...lglg(lg1211nXnXXXGnb、加权法:)lg(lg....lg...lglg(lg12122111fXffffXfXfXfGkkk适用范围:①对数正态分布;②等比级数资料。③中位数:用M表示。a、直接法:n为奇数,2)1(nXM;n为偶数,)(21122nnXXM。b、频数表法:)2(LMfnfiLM式中:L、i、Mf分别为M所在组段的下限、组距和频数;Lf为小于L的各组段的累计频数。适用范围:①非正态分布资料(对数正态分布除外);②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。2、答案:假设检验中的第一类错误是指“拒绝了实际上成立的H0假设”时所犯的错误,当H0成立时犯第一类错误的概率等于检验水准。假设检验中的第二类错误是指“不拒绝实际上不成立的H0假设”时所犯的错误,其概率通常用表示,其大小与抽样误差大小及设定的检验水准有关。3、答案:(1)当n40且所有的T5时,用2x检验的基本公式,当p≈时,改用四格表的fisher确切概率法。(2)当n40但有15T时,用2x检验的校正公式或改用fisher确切概率法。(3)当n40或T1时,使用fisher确切概率法。4、答案:方差分析的基本思想是:将所有观察值的总变异按照研究目的和设计类型分解为若干部分,每个部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差引起的变异(用F值反映它们之间的关系),即可了解该因素对研究变量有无影响。应用条件:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等,即方差齐。5、答案:实验设计的基本要素包括:处理因素、受试对象、实验效应。实验设计的基本原则包括:对照的原则、随机的原则、重复的原则,均衡的原则。二、计算题1、答案:①n=120,x=418.0000,s=29.0000,96.12u95%正常成年女性红细胞数所在范围:00.2996.100.4182sux=(361.16,474.84)×104/mm3②已知:n=120,x=418.0000,s=29.0000,96.12u总体标准差未知,故用样本标准差29.0000代替总体标准差,得:95%可信区间为:120/00.2996.100.418/2nsux=(412.81,423.19)×104/mm32、答案:H0:差值的总体均数等于0H1:差值的总体均数不等于0α=0.0500n=10,7950.0d,5283.0ds,7587.410/5283.07950.0/nsdtd262.29,2t,可得P0.05,按α=0.0500水准拒绝H0,接受H1,故可认为两组的结果有差别.3、答案:(1)、先作散点图:10152025304050607080由散点图可知,存在直线趋势,可以进行回归分析。相关系数(r)=0.89628654(2)、求直线回归方程:92.15801263134761222nXXlXX96.2341225.22463177.12026nYXXYlXY47.431225.224141.4234222nYYlYY求回归系数和截距:1486.092.158096.234XXXYllb87.10XbYa故所求直线回归方程为XY1486.087.10ˆ。(3)、回归系数的假设检验:①方差分析Ho:总体回归系数等于0,即β=0H1:总体回归系数不等于0,即β≠0α=0.0500(双侧)nYYYYSS222总=43.47XXXYXYllblSS2回归=34.92回归总剩余SSSSSS=8.55剩回剩剩回回MSMSSSSSF//=40.85结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,可以认为回归方程成立。②回归系数t检验Ho:总体回归系数等于0,即β=0H1:总体回归系数不等于0,即β≠0α=0.0500(双侧)102122,3911.6nsbtbb查表得P=0.0001结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,可以认为回归方程成立。③相关系数的假设检验:Ho:总体相关系数等于0,即ρ=0H1:总体相关系数不等于0,即ρ≠08963.047.4392.158096.234YYXXXYlllr;102,3911.62102nnrrsrtr结论:经假设检验,得P=0.0001,按α=0.0500水准拒绝Ho,接受H1,故可认为自变量和因变量之间有直线关系.三、计算机实验A1.配对t检验:①建立假设:H0:μd=0H1:μd≠0α=0.05②计算统计量:t=-0.53P=0.6075③结论:P0.05,不拒绝H0,差异无统计学意义,尚不能认为该药对患者的白细胞数有影响。2.两组构成比比较:①建立假设:H0:脑血栓病人与健康人的血型分布构成相同H1:脑血栓病人与健康人的血型分布构成不同α=0.05②计算统计量:χ2=3.9412P=0.2679③结论:P0.05,不拒绝H0,差异无统计学意义,尚不能认为脑血栓病人与健康人的血型分布不同。3.单因素方差分析:①建立假设:H0:三组煤矿工人的肺活量总体均数相同H1:三组煤矿工人的肺活量总体均数不全相同α=0.05②计算统计量:方差分析表变异来源自由度SSMSFP组间29.26574.632884.540.0001组内281.53430.0548总3010.8000③结论:拒绝H0,接受H1,差异有统计学意义,认为三组煤矿工人的肺活量总体均数不全相同。(两两比较不作要求)经SNK法作两两比较:在α=0.05的水准上认为三组工人的肺活量各不相同4.先作统计描述:对照组:n=8均数=0.555标准差=0.2019肝硬化病人:n=7均数=1.517标准差=1.0111标准差相差悬殊,须作方差齐性检验:F=25.07P=0.0004认为方差不齐两样本均数比较t检验:①建立假设:H0:μ1=μ2H1:μ1≠μ2α=0.05②计算统计量:t’=2.47P=0.0456③结论:拒绝H0,接受H1,差异有统计学意义,可认为对照组和肝硬化病人的血浆肾素活性不同。5.直线相关回归分析:⑴相关分析:①建立假设:H0:ρ=0H1:ρ≠0α=0.05②计算统计量:r=0.8715P=0.0010③结论:P0.001,拒绝H0,接受H1,相关系数有统计学意义,可认为儿童的发硒与血硒有直线关系,且关系密切,可以建立回归方程。⑵回归分析:建立回归方程:y=0.23581x-6.9803回归系数假设检验:①建立假设:H0:β=0H1:β≠0α=0.05②计算统计量:方差分析表变异来源自由度SSMSFP回归175.648875.648825.270.0010剩余823.95122.9939总999.6000或t检验:t=5.03P=0.0010③结论:P0.001,拒绝H0,接受H1,回归系数有统计学意义,可用发硒测定值推测血硒含量。B1.三组样本率比较:①建立假设:H0:π1=π2=π3H1:三地污染率不全相同α=0.05②计算统计量:χ2=1.0888P=0.5802③结论:P0.05,不拒绝H0,差异无统计学意义,尚不能认为三地污染率有差别。2.先作统计描述:肝炎病人:n=10均数=2.324标准差=0.124健康人:n=10均数=2.732标准差=0.1077两样本均数比较t检验:方差齐性检验不作要求:F=1.33,P=0.6806①建立假设:H0:μ1=μ2H1:μ1≠μ2α=0.05②计算统计量:t=7.86p0.0001③结论:拒绝H0,接受H1,差异有统计学意义,可认为肝炎病人与健康人的血清转铁蛋白含量不同。3.随机区组设计方差分析:①建立假设:处理间H0:三种饲料增重相同H1:三种饲料增重不全相同区组间H0:六组小鼠增重相同H1:六组小鼠增重不全相同α=0.05②计算统计量:方差分析表变异来源自由度SSMSFP处理间2224.64112.322.250.1563区组间52478.65495.739.920.0012误差10499.7149.97总173203.00③结论:处理间P0.05,不拒绝H0,差异无统计学意义,尚不能认为三种饲料增重效果不同;区组间P0.05,拒绝H0,接受H1,差异有统计学意义,可认为六组小鼠增重不全相同。4.三组等级资料比较,秩和检验:①建立假设:H0:三种治疗方法疗效总体分布相同H1:三种治疗方法疗效总体分布不全相同α=0.05②计算统计量:K-W检验χ2=-67.81P0.0001③结论:拒绝H0,接受H1,差异有统计学意义,可认为三种方法疗效不全相同。5.绘制散点图发现其有曲线趋势,不存在直线关系。不同距离空气中氯化物浓度00.20.40.60.810100200300400500距离(m)浓度(mg/m3)C1.两样本率比较:①建立假设:H0:π1=π2H1:π1≠π2α=0.05②计算统计量:χ2=6.1331P=0.0133③结论:P0.05,拒绝H0,接受H1,差异有统计学意义,可认为两种药物的疗效不同。2.样本均数与总体均数比较:①建立假设:H0:μ=μ0H1:μ≠μ0α=0.05②计算统计量:t=7.00p0.0001③结论:拒绝H0,接受H1,差异有统计学意义,可认为慢性气管炎患者与正常人乙酰胆碱酯酶有差别。3.两组比较秩和检验:描述其平均水平:用中位数M1=3.5M2=2①建立假设:H0:两组小鼠肺癌转移病灶个数的总体分布相同H1:两组小鼠肺癌转移病灶个数的总体分布不同α=0.05②计算统计量:(Wilcoxon法比较):Z=2.0885P=0.0368③结论:拒绝H0,接受H1,差异有统计学意义,可认为两组小鼠肺癌转移病灶个数的总体分布不同。4.两因素方差分析:①建立假设:处理间H0:三种疗法效果相同H1:三种疗法效果不全相同区组间H0:八组患儿疗效相同H1:八组患儿疗效不全相同α=0.05②计算统计量:方差分析表变异来源自由度SSMSFP处理间291.7545.87512.950.0007区组间7260.666737.23810.510.0001误差1449.58333.5417总23402.0000③结论:处理间P0.05,拒绝H0,接受H1,差异有统计学意义,可认为三种疗法效果不全相同;区组间P0.05,拒绝H0,接受H1,差异有统计学意义,可认为八组患儿疗效不全相同。5.直线相关回归分析:⑴相关分析:①建立假设:H0:ρ=0H1:ρ≠0α=0.05②计算统计量:r=0.52554P=0.0793③结论:P0.05,不拒绝H0,相关系数无统计学意义,尚不能认为新生儿的体重和胃容量有直线关系。D1.先作统计描述:甲组:n=9均数=6.18标准差=1.15乙组:n=9均数=8.11标准差=1.57两样本均数比较t检验:方差齐性检验不作要求:F=1.87P=0.3962方差齐①建立假设:H0:μ1=μ2H1:μ1≠μ2α=0.05②计算统计量:t=2.98P=0.0089③结论:拒绝H