1《卫生统计学》模拟试题(A)一、简答题(每小题7分,共计70分)1.列举五个描述数值变量离散趋势的指标及其各自的适用条件。答:极差:描述数据分布的范围,极差越大,说明数据分布较分散。用于初步了解数据的特征,适应于样本量接近的同类资料相比较;四分位数间距:是从小到大排列后中间一段数据所在的范围,可以用于各种类型的连续型变量;方差:可用于不同样本含量数据分布离散程度的比较;标准差:同方差;变异系数:标准差与算术均数之比,常用于比较度量衡单位不同的多组资料的变异度和比较均数相差悬殊的多组资料的变异度。2.说明统计学检验中的P与的区别与联系。答:区别在于,为事先规定的检验水准,也是犯Ⅰ型错误的概率大小;P指从0H规定的总体随机抽得等于及大于(等于及小于)现有样本获得的检验统计量值的概率,是获得的事后概率。联系是,将P与大小进行比较而得出统计结论。3.常用的概率抽样方法有哪些?其中哪一种抽样方法的抽样误差最小?答:调查设计常用的抽样方法有单纯随机抽样、系统抽样、整群抽样、分层抽样。抽样误差最小的是分层抽样。4.标准化法的目的和基本思想是什么?答:当比较的两组或多组率时,其内部构成不同时,标准化的目的就是按统一的“标准”进行调整,使之具有可比性。5.何谓方差分析?其应用条件是什么?列出几种主要的设计类型?答:方差分析的基本思想是根据资料的设计类型,即变量的不同来源将全部的观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。6.对同一组资料的两变量回归分析,如果算出的b有统计学意义,那么两变量的r也有统计学意义,你认为这种观点是否正确?为什么?答:正确,同一资料的b和r的假设检验是等价的,b有统计学意义,那么r也有统计学意义。7.参数统计和非参数统计的主要区别是什么?答:参数统计与非参数统计的主要区别是:(1)资料要求不一样,参数统计要求样本来自总体分布已知,非参数统计对资料分布无特殊要求。(2)参数统计对总体参数进行估计和检验,非参数统计不对总体参数进行估计和检验。8.何谓抽样误差?用什么指标反映抽样误差?答:由于个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差。均数的标准误反映样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。9.在“用孕雌素制剂治疗老年良性前列腺肥大”研究中,用药物治疗12例良性2肥大,有7例改善;对照组有12例,仅3例改善。经检验高度显著(P=0.005)。故可以认为用孕雌素治疗老年良性前列腺肥大有效。请对此结论作出评价。答:由于例数小于40,所以应该用确切概率法。10.什么是截尾值?包括哪几种情况?答:由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点至截尾点所经历的时间,称为截尾值。二、计算分析题(共计30分)1.用两种方法检查已确诊为尿铅阳性的患者120名。湿式热消化法检出的阳性率为60%。硝酸-高锰酸钾冷消化法检出的阳性率为50%,两法同时检出的阳性率为35%。问:(1)该资料属于何种类型的资料?研究属于何种设计方案?(2分)(2)列出数据整理后的表格。(3分)(3)两种方法检出的结果是否有差别?(写出具体的分析步骤,可不计算出最终的结果)(10分)1、答:(1)该资料为计数资料,配对设计类型。(2)资料整理为下面的四格表:两种检测方法的结果比较硝酸-高锰酸钾冷消化法湿式热消化法合计+-+421860-303060合计7248120(3)用配对设计四格表2检验0H:两种方法的结果无差别1H:两种方法的结果有差别0.0522()(1830)218303,1bcbc查2界值表,20.053.84,P0.05,差异无统计学意义,尚不能认为两种方法的结果有差异。2.比较两种药物对红斑狼疮的治疗效果,资料如下:红斑狼疮的疗效结果例数A药B药痊愈4154显效3636进步2318无效56合计105114试问:3(1)该资料属何种类型?(1分)(2)该资料属何种设计?(2分)(3)两药的治疗效果有无差别?(写出具体的分析计算步骤,可不计算出最终的结果)(12分)2、答:(1)该资料的变量属等级资料类型。(2)该资料的设计属于成组设计类型。(3)要比较药物的疗效有无差别,由于是单向有序的资料,可以用成组设计两样本比较的秩和检验。建立检验假设,确定检验水准0H:两种药物的疗效无差别1H:两种药物的疗效有差别0.05编秩:两种药物的疗效比较结果例数合计秩次范围平均秩次秩和A组B组A组B组痊愈4154951~954819682592显效36367295~16713147164716进步231841168~20818843243384无效5611209~21921410701284合计1051142191207811976计算检验统计量检验统计量T=12078,这里需要用u检验。12/)1(5.02/)1(211NnnNnTu相同的秩次太多,还要进行校正。确定P值和得出推断结论查u界值表,若P≤0.05,差别有统计学意义,可以认为两种药物的疗效不同;若P0.05,差别无统计学意义,尚不能认为两种药物疗效不同。4《卫生统计学》模拟试题(B)一、简答题(每小题7分,共70分)1.简述描述定量变量的集中趋势的几种指标。答案:平均数表示方法计算方法意义适用条件均数μ,XXfXXnf平均数量水平单峰对称分布,特别是正态分布几何均数G11lglglglgXfXGnf平均增减倍数等比资料;对数正态分布中位数M12nMX(n为奇数时)12212nnMXX(n为偶数时)位次居中的观察值水平偏态分布;分布不明;分布末端有不确定值2.请说明1.96XS与1.96XXS的区别答案:1.96XS表示的是呈正态分布的变量的95%双侧参考值范围,即正常人群中95%的人该指标的取值范围。但是当原变量不服从正态分布,则不应用正态分布法估计参考值范围,而应用百分位数法;1.96XXS表示的是总体均数的95%双侧可信区间,即该可信区间有95%的可能性包括了真实的总体均数。并且,无论原变量服不服从正态分布,只要样本含量足够,则根据大数定理都是成立的。3.简述bXaY与bxay的区别?答案:回归直线bXaY是统计学上用来描述某变量随另一变量变化而变化依存关系的线形方程,其中ˆY是指X取某特定值时,总体均数ˆ/YX的一个估计值,所以ˆY与X不是一一对应的关系,是条件均数的关系。而bxay是线形函数,有严格的一一对应关系。4.有人认为“凡是均数间的比较,都需进行假设检验”,你同意这种说法吗?为什么?答案:如果资料收集采用的是抽样调查获得的样本数据,那么必须利用样本信息,通过假设检验的方法来推断两个样本所代表的总体间是否存在差别;但如果资料收集采用的是普查,那得到的就是研究总体的数据,此时就无需进行假设检验,而直接将总体参数进行比较即可。5.某医师对某试验所得的两组计量资料作秩和检验,其有关数据为n1=12,T1=68;n2=10,T2=78;则T为多少?相应的P值为多少?答案:(据n1、n2查两样本秩和检验的T界值表得T0.05=84-146,T0.01=76-154)。成组设计两样本比较的秩和检验,若两组例数不等,应以样本例数较小者对应的秩和为统计量T。本例中21nn,所以取278TT。查T界值表,若T值在界值范围内,其P值大于相应的概率,若T值等于界值或在界值范围外,其P值等于或小于相应的概率。所以0.010.05P。6.单因素方差分析变异分解中误差处理总=MSMSMS成立吗?为什么?5答案:不正确。方差分析的变异分解是对总变异进行分解,单因素方差分析可将总变异分解为组间变异和误差变异两部分,即SSSSSS总组间误差=+,而MS总、MS组间、MS误差分别为总均方、组间均方和误差均方,其之间并无上述的数学表达关系式。7.某药治疗糖尿病的临床试验结果经t检验得P0.05,按α=0.05水准拒绝H0。但某医生怀疑检验效能是否足够大,你认为这种怀疑对吗?简述其理由。答案:不正确。检验效能(1-β)是与Ⅱ型错误相联系,其统计学意义是若总体间确有差别,按现有的α水准能检出其差别的能力。即是在不拒绝0H的情况下才考虑检验效能是否足够的问题,本例中已经拒绝0H,已经检验出总体有差别,说明检验效能已经足够。8.某研究采用冷原子吸收法检测了某电子管工厂工人(汞接触组)的血汞浓度和普通人群(非接触组)的血汞浓度,得到以下结果:表1两组血汞结果的对比组别汞接触组非接触组n(例)4141血汞范围(ug/100ml)1.8~8.20.3~2.2中位数(ug/100ml)3.80.4795%上限(ug/100ml)7.391.79经成组设计两样本t检验得t=13.254,由t0.01,80=2.639,P0.01,表明两组血汞含量差异有统计学意义,以上分析正确吗?请从统计描述和统计推断两方面来说明并给出理由。答案:统计描述部分:根据常识,由于血汞不服从正态分布,多呈正偏态分布,因此应该使用中位数描述其集中趋势,用百分位数法来描述其95%频数范围,且血汞只有单侧上限,因此求解95%上限是正确的。统计推断部分:t检验的适用条件必须是服从正态分布的变量,而血汞呈偏态分布,因此采用t检验是错误的,应该采用成组设计的两样本Wilcoxon检验,或者对血汞对数值作成组设计两样本t检验。9.经调查得甲、乙两个城市女性的肺癌粗死亡率分别为45.6/10万和44.2/10万,按年龄构成标化后,两城市的肺癌标化率均为44.8/10万,请解释此现象及其原因。答案:造成此差异的原因是甲乙两城市的年龄构成不同。甲城市的肺癌粗死亡率经年龄标化后降低,而乙城市的肺癌粗死亡率经年龄标化后升高,说明甲城市的年龄构成较乙城市年轻,即甲城市年轻人比重大,而乙城市老年人比重大。10.为比较乳腺癌的A、B两种治疗方案的治疗效果,将60例乳腺癌患者随机分为两组,分别采用两种治疗方案治疗并随访,得到A方案的平均生存时间和标准差分别为86.67月、19.51月,B方案的平均生存时间和标准差分别为92.69月、20.75月,经t检验得2517.0,1577.1Pt,可以认为两种治疗方案的治疗效果无差异。该统计分析方法是否正确?为什么?答案:不正确。生存资料的特点是生存时间分布比较复杂,呈非正态分布,因此不应该用平均生存时间来描述其集中趋势,而应采用中位生存时间。且不能用t检验对两种方案乳腺癌病人的生存过程进行比较,应采用生存分析对病人的生存时间进行比较。6二、计算分析题(共30分)1.已知110名7岁男童身高cmScmX72.4,95.121,现欲估计该地身高界于112.70cm到129.70cm范围内的7岁男童比例及110名7岁男童中身高界于112.70~129.70cm范围的人数(写出具体的分析步骤,可不计算出最终的结果)(15分)答案:先作标准化变换。本题虽不知,的确切值,但由于110例是一个大样本,故可用样本均数和样本标准差作为,的估计,故:1112.70121.951.964.72u2129.70121.951.644.72u查标准正态分布表得:1()(1.96)0.025u,2()(1.64)0.95u21()()0.950.02592.5%uu故估计该地身高界于112.70~129.70cm范围内的7岁男童比例为92.5%;估计110名7岁男童中有11092.5%102名男童的身高界于112.70cm到129.70cm范围内。2.用两种方法检查已确诊为血铬阳性的患者300名。用FI