习题答案第一章一、是非题1.家庭中子女数是离散型的定量变量。答:对。2.同质个体之间的变异称为个体变异。答:对。3.学校对某个课程进行1次考试,可以理解为对学生掌握该课程知识的一次随机抽样。答:对。4.某医生用某个新药治疗了100名牛皮癣患者,其中55个人有效,则该药的有效率为55%。答:错。只能说该样本有效率为55%或称用此药总体有效率的样本估计值为55%。5.已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象,其患糖尿病的概率为8%。答:对,人群的患病率称为总体患病率。在该人群中随机抽取一个对象,每个对象均有相同的机会被抽中,抽到是糖尿病患者的概率为8%。二、选择题1.下列属于连续型变量的是A。A血压B职业C性别D民族2.某高校欲了解大学新生心理健康状况,随机选取了1000例大学新生调查,这1000例大学生新生调查问卷是A。A一份随机样本B研究总体C目标总体D个体3.某研究用X表示儿童在一年中患感冒的次数,共收集了1000人,请问:儿童在一年中患感冒次数的资料属于C。A连续型资料B有序分类资料C不具有分类的离散型资料D以上均不对4.下列描述中,不正确的是D。A总体中的个体具有同质性B总体中的个体大同小异C总体中的个体在同质的基础上有变异D如果个体间有变异那它们肯定不是来自同一总体5.用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得到该药的降糖有效率为85%的结论,请问降糖有效率是指D。A每治疗100个糖尿病患者,正好有85个人降糖有效,15个人降糖无效B每个接受该药物治疗的糖尿病患者,降糖有效的机会为85%C接受该药物治疗的糖尿病人群中,降糖有效的比例为85%D根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为85%三、简答题1.某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么?a)A药组的疗效高于B药组。b)A药的疗效高于B药。答:a)正确,因为就两组样本而言,的确A组疗效高于B组。b)不正确,因为样本的结果存在抽样误差,因此有可能人群的A药疗效高于B药,也可能人群的两药的疗效相同甚至人群B药的疗效高于A药,2.某校同一年级的A班和B班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么?a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。b)可以称A班的数学平均水平低于B班。答:a)正确,因为此处将A班和B班作为研究总体,故不存在抽样误差。b)不正确,因为这一次数学平均成绩只是两班数学成绩总体中的两个样本,样本的差异可能仅仅由抽样误差造成。3.在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300名哮喘儿童患者,随机分为试验组和对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期内采用激素喷雾剂+扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期内采用扩展气管药物。通过治疗3个月,以肺功能检查中的第1秒用力呼吸率(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案的有效性和安全性。请阐述这个研究中的总体和总体均数是什么?答:试验组的研究总体是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的FEV1/FRC1值的全体。对照组的研究总体是接受对照组治疗方案的全体哮喘儿童患者在治疗3个月时的FEV1/FRC1值的全体。试验组对应的总体均数是接受试验组治疗方案的全体哮喘儿童患者在治疗3个月时的FEV1/FRC1的平均值;对照组对应的总体均数是接受对照组治疗方案的全体哮喘儿童患者在治疗3个月时的FEV1/FRC1的平均值。4.请简述什么是小概率事件?对于一次随机抽样,能否认为小概率事件是不可能发生的?答:在统计学中,如果随机事件发生的概率小于或等于0.05,则通常可以认为是一个小概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机抽样中不会发生,这就是小概率事件原理。小概率事件原理是统计学检验的基础。5.变量的类型有哪几种?请举例说明,各有什么特点?答:(1)连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下,连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。观察连续型变量所得到的数据资料称为计量资料(measurementdata)。如例1-1中的身高变量就是连续型变量,身高资料为计量资料。.(2)离散型变量,变量的取值范围是有限个值或者为一个数列。离散型变量的取值情况可以分为具有分类性质的资料和不具有分类性质的资料,表示分类情况的离散型变量亦称分类变量(categoricalvariable)。观察分类变量所得到的资料称为分类资料(categoricaldata)。分类资料可以分为二分类资料和多分类资料,而多分类资料又分成无序分类资料和有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料(nominaldata)如血型可以分为A、B、AB和O型,有序多分类资料(ordinaldata)如病情指标分为无症状、轻度、中度和重度。第二章一、是非题1.不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。答:错。只有资料满足正态或近似正态分布时计算算术均数是比较有统计学意义的。2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其平均水平。答:对,可以采用中位数表示。3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。答:错,标准差S是绝对误差的一种度量,变异系数CV是相对误差的一种度量,对于两组资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论是不同的。在实际应用时,选择离散程度的指标时,考虑其结果是否有研究背景意义。例如:一组资料为成人的身高观察值,另一组资料为2岁幼儿的身高观察值,虽然可以用标准差S比较两组的离散程度,也不能认为这是错误的,但根本没有研究背景意义,相反选择变异系数CV比较两组资料的相对变异程度,这就有一定的研究背景意义。4.描述200人血压的分布,应绘制频数图。答:对。5.算术均数与中位数均不容易受极值的影响。答:错。算术均数比中位数容易受到极值的影响。二、选择题1.中位数是表示变量值A的指标。A.平均水平B.变化范围C.频数分布D.相互间差别大小2.对于最小组段无确定下限值和(或)最大组段无确定上限值的频数分布表资料,宜用下列哪些指标进行统计描述?C____A中位数,极差B中位数,四分位数间距C中位数,四分位数范围D中位数,标准差3.描述年龄(分8组)与疗效(有效率)的关系,应绘制A。A.线图B.圆图C.直方图D.百分条图4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为D。A频数B频率C频率密度(频率/组距)D都可以三、简答与分析题1.100名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。表2-12100名成年健康女子血清总蛋白含量(g/L)73.574.378.878.070.480.584.368.869.771.272.079.575.678.872.072.072.775.074.371.268.075.075.074.375.865.067.378.871.269.773.573.575.864.375.880.381.672.074.373.568.075.872.076.570.471.267.368.875.070.474.370.479.574.376.577.681.276.572.075.072.773.576.574.765.076.569.773.575.472.772.767.273.570.477.268.874.372.767.367.374.375.879.572.773.573.572.075.081.674.370.473.573.576.572.777.280.570.475.076.5答:制作频数表如下:_____________________________________________________________________组段频数百分比累积频数累积百分比____________________________________________________________________64~33.0033.0066~55.0088.0068~88.001616.0070~1111.002727.0072~2525.005252.0074~2424.007676.0076~1010.008686.0078~77.009393.0080~66.009999.0084~11.00100100.00变量例数均数标准差最小值最大值中位数25百分位数75百分位数x10073.73.92564.384.373.571.275.82.某医师测得300名正常人尿汞值(ng/L)如表2-15,试描述资料。表2-13300名正常人尿汞值(ng/L)尿汞例数累计例数累计百分数(%)0~494916.34~277625.38~5813444.712~5018461.316~4522976.320~2225183.724~1626789.028~1027792.332~728494.736~528996.340~529498.044~029498.048~329799.052~029799.056~229999.760~1300100.0合计300——答:根据资料给出统计描述的指标如下:例数均数标准差最小值最大值1615.05349.0142623.对于同一的非负样本资料,其算数均数一定大于等于几何均数。答:根据初等数学中的不等式1212nnnaaaaaan+++�≥�,可以得到算数均数一定大于等于几何均数。4.常用的描述集中趋势的指标有哪些,并简述其适用条件。答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。(3)中位数:适用各种类型的资料,尤其以下情况:A资料分布呈明显偏态;B资料一端或两端存在不确定数值(开口资料或无界资料);C资料分布不明。第三章一、是非题1.二项分布越接近Poisson分布时,也越接近正态分布。答:错。当二项分布的π不太接近0或者1,随着n的增大,nπ和n(1−π)均较大时,二项分布的X的逐渐近似正态分布;n较大,π较小,二项分布的X近似总体均数为μ=nπ的Poisson分布,只有n较大、π较小并且nπ较大时,二项分布的X既近似Poisson分布又近似正态分布,其本质是当n较大、π较小时二项分布的X所近似的Poisson分布在其总体均数μ=nπ较大时逼近正态分布。2.从同一新生儿总体(无限总体)中随机抽样200人,其中新生儿窒息人数服从二项分布。答:对。因为可以假定每个新生发生窒息的概率π是相同的并且相互独立,对于随机抽取200人,新生儿窒息人数X服从二项分布B(n,π)。3.在n趋向无穷大、总体比例π趋向于0,且nπ保持常数时的二项分布的极限分布是Poisson分布。答:对。这是二项分布的性质。4.某一放射物体,以一分钟为单位的放射性计数为50,40,30,30,10,如果以5分钟为时间单位,其标准差为1605。答:错。设iX服从总体均数为μ的Poisson分布,i=1,2,3,4,5,并且相互独立。根据Poisson分布的可加性,12345X+X+X+X+X服从总体均数为5μ,___________其总体方差为5μ,本题5分钟的总体方差5μ的估计值为50+40+30+30+10=160,所以其标准差为160。5.一个放射性物体一分钟脉冲数为20次,另一个放射性物体一分钟脉冲数为50次。假定