1上海交通大学网络教育学院医学院分院医学统计学课程练习册第一章绪论一、单选题1.小概率事件是指P()B.P0.052.从一个数值变量资料的总体中抽样,产生抽样误差的原因是A总体中个体值存在差别3.调查中国放射科医生接触射线情况,全国放射科医生的全部组成为A.研究总体4.若以舒张压90mmHg、收缩压130mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:B.分类资料5.下列属于统计量的指标是C样本标准差6.调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:C定量资料7.下列属于参数的指标是D总体标准差8.用样本做统计推断,样本应是B.总体中有代表性一部分9.统计推断的内容为D.A和B均是10.随机调查社区2000人,得到平均体重为60公斤,则该资料属于A.计量资料二、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。2.总体:根据研究目的性质相同的观察单位的全体。3.分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。4.数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。三、问答题1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这2类资料一般有度量衡单位。计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。2.举例说明总体与样本的关系。总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。第二章定量数据的统计描述一、单选题1.若资料为偏态分布,最好计算下列哪个指标来衡量集中程度D中位数2.若资料为正态分布,最好计算下列哪个指标来衡量集中程度B算术均数3.对数正态分布资料计算集中趋势应该用A几何均数4.抗体滴度资料通常使用哪个集中趋势指标B几何均数5.平均数指标体系中不包括A全距6.抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算C算术均数7.样本标准差的的取值情况是A大于或等于零8.若资料为正态分布,最好计算下列哪个指标来衡量离散程度C标准差9.若资料为偏态分布,最好计算下列哪个指标来衡量离散程度()B四分位间距10.若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度()D四分位间距11.一组资料的例数等于25,方差等于16,标准差等于A412一组资料的标准差等于5,变异系数等于10%,样本均数等于B5013.标准差与算术均数的使用条件()B相同14.比较两组正态分布数据离散度大小的指标,如果单位不同该用()B变异系数315可以反映个体离散程度的指标不包括()C标准误16.表示()A总体方差17.一组资料的例数等于25,均数为20,标准差等于5,则方差等于()B2518.四分位间距的使用条件与哪个指标是一致的()A中位数19.四分位间距是指()DP25-P75二、名词解释1.几何均数:常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。2.中位数:一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。3.变异系数:变异系数(coefficientofvariance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。4.四分位间距:第75百分位数(P75)称为上四分位数QU,第25百分位数(P25)称为下四分位数QL,则四分位数间距(quartileinterval)Q=QU-QL。四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。三、计算题1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均数。1.2.6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数2.3.某医院调查30个乙肝表面抗原阳性患者抗体水平,求平均抗体水平抗体水平分布抗体水平1:101:1001:10001:100001:1000001.132101405.122...1265.125nXX89031.0lg632lg16lg8lg8lg4lg2lglg11G4人数4510923.平均抗体水平为1:10004.107名正常人尿铅含量分布,求平均尿铅含量尿铅(mg/l)例数f累计频数ΣfL累计频率(%)0~141413.14~223633.68~296560.712~188377.616~159891.620~610497.124~110598.128~2107100.04.四、问答题1.均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。2.标准差用于计量资料中正态或者近似正态分布的统计描述标准差的应用有四个方面:(1)表示个体变异的大小(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误3.变异系数与标准差的联系和区别是什么?1000)302100000lg910000lg101000lg5100lg410lg(lg)lg(lg11fXfG)/(41.1036210729482LmgfnfiLML5联系:变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100%得到。区别:在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。而变异系数可以用在以上两个条件任意一个不能满足的情况。第三章正态分布与医学参考值范围一、单选题1.正态分布条件理论上()D算术均数、中位数是一致的2.中位数特别适用于()D严重偏态分布资料3.频数分布中,如果集中位置趋向于数据较小的一端,叫做()C正偏态分布4.一组数据呈正态分布,其中大于SX96.1的变量有:()D97.5%5.一组数据呈正态分布,其中大于SX96.1的变量有:()B2.5%6.一组数据呈偏态分布,其双侧95%的参考值范围为:()BP2..5-P97.57.正态分布曲线的形态参数应该是()B方差8.对于临床上计算尿铅的95%正常值可用哪个百分位数表示()AP0—P959.标准正态分布曲线下(-1,1)之间的面积约为:()B68.27%10.偏态资料的医学参考值范围估计方法是()B百分位法11.一组身高资料和一组体重资料比较其离散度大小应该用哪个指标()D变异系数612.标准差表示:()B个体变异13.正态分布曲线下在均数加减一个标准差之间的面积大约占()B68%14.标准正态分布曲线的位置参数和形态参数分别是()A0和115.评价一个个体指标是否正常可以用()A医学参考值范围二、名词解释1.医学参考值范围:医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。三、问答题1.正态分布的特征是什么?正态分布有如下特征:①正态分布曲线在在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布上有两个参数:均数μ和标准差σ,均数μ是位置参数,决定正态曲线的中心位置,μ越大,曲线越向右移动;μ越小,曲线越向左移动,标准差σ是形状参数,决定正态分布曲线的陡峭或扁平程度,σ越小,表示数据越集中,曲线越陡峭,σ越大,表示数据越分散,曲线越扁平;④正态分布曲线下的面积分布有一定的规律。2.四分位数间距、标准差、变异系数各有何特点?(1)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度。(2)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度.(3)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选用恰当的方法估计参考值范围。四、计算题1.已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其7体温为36.8摄氏度,标准差为0.2摄氏度,问如果该地有一女子自述体温异常就医,测得其体温为37.5摄氏度,请问该女子的体温水平是否正常?1.2.调查某医院护士的年龄分布和收入状况,假设该人群的年龄和收入水平都呈正态分布。共调查了100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。(1)请比较该医院护士年龄和收入水平的离散程度。(2)如某护士年收入为1.8万元,请评价该收入水平是否属于正常范围。2.(1)故收入的变异大于年龄(2)3.某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm,其体均数为53.72kg,标准差为4.96kg。请比较何者变异度较大。3.4.调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。4.第四章定性数据的统计描述一、单选题1.已知男性的肝癌发病率高于女性,今欲比较甲、乙地的肝癌发病率,但甲地中高摄氏度,该女子体温偏-参考值范围为故体温收入的,192.37408.36%95)192.37408.36(2.096.18.3696.1sx常范围万,该护士收入属于正-参考值范围为故护士收入的56.464.1%95)56.4,64.1(196.16.396.1sx%69.14%1005.246.3CV%8.27%1006.31CV%98.2%10006.16695.4CV%23.9%10072.5396.4CVLgsx/39.13741.97%95)39.137,41.97(2.1096.14.11796.1-参考值范围为白的故该地健康女性血红蛋8女性多于男性,而乙地中男性多于女性,适当的比较方法是()D对性别进行标准化后再比