1练习题答案第一章医学统计中的基本概念练习题一、单向选择题1.医学统计学研究的对象是A.医学中的小概率事件B.各种类型的数据C.动物和人的本质D.疾病的预防与治疗E.有变异的医学事件2.用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3.下列观测结果属于等级资料的是A.收缩压测量值有单位的为定量资料B.脉搏数C.住院天数D.病情程度分类资料中的无序分类又称等级资料E.四种血型分类资料中的无序分类4.随机误差指的是A.测量不准引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.选择总体不当引起的误差E.由偶然因素引起的误差5.收集资料不可避免的误差是A.随机误差B.系统误差C.过失误差D.记录误差E.仪器故障误差答案:EEDEA二、简答题21.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2.抽样中要求每一个样本应该具有哪三性?[参考答案]从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性:就是要求样本中的每一个个体必须符合总体的规定。(2)随机性:就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性:即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3.什么是两个样本之间的可比性?[参考答案]3可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。(马斌荣)第二章集中趋势的统计描述练习题一、单项选择题1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A.中位数B.几何均数C.均数D.95P百分位数E.频数分布2.算术均数与中位数相比,其特点是A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.一组原始数据呈正偏态分布,其数据的特点是A.数值离散度较小B.数值离散度较大C.数值分布偏向较大一侧D.数值分布偏向较小一侧E.数值分布不均匀4.将一组计量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.形象描述数据的特点D.为了能够更精确地检验E.提供数据和描述数据的分布特征5.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B.几何均数4C.中位数D.百分位数E.倒数的均数答案:ABDEB二、计算与分析1.现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。[参考答案]3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.254.26(mmol/L)10X4.28+4.434.36(mmol/L)2M2.某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:202165199234200213155168189170188168184147219174130183178174228156171199185195230232191210195165178172124150211177184149159149160142210142185146223176241164197174172189174173205224221184177161192181175178172136222113161131170138248153165182234161169221147209207164147210182183206209201149174253252156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数5P、25P、75P和95P。[参考答案](1)编制频数表:某地100例30-40岁健康男子血清总胆固醇值的频数表5甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110~222125~466140~111717155~163333170~276060185~127272200~138585215~79292230~59797245~3100100合计100——画直方图:051015202530110125140155170185200215230245胆固醇含量频数图某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:(110+7.5)2+(125+7.5)4+(245+7.53182.9(mg/dl)100X)6501000.53317015179.4mg/dl27MP()从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数:51000.05212515136.25mg/dl 4P()251000.251715515162.5mg/dl16P()751000.757220015203.5mg/dl13P()951000.959223015239mg/dl5P()3.测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度滴度倒数正常人数肝癌病人数8711652321364321280125601[参考答案]肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果滴度倒数(X)正常人数(1f)肝癌病人数(2f)lgx1flgx2flgx8710.906.300.9016521.206.002.40732131.501.504.5064321.815.433.62128012.110.002.11256012.410.002.41合计1610-19.2315.941119.23lg15.9216G1215.94lg39.2610G正常人乙肝表面抗原(HBsAg)滴度为1:15.92肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26(李康)第三章离散程度的统计描述练习题一、单项选择题1.变异系数主要用于A.比较不同计量指标的变异程度B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽样误差的大小2.对于近似正态分布的资料,描述其变异程度应选用的指标是A.变异系数B.离均差平方和C.极差D.四分位数间距E.标准差3.某项指标95%医学参考值范围表示的是A.检测指标在此范围,判断“异常”正确的概率大于或等于95%B.检测指标在此范围,判断“正常”正确的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围8E.检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”4.应用百分位数法估计参考值范围的条件是A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A.全距B.标准差C.变异系数D.方差E.四分位数间距答案:AEDBE二、计算与分析1.下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。表手术前后患者血催乳素浓度(ng/ml)例号血催乳素浓度术前术后127641288011031600280432461539810562664375002581760300950021510220929[参考答案]血催乳素浓度术前均值=672.4ng/ml,术后均值=127.2ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。术前:672.4X,564.65S564.65100%83.98%672.4CV术后:127.2X,101.27S101.27100%79.61%127.2CV可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2.某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?[参考答案]①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。下限:1.964.951.960.853.28XS(mol/L)上限:1.964.951.960.856.62XS(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28mmol/L~6.62mmol/L。②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布u值:5.724.950.910.85u问题转化为求u值大于0.91的概率。由于标准正态分布具有对称性,所以u值大于0.91的概率与u值小于-0.91的概率相同。查附表1得,()0.1814u,所以10说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。3.某地200例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。表某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量频数累积频数0.00~770.24~49560.48~451010.72~321330.96~281611.20~131741.44~141881.68~41921.92~41962.16~11972.40~21992.64~1200[参考答案](1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量组中值频数累积频数累积频率0.00~0.12773