第一章医学统计中的基本概念二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2.抽样中要求每一个样本应该具有哪三性?[参考答案]从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性:就是要求样本中的每一个个体必须符合总体的规定。(2)随机性:就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性:即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3.什么是两个样本之间的可比性?[参考答案]可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。第二章集中趋势的统计描述二、计算与分析1.现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。[参考答案]3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.254.26(mmol/L)10X4.28+4.434.36(mmol/L)2M2.某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:202165199234200213155168189170188168184147219174130183178174228156171199185195230232191210195165178172124150211177184149159149160142210142185146223176241164197174172189174173205224221184177161192181175178172136222113161131170138248153165182234161169221147209207164147210182183206209201149174253252156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数5P、25P、75P和95P。[参考答案](1)编制频数表:某地100例30-40岁健康男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110~222125~466140~111717155~163333170~276060185~127272200~138585215~79292230~59797245~3100100合计100——画直方图:051015202530110125140155170185200215230245胆固醇含量频数图某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:(110+7.5)2+(125+7.5)4+(245+7.53182.9(mg/dl)100X)501000.53317015179.4mg/dl27MP()从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数:51000.05212515136.25mg/dl 4P()251000.251715515162.5mg/dl16P()751000.757220015203.5mg/dl13P()951000.959223015239mg/dl5P()3.测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度滴度倒数正常人数肝癌病人数8711652321364321280125601[参考答案]肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果滴度倒数(X)正常人数(1f)肝癌病人数(2f)lgx1flgx2flgx8710.906.300.9016521.206.002.4032131.501.504.5064321.815.433.62128012.110.002.11256012.410.002.41合计1610-19.2315.941119.23lg15.9216G1215.94lg39.2610G正常人乙肝表面抗原(HBsAg)滴度为1:15.92肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26离散程度的统计描述二、计算与分析1.下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。表手术前后患者血催乳素浓度(ng/ml)例号血催乳素浓度术前术后12764128801103160028043246153981056266437500258176030095002151022092[参考答案]血催乳素浓度术前均值=672.4ng/ml,术后均值=127.2ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。术前:672.4X,564.65S564.65100%83.98%672.4CV术后:127.2X,101.27S101.27100%79.61%127.2CV可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2.某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?[参考答案]①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。下限:1.964.951.960.853.28XS(mol/L)上限:1.964.951.960.856.62XS(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28mmol/L~6.62mmol/L。②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布u值:5.724.950.910.85u问题转化为求u值大于0.91的概率。由于标准正态分布具有对称性,所以u值大于0.91的概率与u值小于-0.91的概率相同。查附表1得,()0.1814u,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。3.某地200例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。表某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量频数累积频数0.00~770.24~49560.48~451010.72~321330.96~281611.20~131741.44~141881.68~41921.92~41962.16~11972.40~21992.64~1200[参考答案](1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。某地200例正常成人血铅含量(μmol/L)的频数分布血铅含量组中值频数累积频数累积频率0.00~0.12773.50.24~0.36495628.00.48~0.604510150.50.72~0.843213366.50.96~1.082816180.51.20~1.321317487.01.44~1.561418894.01.68~1.80419296.01.92~2.04419698.02.16~2.28119798.52.40~2.52219999.52.64~2.761200100(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故95(2000.95188)1.680.241.80(μmol/L)4P即该地正常成人血铅值的95%参考值范围为小于1.80μmol/L。正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。某地200例正常成人血铅含量(μmol/L)均值和标准差计算表血铅含量组中值lg组中值(x)频数(f)fx2fx0.00~0.12-0.927-6.445.92480.24~0.36-0.4449-21.569.48640.48~0.60-0.2245-9.92.1780.72~0.84-0.0832-2.560.20480.96~1.080.03280.840.02521.20~1.320.12131.560.18721.44~1.560.19142.660.50541.68~1.800.2641.040.27041.92~2.040.3141.240.38442.16~2.280.3610.360.12962.40~2.520.4020.800.32002.64~2.760.4410.440.1936合计——200-31.5219.8098计算均值和标准差:31.520.1576200X219.8098(31.52)2000.27312001S单侧95%参考值范围:1.650.15761.650.27310.2930XS1lg(0.2930)1.96(mol/L)即该地正常成人血铅值的95%参考值范围为小于1.96μmol/L,与百分位数法相比两者相差不大。第四章抽样误差与假设检验二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。101.4X,1.5S,450n,1.50.07450XSSn95%可信区间为下限:/2.101.41.960.07101.26XXuS-(g/L)上限:/2.101.41.960.07101.54XXuS(g/L)即该地成年男子红细胞总体均数的95%可信区间为101