医学统计学方法常见错误分析统计分析思路先统计描述后统计学推断先单因素分析后多因素分析先计量资料后计数、等级资料一、统计描述中的常见错误:1.频数表分类变量与有序分类变量直接列表比较各类别频数分布的均匀性比较各组间分布形态的一致性数值变量最小值、最大值、分组数、组距、频数表观察频数分布的对称性比较两组分布的一致性2.统计量分类变量与有序分类变量构成比、率、比数值变量均数、标准差、最小值、最大值、中位数在资料的表达和描述中,常见的错误有:1.编制统计表时,分组标志(横标目)与观测指标(纵标目)位置颠倒、线条过多或过少、数字的小数点位数不一致或单位重复出现在数字之后,最严重的问题是表中数据的含义未表达清楚,令人费解。2.绘制统计图时,坐标轴上的刻度值标得不符合数学原则、资料与所选用的统计图类型不匹配。3.选用统计指标来描述平均水平和离散趋势时,使用正态分布方法表达呈偏态分布的资料;运用相对数来描述计数资料时,比与率混淆。表1两组褥疮愈合时间指数对比()组别愈合时间指数猪皮组1.34±2.63对照组0.75±1.47SX资料描述有无问题?应用相对数应注意的问题1.计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,一般要求观察单位数不小于30。2.分析时不能以构成比代替率。3.在比较相对数时应注意可比性。影响率与构成比变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。4.两个样本率比较时应该进行假设检验。率与比的区别率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。比(构成比):说明某一事物内部组成部分所占的比重。将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大小受到其他类别数量变化的影响,因而其应用有较大的局限性。表2是某医院统计门诊沙眼病人年龄构成的数据。作者由此得出了20~岁组人口最易患沙眼的结论。表2某医院门诊沙眼病人的年龄构成年龄组(岁)沙眼人数%0~474.610~19819.320~33032.130~19819.340~12812.450~807.860~383.770~80.8合计1027100.0表3两种方法治愈率的比较新疗法一般疗法组别治疗人数治愈人数治愈率(%)治疗人数治愈人数治愈率(%)成人423280704970儿童804050301240合计12072601006161需要标准化二、统计学推断常见错误单因素分析(处理因素为分类变量)(1)结果变量为数值变量:注意应用条件t检验或方差分析、秩和检验(2)结果变量为有序分类变量:秩和检验(3)结果变量为分类变量:卡方检验两个定性变量资料的统计分析R×C表资料2检验单向有序R×C表资料秩和检验双向有序且属性不同等级相关分析双相有序且属性相同Kappa检验1.t检验应用时常见的错误t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持。传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍。t检验方法简单,其结果便于解释。由于有些人对该方法理解不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。可大致概括为以下两种情况:1)不考虑t检验的应用前提,对两组的比较一律用t检验;2)对多组的资料的比较,多次用t检验进行均值之间的两两比较。实例:为确定老年人围手术期头孢唑啉钠的合理用法和用量,某研究小组对60岁以上与60岁以下者的头孢唑啉钠药物动力学特征分别进行了测量,并进行了比较,部分结果见表4。表4两组患者头孢唑啉钠药物动力学参数比较组别α(h-1)k10(h-1)60岁以上组(n=7)0.6213±0.11770.2856±0.042760岁以下组(n=5)3.5505±3.55530.8257±3.5329成组t检验的t值1.841.60P值0.050.05忽视t检验的前提条件。研究者依据P值认为两组在α,k10两项指标上差异无统计学意义。实例研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为4组,每组10只,雌雄各半,用药15d后测定E-玫瑰结形成率(%),结果如下,试比较各组总体均值之间的差别有无统计学意义?对照组:1410121613141210139党参组:21241817221918232018黄芪组:24202218172118221923淫羊藿组:35272329314035302836常见的错误做法是:重复运用成组设计资料的t检验对4个组的均值进行6次两两比较。而正确的做法是,先进行单因素4水平设计资料的方差分析,若4个总体均值之间的差别有统计学意义,再用q检验等方法进行多个均值之间的两两比较。实例:研究大豆黄酮对sp2/0肿瘤细胞DNA合成影响,在大豆黄酮组中,加入[3H]TdR后0.5h,1h,2h,4h分别测Cpm值。每次试验均设空白对照,每个大豆黄酮剂量均设一式3份,结果取平均值。数据均以平均值±标准差表示。表5大豆黄酮sp2/0肿瘤细胞DNA合成影响的时间-效应关系注:*P0.05,**P0.01时间(h)对照组(Cpm)大豆黄酮组(Cpm)抑制率(%)0.52973±5151737±583**41.613934±6333635±428*7.624623±9874313±783*6.744760±7335472±873*5.0结论:用t检验,P0.05为差异有统计学意义。大豆黄酮作用于肿瘤细胞后,其[3H]TdR掺入量随时间的延长而逐渐增加,但抑制率呈下降趋势。误用t检验分析重复测量设计资料对差错的分析随着时间的变化,肿瘤细胞数目的变化有较强的自相关性,而且又涉及两个影响因素,资料和设计类型都不满足t检验的要求,因此统计学处理结果不可信。释疑此例是一个具有重复测量的两因素设计资料,应采用相应的方差分析进行统计学处理。对重复测量数据进行方差分析常采用轮廓分析(profileanalysis),它可从总体特征上较快地得到反应变量随重复观测资料的组间轮廓性比较结果。2.R×C表资料2检验应用时注意的问题。表6某地6094人按两种血型系统划分的结果MN血型人数ABO血型MNMN合计O4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094R×C表资料:2检验表7三种药物疗效的观察结果单向有序R×C表资料:应该用秩和检验,常见的错误:对本资料进行了2检验。疗效药物无效好转显效痊愈合计A1549315100B49502285C115452485合计20738651270表8眼晶状体混浊度与年龄之关系双向有序且属性不同:等级相关分析晶状体混浊程度年龄++++++合计20~215674432630~1311016329540~148128132408合计4942962391029表9两法检查室壁收缩运动的符合情况冠心病人数对比法测定结果核素法:正常减弱异常合计正常582363减弱142750异常891734合计675327147双向有序且属性相同:Kappa检验2×k表中“0”频数过多,结果可靠性差。实例:A组20例经末梢静脉输注榄香稀乳均出现程度不同的局部刺激症状及静脉炎,而B组20例经锁骨下静脉穿刺置管输注均未出现任何局部刺激症状及静脉炎。见表10。表10两种处理下不同程度的局部刺激症状的频数分布情况不同分度的例数及百分比(%)组别00Ⅰ0Ⅱ0Ⅲ0Ⅳ0合计P末梢静脉A组04(20)9(45)6(25)1(5)200.001锁骨下静脉B组20(100)000020对差错的分析:本文末梢静脉组全部为Ⅰ0以上,而锁骨静脉组均为00,从原始资料的表达上看存在着下列问题:括号中有些百分比计算有误;若用上面2×5表描述资料,表中零频数过多,计算结果的可靠性较差。释疑将上表整理为表11。表11表10资料重新整理的结果检查四格表所具备的条件:此例n=40,且Tij5,故可用一般2检验。得:2=40.000组别00例数非00例数合计末梢静脉组02020锁骨下静脉组20020合计202040原作者未作任何统计处理,只是从其痊愈率上看治疗组大于对照组(73%55%),从而得出“治疗组的痊愈率明显高于对照组”的结论来。表12针灸偏历治疗网球肘116例与对照组比较组别例数痊愈(%)显效(%)好转(%)无效(%)治疗组11685(73)17(15)7(6)3(3)对照组4223(55)10(24)5(12)2(5)表13产次与新生儿低体重率原作者采用一般的2检验方法,得2=6.99,P0.05,结论为“不同产次的低体重发生率差异有统计学意义,第二产低体重率最低体重率最低,大于等于第三产低体重率及相对危险度上升”。产次活产数LBW例数百分率(%)RR199514954.971.08224581144.641.003204188.821.98差错分析该资料的2值仅仅说明总体上不同的产次间低体重发生率至少有两组间的差别有统计学意义,并不意味每两组间的差异都有统计学意义,要比较任何两种产次间的差别,应进行两两比较。解决方法需降低每次检验的检验水平数值,若α=0.05,可令α’=0.05/C,其中C等于比较的次数,本例C=3采用2分割法(要求分表的自由度等于总表的自由度、分表的2值之和等于总表的2值)进一步分析。3.四格表资料分析方法的选用标准。当总样本含量n≥40,且理论频数T均大于5时,一般的2检验。当总样本含量n≥40,但有理论频数满足1≤T5时,连续性校正的2检验。当总样本含量n40或有理论频数小于1时,Fisher的精确检验。表14不同分娩方式与重症肝炎孕妇的结局分娩方式例数存活死亡剖宫产981阴道分娩1349合计221210误用一般χ2检验取代Fisher精确检验,本例:P=0.011。007.0,249.72P1.区分统计“有统计学意义”与医学/临床/生物学“有实际意义”。统计“有统计学意义”对应于统计结论,医学/临床/生物学“有实际意义”对应于专业结论。假设检验是为各专业服务的,统计的结论必须和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。三、统计学结论注意事项:2.误解了“P0.01”与“P0.05”的真正含义。解释“P0.01”与“P0.05”含义时常犯的错误有些人在解释具有统计学意义的统计结果时,常根据P值是“0.05”还是“0.01”作出肯定程度不同的专业结论。例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P0.001”,则认为甲药极显著地优于乙药;若得到“P0.01”,则认为甲药非常显著地优于乙药;若得到“P0.05”,则认为甲药显著地优于乙药。差错分析统计学上根据假设检验原理推算出来的P值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间实际值差别的程度大小。3.统计检验结果不完善的表达方式。多种多样表达统计检验结果的方式:资料未经过任何统计处理,仅根据实际数据的大小,凭经验作出某组与另一组之间的差别有统计学意义的结论;作了统计处理,但未交代选用的是何种统计分析方法,仅给出P值;作了统计处理,也交代了所选用的统计分析方法,并给出了P值,但未给出统计量的具体值。释疑:所选用的统计分析方法;统计量的具体取值;假设检验的具体P值;有关总体参数的95%可信区间。4.关于多重线性回归的结果表达:常常采用一个表格将分析的结果进行总结归纳。表格中包括如下主要的统计量:偏回归系数的估计值、偏回归系数的标准误、标准偏回归系数、t值、P值,有时还包括偏回归系数的95%置信区间。方差分析结果和确定系数一般可作为备注列在表的下方。表15回归模型的参数估计结果Unstan