如何正确选择统计方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

如何正确选择统计方法资料类型设计方案实验分组检验条件表1单变量资料差异比较的分析方法小结资料类型数据特征单组设计完全随机设计配对或配伍设计两组多组两组多组定量资料正态、方差齐样本与总体均数比较的t检验两样本t检验单因素方差分析配对t检验随机区组设计方差分析非正态和/或方差不齐Wilcoxon符号秩和检验t’检验、Wilcoxon秩和检验Kruskal-WallisH秩和检验Wilcoxon符号秩和检验FriedmanM秩和检验定性资料无序二项分布直接计算概率法、正态近似法(Z检验)检验、Fisher确切概率法表资料检验、Fisher确切概率法配对四格表检验列联表配对检验有序____Wilcoxon秩和检验Kruskal-WallisH秩和检验Wilcoxon符号秩和检验RC22RR2211种形式的列联表2×2表有序(配对)无序(成组)2×C表有序无序R×2表有序无序多维列联表单向有序R×C表有序无序双向有序属性相同属性不同分组变量有序指标变量有序数据特征分析方法相关分析定量资料x、y服从双变量正态分布pearson直线相关分析x、y不服从双变量正态分布Spearman秩相关定性资料(表)双向无序检验,计算列联系数双向有序、属性不同Spearman秩相关、线性趋势检验双向有序、属性相同一致性检验(kappa系数的假设检验)回归分析应变量为连续型定量变量,服从正态分布一个应变量,一个自变量:直线回归分析一个应变量,多个自变量:多重线性回归分析应变量为定性变量Logistic回归分析应变量为含有截尾数据的生存时间Cox比例风险回归分析表2双变量(多变量)资料的关联性分析方法小结RC2二、计量资料分析常见的统计问题2.1忽视t检验的前提条件2.2误用成组设计资料的t检验分析配对设计资料2.3忽视方差分析的前提条件2.4误用t检验分析等级资料2.5误用t检验处理重复测量的两因素试验设计2.6误用配对设计资料的t检验处理单因素k(k3)水平设计的资料2.1忽视t检验的前提条件文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?辨析:1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。2.给出确切的统计量和P值。2.2误用成组设计资料的t检验分析配对设计资料辩析:1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。2.2误用成组设计资料的t检验分析配对设计资料2.3忽视方差分析的前提条件确切的统计量和P值文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:采用方差分析正确吗?均数±标准差??辨析:★此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P0.05,则进行多组均数间的多重比较。★给出确切的统计量和P值。2.3忽视方差分析的前提条件2.4误用t检验分析等级资料文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验表4两组临床主要症状和结肠镜肠粘膜病变评分()xs症状G1组(n=60)G2组(n=60)治疗前治疗后治疗前治疗后腹痛2.01+0.68※0.85+0.56△▲1.98+0.721.29+0.69△腹泻2.09+0.82※1.26+0.75△▲2.11+0.731.56+0.68△脓血便1.82+0.42※0.51+0.32△▲1.91+0.411.02+0.39△下坠感2.22+0.57※1.41+0.65△▲2.29+0.621.67+0.59△充血、水肿1.89+0.37※1.11+0.41△▲1.92+0.421.59+0.38△粘膜糜烂1.58+0.60※0.50+0.49△▲1.62+0.621.01+0.48△粘膜溃疡1.81+0.62※0.59+0.56△▲1.79+0.591.21+0.60△总评分15.76+3.11※6.87+3.08△▲15.98+2.988.87+3.21△※:与对照组(G2)比较,P0.05,组间差异无统计学意义;△:与治疗前比较,P0.05,组内差异有统计学意义;▲:与对照组(G2)比较,P0.05,组间差异有统计学意义;2.4误用t检验分析等级资料症状中医证候计分0分1分(+)2分(++)3分(+++)腹痛发作次数持续时间疼痛程度腹泻脓血便下坠感充血、水肿粘膜糜烂粘膜溃疡辨析:对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。与对照组(G2)比较,P0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。2.4误用t检验分析等级资料2.5误用t检验处理重复测量的两因素试验设计1文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。请问:统计分析方法选用t检验正确吗?2.5误用t检验处理重复测量的两因素试验设计2确切的统计量和P值。辨析:1.统计分析错误本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。2.5误用t检验处理重复测量的两因素试验设计2原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25%、50%、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。剂量(g/kg)峰面积(mW·ms)持续时间(s)爆发波个数0142.65±34.643.50±1.320.54±0.102.5337.74±250.918.82±2.781.06±0.345.0449.50±154.459.82±2.891.42±0.477.5651.08±98.2013.07±1.881.40±0.25表莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)2.6误用t检验处理单因素k(k3)设计的资料辨析:没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnettt检验或LSD检验。如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。2.6误用配对设计资料的t检验处理单因素k(k3)水平设计的资料3.1计算相对数时分母太小3.2误用χ2检验分析结果变量为有序变量的资料3.3误用χ2检验回答相关性问题3.4多值有序变量的高维列联表资料3.5不满足连续性χ2检验条件时未做校正3.6十一种形式的列联表3.7误用χ2检验取代Fisher精确检验3.8对R×C表直接分割进行两两比较三、计数资料分析方法的常见问题文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?3.1计算相对数时分母太小辨析:计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。确切的统计量和P值。3.2误用χ2检验分析结果变量为有序变量的资料•某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33,P0.01,认为两组疗效之间的差异有统计学意义。辨析:u本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。确切的统计量P值。3.3误用χ2检验回答相关性问题上述资料用χ2检验得:χ2=163.01,P0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?年龄冠状动脉硬化等级正常轻度中度高度50~431881424560~1967216970~6175578合计50301141492表不同年龄冠状动脉粥样硬化程度的分布辨析1:◈本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。◈作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。◈事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。3.3误用χ2检验回答相关性问题辨析2:☻欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。☻本例采用Spearman秩相关分析,得:rs=0.53215,P0.0001。☻结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。3.3误用χ2检验回答相关性问题3.5不满足连续性χ2检验条件时未做校正会得出完全相反的结论四、统计分析方法表述问题1辨析:从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功