沃登编辑医学论文中统计分析错误辨析与释疑_2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

·沃登编辑·医学论文中统计分析错误辨析与释疑定性资料统计分析方法的合理选择(2)一、误用χ2检验回答相关性问题例1:很多医学期刊论著中都采用χ2检验处理类似表1的资料,其目的是希望回答表中“两个有序变量之间是否呈相关关系”。表1不同期次矽肺患者肺门密度级别的人数分布(例数)矽肺期次肺门密度级别++++++合计Ⅰ4318814Ⅱ196Ⅲ合计492原文用χ2检验处理表1资料,得:χ2=163101,P01005,结论为:可认为肺门密度与矽肺期次有关,结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?对差错的辨析:因表1资料叫做“双向有序且属性不同的二维列联表资料”,对于这种资料的处理有3个不同的目的,因此,也就对应着3套不同的统计分析方法。原文作者分析此资料的目的是“希望考察表中两个有序变量之间是否呈相关关系”,而χ2检验是检验“表中两个定性变量之间是否互相独立”,当检验的结果为拒绝“独立性”假设时,其对立的假设不是“相关”,而应当是“各矽肺期次的患者在3种肺门密度级别上的人数分布是不同的”。原作者误认为用χ2检验拒绝了“独立性”假设后,其对立的假设一定是“相关”。事实上,从χ2检验的计算公式上不难看出,它与表中两个有序变量本身毫无关系,若将表中任何两行上的频数互换或将任何两列上的频数互换,它们所对应的χ2检验统计量的数值(本例为χ2=163101)是不会变化的。显然,变换后的数据已预示其结论要发生变化,而χ2检验的结果作者单位:100036首都医科大学继续教育学院(刘惠刚);军事医学科学院生物医学统计咨询中心(胡良平)却隐含着结论是不变的,这充分说明χ2检验用于处理由有序变量形成的二维列联表资料是不合适的。释疑:结合表1的标题可知,若一定要根据χ2检验的结果作出结论的话,其结论应当是针对各行上的“频数分布”是否相同来作出明确的回答,而绝对不应当针对表中两个有序变量之间是否呈“相关。要想对后者作出明确回答需要选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。就例1而言,若采用Spearman秩相关分析,得:rs=0153215,P010001,结论为:表中两个有序变量之间呈正相关关系,即随着矽肺期次的增加肺门密度级别也逐渐增大,两者之间的相关关系具有统计学意义。χ2有人可能提出质疑,检验的结果不也得出了P01005的统计学结论吗?若再具体计算其概率,很可能也会有P010001的统计学结论,因为本例χ2=163101相当大。一点不错,若根据χ2检验的结果,本例也的确可以得出P010001的统计学结论,但这纯粹是一种“巧合”,无论其概率多么小,其专业结论也只能回答表中各行上频数分布是否相同,而不能回答表中两个有序变量之间是否呈相关关系。若将表1资料换成表2资料,两种计算方法之间的差别一下就显现出来了。表2不同期次矽肺患者肺门密度级别的人数分布(例数)(假设数据)矽肺期次肺门密度级别++++++合计Ⅰ215678290Ⅱ989131229Ⅲ2481684420合计472324143939若统计分析的目的是考察表2中两个有序变量之间的相关关系是否具有统计学意义,则:其一,若采用错误的统计分析方法(即χ2检验),得:χ2=5031776,P010001,错误的专业结论为:矽肺期次与肺门密度级别之间的相关关系有统计学意义;与该检验方法对应的正确的专业结论为:表2中各行上肺门密度级别的人数分布不同,具体地说:矽肺Ⅰ期的患者多数肺门密度级别为“+”级、矽肺Ⅱ期的患者多数肺门密度级别为“++”级和“+++”级,而矽肺Ⅲ期的患者多数肺门密度级别为“+”级和“++”级。其二,若选用正确的统计分析方法(如Spearman秩相关分析),得:rs=0100059,P=019856,正确的专业结论为:表2中两个有序变量之间的相关关系没有统计学意义。例2:文献和很多医学期刊论著中都套用χ2检验处理类似表3的资料,计算所得的χ2=241639,P01005,得出的专业结论为“依沙酰胺治疗皮肤真菌的疗效与病程有关”的专业结论。试问:这样做错在哪?正确的统计分析方法和专业结论是什么?不满1月81111至3月合计24014649435对差错的辨析:表3看上去好象与表1不同,但本质是相同的,即也是双向有序且属性不同的二维列联表资料,若希望考察表3中两个有序变量之间的相关关系是否具有统计学意义,用χ2检验是错误的,宜选用定性资料的相关分析方法。释疑:若用Spearman秩相关分析,得:rs=-0121479,P010001,专业结论为:依沙酰胺治疗皮肤真菌的病程与疗效之间有负相关关系,即病程越长疗效越差,表3中两个有序变量之间的相关关系有统计学意义。对于表3资料,若希望考察不同病程的患者疗效之间的差别是否具有统计学意义,也是值得回答的问题。此时,就应将此表视为结果变量(即疗效)为有序变量的单向有序的二维列联表了,这实际上是不考虑原因变量(即病程)的有序性,而特别强调结果变量(即疗效)的有序性。为了实现此分析目的,可供选用的统计分析方法有:秩和检验、Ridit分析和有序变量的Logistic回归分析(较复杂,一般不选用此法)。本例若选用秩和检验,得:Hc=231144,P010001,专业结论为:各病程组患者的疗效之间的差别具有统计学意义,将各组秩和的平均值代入近似的t检验,进行两两比较,得结果为:设:1组为不满1个月、2组为1至3个月、3组为3个月至5年、4组为5年以上,则:对比组平均秩之差t值P值1组VS2组-0195801044014831组VS3组-5213753165501011组VS4组-5912263109301012组VS3组-5114172153501012组VS4组-5812672143401013组VS4组-618500139501347由于表3中的疗效由“痊愈到无效”,且计算时“痊愈”“档打分高,故各病程组的平档打分低,无效”均秩小者疗效较好,由此可知:病程不满1个月与1至3月的患者的疗效之间的差异无统计学意义;病程3个月至5年与5年以上的患者的疗效之间的差异无统计学意义;其他任何两种病程的患者的疗效之间的差异都有统计学意义,且病程短者疗效好。二、误用秩和检验取代χ2检验或Fisher精确检验例3:某研究者在其论文中运用秩和检验处理表4资料,选此方法处理该资料是错误的,这是为什么?分析此资料的正确统计分析方法是什么呢?表4CAM21和CD44s的表达与食管癌TNM分期的关系TNM分期nX/nHcPⅡa73/7Ⅱb108/10611191010134Ⅲ2321/23对差错的辨析:原作者将表4资料视为结果变量为有序变量的单向有序的二维列联表资料,因而错误地选用了秩和检验。事实上,食管癌TNM分期这个有序变量是“原因变量”,不是“结果变量”,不适合选用秩和检验处理此资料。释疑:那么,正确处理表4资料的统计分析方法究竟是什么呢?先将表4变成表5的形式,便可很容易认出它是一个什么样的二维列联表资料,因而,合理选用统计分析方法就显得是十分简单的事了。此时,不难看出:表5资料为结果变量为二值变量(即阳性、阴性)的二维列联表资料,虽然原因变量(即TNM分期)是有序的,但其本质与双向无序的二维列联表资料是一样的,故当表5中记录6个表5CAM21和CD44s的表达与食管癌TNM分期的关系(表4变形后的结果)(例数)食管癌TNM分期阳性阴性合计Ⅱa347Ⅱb8210Ⅲ21223合计32840观察频数的位置上小于5的理论频数的个数不超过总格子数的1/5(6/5=112)时,可以选用一般χ2检验处理此资料;反之,需要选用Fisher的精确检验法计算概率。本例“阴性”列3个格内的理论频数都小于5(占总格子数的1/2),故宜选用Fisher的精确检验处理此定性资料。本例Fisher精确检验的结果为:P=010172,专业结论为:TNM的3种分期的样有统计学意义,这个计算结果和结论对吗?表6子宫内膜癌样品中COX22与iNOS之间的关系(例数)COX22的分级iNOS分级:≤23~45合计≤211573~442814531610合计841931值的顺序,本例若将“COX22”按由上到下分别赋为“1、2、3”的值,将“iNOS”按从左至右分别赋为“1、2、3”的值,则计算结果就是正确的,即rs=-0109236,P=016212;若将这两个有序变量中的一个赋值方向弄反了,则计算结果为:rs=0109236,P=016212;若将这两个有序变量的赋值方向全部与前述第一种方向相反,那也没有关系,不会影响结论的正确性。(收稿日期:2003212208)(供稿编辑:李群)明显高于Ⅱa期表达的阳性率(注:总例数和各组例数都较少,结论的可信度较低)。三、定性资料等级相关分析的相关方向错误例4:某研究者对表6资料进行了Spearman秩相关分析,得到的结果为:rs=01601,P0105,得到的专业结论为:环氧合酶(COX22)含量与诱导型一氧化氮合酶(iNOS)含量之间存在的相关关系具全国肺功能和临床呼吸生理学术研讨会暨学习班征文通知由中华结核和呼吸杂志编委会主办、内蒙古医学院第三附属医院承办的“全国肺功能和临床呼吸生理学术研讨会暨学习班”定于2004年8月在包头市召开,欢迎有关医疗、技术、护理和医学工程等专业人员踊跃投稿并参加学术交流。届时也将邀请国内外知名专家举办专题报告。征文范围:(1)肺功能测定方法、技术及临床应用;(2)危重患者的呼吸功能与血气监测;(3)各种疾病相关呼吸病理生理的基础与临床研究;(4)肺功能测定新技术相关生物工程方面的研究与实践;(5)其他与呼吸生理暨病理生理、肺功能有关的基础与临床工作总结。征文要求:(1)4000字左右全文1份,并附1000字左右中文摘要,来稿请用4号字、1.5倍行距打印,同时附软盘;也可从网上投稿,注明“呼吸生理会议投稿”,E2mail:shangning@cma.org.cn。(2)所提交论文须未公开发表,作者、单位、通信地址及邮编书写完整,并附单位介绍信。(3)截稿日期:2004年5月10日(以邮戳为准)。来稿请寄:北京市东四西大街42号中华结核和呼吸杂志编辑部尚宁,邮编:100710。请在信封右上角注明“呼吸生理会议投稿”字样。沃登编辑为一家专注于生物医学领域的SCI论文服务公司。创建伊始我们就致力于为医学科研、临床医学和生物医学工作者提供SCI论文翻译、修改、润色、写作服务,并协助作者进行SCI论文发表。

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功