文献统计学错误分析班级:10预防一大班姓名:***学号:201004011一、误用完全随机设计资料的方差分析或t检验原文题目“重组vMIP—II对机体细胞免疫功能影响的初步研究”,为分析病毒巨噬细胞炎症蛋白vMIP—II对体外淋巴细胞培养上清细胞因子分泌水平的影响,实验共分四组:对照组、vMIP—II组、LSP(内毒素)和vMIP—II+LS组,观测不同时效对IL—12释放的影响结果见表2(表2为原表)。统计错误分析:误用t检验处理重复测量数据或析因设计的定量资料。此外,统计表栏目设计不够符合规范。重复测量数据是研究生实验中经常遇到的,用单因素方差分析或t检验处理重复测量数据是许多统计中常见的错误。本例的干预因素有两个(vMIP一II组和LSP组,分别均有用与不用两水平),测量时间有三个水平。由于本例各实验单位彼此不独立,因此正确的统计方法应该采用重复测量数据的多因素、多水平进行处理,而不能简单采用配对t检验。假如各实验单位是彼此独立的,则本实验设计就属于析因设计了,实验分组包括vMIP—II(用与不用)和LSP(用与不用),加上另一个实验因素“时间”,就成了“三因素析因设计”了。二、非平衡多因素组合实验中统计方法的误用原文题目“益骨胶囊对去卵巢大鼠松质骨显微结构的影响及定量研究”。该治疗实验部分将实验动物随机分为5组,分别为:假手术对照组、模型组、模型加益骨胶囊低剂量治疗组(即中药治疗低组)、模型加益骨胶囊高剂量治疗组(即中药治疗高组)、模型加强骨胶囊组(即阳性对照组),观测治疗作用对骨密度的影响,结果见表3统计错误分析:在医学实验中经常会涉及建立动物模型的问题,对于上表的资料,有很多作者会将其视为单因素多水平设计的定量资料,在进行统计分析时或采用t检验反复比较,或只是简单把上述资料合并进行完全随机设计资料方差分析。本例的动物建模实验中,“组别”所代表的因素属于“非平衡组合因素”_1J,表3中的“组别”并不是一种因素的多个水平,包含的内容既有是否建模,又有益骨胶囊的不同剂量,还有不同的药物(包括建模中的不服药,服益骨胶囊,服强骨胶囊)。在5个组中,并没有将上述诸多因素的各个水平的组合全部考虑进去。许多此类实验中,研究生都把建模加不同药物的各种实验组与对照组进行比较,这是毫无意义的,也是不符合专业知识的。组间非实验因素的均衡性相差很大时,是无法进行比较的。试问这样比较后得出的差异性到底是来源于建模本身还是来源于药物的疗效呢?正确的方法是根据研究目的,采用拆分法分成若干组进行,这样得出的结论才更加合理。上例可以分为以下四种组合:①假手术组与模型组的比较,属成组设计,可以反映建模“与否”之间的差异是否具有统计学意义。②模型组、中药治疗低组、阳性对照组的比较。③模型组、中药治疗高组、阳性对照组的比较。④模型组、中药治疗低组、中药治疗高组的比较。后三组属单因素3水平设计,可以分别反映建模基础上不加药物,加不同药物以及不加药物和加不同剂量的差异是否具有显著意义。统计分析上述各个组合时必须根据资料的性质采用相应的统计处理:如果资料满足正态性和方差齐性,上述第一个组合采用t检验,后三个组合可以采用方差分析处理。否则,应该使用非参数统计方法进行分析。三、数据不准确,样本大于总体王荣彬,刘洁华,孙明亮.等三种剂量尿激酶治疗急性心肌梗塞对比分析.临床荟萃,1992;7(11)515-516文中开篇明言“用三种剂量的尿激酶治疗急性心肌梗塞50倒”结果部分指出“再通率:大剂量组20侧患者中,再通率为2O%(12/60),3小时内用药者再通率为62.5%(518),6小时内用药者再通率为58.3%(7/12例)。中等剂量组2O例患者中,再通率25%(12/20),3小时内用药者再通率为778%(7/9),6小时内用药者再通率为545%(6/22)。两组对比无显著性差异(P0.05)”。从这段文字中我们可以看出如下错误:①计算不准确,12120应是60%,6/22应是273%而不是作者算得的25%和54.5%;②使用数据不准确,样本大于总体。“大剂量组再通率为2O%(12/60例)”中剂量组“6小时内用药者再通率为54.5%(6/22)”中60例和22例均大于样本所在的总体,违犯了样本不得大于总体的原则。如果按作者“大剂量组再通率为20%”计算,则2组间有显著差异,据下文推算,大剂量组的再通率为60%,(12120),而非作者的2O%(12/60)。③时间表示不科学,6小时内包括3小时在内,按作者的意思A文应表示为0~3h,-6h,这样就能准确表达作者的意思,也不会造成读者误解。四、对统计结果阐述推理不科学郭昌喜,农民急性心肌梗塞临床探讨,临床荟萃1992;7(11):521~522作者根据“65%是休息及一般活动中发病,真正睡眠中发病占27%”,就得出了“本组在安静和睡眠状态下发病仅占27%,而65%多在休息及一般活动中发病,与文献认为心肌梗塞多在安静或睡眠状态下发病不同。”的结论。这里我们可以看出如下错误:①偷换概念,前面27%的主词是真正睡眠,后面换成了“安静和睡眠状态”,使概念的外延扩大。②对安静的理解不正确,在这里安静应指睡眠以外的休息状态,作者统计时将休息与一般活动统计在一起.占65%,根据下文“在劳动中发病者仅3%,”(3%不足1^),最低应为3.85%或4%)可以得出本组病例多在睡眠、休息和一般活动中发病,与文献相符的结论。“高峰年龄在5O~60岁之问,占42%,但60~7O岁也占42%,…有高血压者仅占15%,有家族史者仅占4%,说明高血压及遗传在农民心肌梗塞发病是主要的”读者看不出50~60岁是高峰年龄,而6O~70岁不是高峰年龄,更不能同意4%(1例)遗传是心肌梗塞发病的主要因素,而不去考虑高脂血症、糖尿病等。在逻辑学上犯了推不出的错误,违犯了充足理由律。同样的错误尚有“农民心肌梗塞占62%”就得出“农民心肌梗塞日渐增多”的结论,“饮酒诱发心肌梗塞占8%,“就得出“饮酒与心肌梗塞关系不大的结论。在这里.62%和8%均是构成比,而非发病率,同样的发病率在经济条件好、交通方便、送院及时所占的梅成比就高。反之则低要想知道饮酒与心肌梗塞的关系,就得调查饮酒者心肌梗塞的发病率和非饮酒者心肌梗塞的发病率。