·沃登编辑·医学论文中统计分析错误辨析与释疑(24)———统计资料的表达与描述之三胡良平刘惠刚11用复式条图表达适合用线图表达的资料:例1原文题目:烟草对牙周成纤维细胞影响的实验“观察”图1尼古丁浓度对细胞生长和黏附的影响对差错的辨析与释疑:复式条图适合表达具有一个统计指标,两个分组因素的资料,横轴上先安排其中的一个分组因素,在其不同水平处再安排另一个因素。在本例中,第一个分组因素叫“尼古丁浓度”,第二个分组因素叫“系列(注:原作者在图中未将系列的含义表达清楚)”。通常这两个因素都是名义变量,而本例中,为一个连续性变“尼古丁浓度”量。原作者为了表达紫外吸收度与尼古丁浓度之间的变化趋势,用复式条图来表达资料就割裂了“浓度”之间的“连续性”。因而原作者所选用的统计图类型与资料类型不吻合,宜选用线图来表达资料。横轴上表示尼古丁浓度,纵轴上表示观察指标,“系列”是具有两个水平的分组因素,可根据其水平数在图中绘出两条折线。限于篇幅,修改后的结果从略。21用线图表达适合用复式条图表达的资料:例2原文题目:糖尿病牙周炎治疗后血清肿瘤坏死因“子α和糖化血红蛋白的变化”。其中一资料为15例2型糖尿病伴牙周炎患者,分别于牙周治疗前、后一定时间段内检测其血清肿瘤坏死因子α(TNF2α)的水平,原作者将其资料绘成了普通线图见图2。对差错的辨析与释疑:图2中“系列1”与“系列作者单位:100850北京军事医学科学院生物医学统计咨询中心(胡良平);首都医科大学继续教育学院(刘惠刚)图2牙周基础治疗前后血清TNF2α的变化2”的含义不清楚,从其正文所述内容推测,可能是指“治疗前与治疗后”或“治疗后与治疗前”。线图适合表达观察指标随时间变化的趋势,而本资料放置在横轴上的项目却是“病例编号”,它是一个名义变量,因而不适合用普通线图来表达该资料。若确实希望表达每位患者的数据,宜选用复式条图来表达,横轴上安排“病例编号”,纵轴上表示观察指标。限于篇幅,修改后的结果从略。31误用复式条图取代构成图:例3为了研究“下颌尖牙牙龄与腕骨骨龄的关系”,原作者用复式条图表达了5组处于3个不同时期的样本资料的内部构成情况,资料表达形式见图3。图35组处于3个不同时期的样本资料的构成情况对差错的辨析与释疑:图3中未将“5组”的具体含义表达清楚。在用相对数表达资料时,务必要明确:何时的相对数为“百分比(即构成比)”、何时的相对数为“百分率”。本例写的是构成比,而不是百分率。构成比的一个明显特点是属于同一整体的各项之和必须是10010%,但从图中所显示的数据计算,有些整体内部的百分比之和不等于10010%。如图3所示:有三组的数据之和分别是9915%(3010%+2710%+4215%)、9917%(010%+1010%+8917%)、10410%(1110%+3910%+5410%),这些错误可能是笔误所致。图3所表达的资料适合选用5组“构成图”来表达,也可以用5个圆图组成的复式圆图或用5个百分条图来表达,但确实不适合用复式条图来表达。41计算相对数的分母过小:例4原文题目:“口腔鳞癌中HPV16、18型感染和p53蛋白表达的检测研究”,资料见表1。表1HPV16、口腔鳞癌HPV阳性例数(%)P值组织分级Ⅰ级Ⅱ级Ⅲ级临床分期2512812(48100)7(58133)3(37150)0105Ⅰ期Ⅱ期Ⅲ、Ⅳ期部位1911157(36184)5(45145)11(73133)0105唇舌颊腭牙龈口底141164918(57114)6(54154)3(50100)1(1/4)4(44144)0(0/1)0105对差错的辨析与释疑:在表1中,计算相对数时分母太小,像百分率、构成比等相对数通常以100为基数,分母过小显得过分夸张,易失真,不但不能正确反映事实真相还往往会造成错觉。考虑到实际工作中各组样本含量很难都超过100,一般来说,如果各组观察例数小于20时不宜计算相对数,只给出各组的总数和发生某现象的例数即可。51平均与变异指标结合应用时常犯的错误:例5原文题目“:龈沟液蛋白质成分的电泳分析”,资料表达形式见表2。对差错的辨析与释疑:在表2中,带�符号的数据其标准差大于平均数。“x�±s”是用来表达呈正态分布定量资料的,说明其数据分布的集中趋势和离散程度。从表中所给的数据可看出,带�符号的数据其s大于x�,基本上可以认为这几组资料服从偏态分布,不适合用正态分布法说明这些资料的集中趋势和离散程度。描述偏态分布资料的集中趋势表2各蛋白质丰度及与临床指标的相关性(r)丰度临床指标分子量健康组龈炎组牙周炎组PLIBIPD0128±0132±0156±82000011001220155012101220139△0132±0118±0124±770000125011501130146±0156±1102±0127#0146△66000013701310184301520166�011301170132#0127±0131±0165±410000112012401483012201240152△0142±0154±1127±260000168�014111170126#01190151△210000123±0151±0188±0126#01230149△0107013001593120000142±1112±1187±01140127#0130#0131018611660120±0175±1185±1000001110180�11803注:3健康组与牙周炎组、龈炎组与牙周炎组之间丰度的差异有统计学意义(P0105);#蛋白质丰度与临床指标间的相关性有统计学意义(P0105);△蛋白质丰度与临床指标间的相关性有统计学意义(P01001);PLI=菌斑指数;BI=出血指数;PD=牙周袋探诊深度应该选用中位数,描述其离散程度应该选用四分位数间距,其形式为“M(QR)”,M代表中位数,QR代表四分位数间距,QR=Q3-Q1,由第3四分位数减第1四分位数算得(由于没有原始数据,不能做修改)。61用标准误表达资料的离散度大小具有一定的“:例6原文题目:欺骗性”“前方牵引器治疗骨性前牙反的研究”,资料表达形式见表3。表3治疗组与对照组上下颌骨、牙齿治疗或观察后变化的比较治疗组(后2前)对照组(后2前)测量项目t值P值均数标准误均数标准误SNA(度)11251132-01190159414701000SNB(度)-11690199112501851010501000ANB(度)31001107-115001891414901000MP2SN(度)21311151-11131169617901000A2NP(mm)31502175-11752185519301000Pg2Np(mm)-1156414411193159211501018ASN2PNS(mm3)100215101382113315601000ALFH(mm)5125112511192111714501000Is2CFH(mm)2106118601311177310501002Ms2FHp(mm)4150314211192183313501000对差错的辨析与释疑:在表3中,未明确标明各组的例数。用标准误表达治疗组与对照组各项定量指标处理后与处理前数据之差量的离散度大小(由正文可知各组样本含量n=20),仅根据表中“标准误”的数值不易看出哪些组中的数据偏离正态分布较远,当我们将其还原成标准差后就一目了然了。如:是一种经过变换以后的结果,若对照组中指标Pg2Np:s=3159×20≈161055是其算术平均值1119的1315倍。若未找到合适的变量变换方法,只能对照组中指标Is2CFH:s=1177×20≈71916用适合表达偏态资料的方法,即描述集中趋势用中位数,表达离散程度大小用四分位数间距。在于误用正态分布法表达明显呈偏态分布的资料,尤其是用“s�x”表达离散度大小时,通常情况下即使存在错误也很难被人们所发现,故笔者认为:用标准误表达定量资料的离散度大小具有一定的“欺骗性”。若资料不满足正态性要求,通常有两种对策:其一、作变量变换,看资料经某种变量变换(最常用的变量变换方法是取对数变换)后是否满足正态性考虑到“其平均值接近于零,即使差量服从正态分布,其标准差大于均数的可能性也是存在的,但一般来说标准差不会是均数的若干倍,更不会是十几倍,这提示上述资料的部分组中的数据呈明显偏态分布,而无论用“�x±s”还是用“�x±s�x”表达定量资料,都要求资料呈正态分布或至少呈对称分布。所以本例的错误沃登编辑为一家专注于生物医学领域的SCI论文服务公司。创建伊始我们就致力于为医学科研、临床医学和生物医学工作者提供SCI论文翻译、修改、润色、写作服务,并协助作者进行SCI论文发表。