医学论文中常用卫生统计学方法失当案例浅析宁夏疾病预防控制中心胡熊2011年5月修改稿卫生统计学,对医学工作者来说,是一门十分重要的专业科学和技能。现在有越来越多的卫生、医务工作者,把卫生统计学的基本理念与方法,运用到科学研究、实验检测和现场调查从设计到总结的全过程中。并在撰写论文时,运用卫生统汁学的方法对数据信息资料进行加工整理、统计处理和分析。笔者曾就历年来在为一些医学刊物审稿时发现的医学论文存在的常用卫生统计方法失当或不准确等问题,撰写了一篇文章发表于《宁夏医学杂志》2006年.28卷第8期。之后又搜集了一些预防医学论文,将其中存在的有关常用卫生统计方法使用不当的案例摘出,企望与作者及相关刊物的编者商榷。一、样本的代表性(样本与总体的关系)预防医学工作者进行现场调查或实验(试验)研究,往往都是抽样研究,而企图以此样本来阐述总体的特征。但在一些论文中,作者抽取的样本实际上不足以代表或说明总体。这一问题集中地反映在论文的标题上。即“帽子”过大,内容不足以代表!《银川市南郊9-11岁儿童口腔保健知识调查》样本仅为1所小学4年级115人。《宁夏农村卫生室服务现状调查结果及成因分析》样本仅为“我区经济条件居中的石嘴山市惠农区所有(5个乡26个村)村卫生室”《颅脑损伤与视力障碍》共收治153例颅脑损伤,其中一过性视力障碍24人,文章仅报道其中3例。《某医院2002-2004年环境监测结果分析》该文监测范围:某医院临床科室Ⅱ类环境:手术室、供应室、各种监护室、产房;Ⅲ类环境:治疗室、换药室、注射室、采血室。采样仅为关好门窗在无人走动情况下,分别用两种消毒方法后采集空气样本,细菌培养、菌落计数。(医院环境的总概念,环境监测的范畴)《中国大陆男男性接触者受教育程度与艾滋病高危行为的关系的研究》样本虽包括全国30个省区市,但其调查方法采用自填问卷方式。(调查对象会受文化程度限制及影响)《全球抗癫痫运动-宁夏农村癫痫流行病学调查》样本仅为吴忠市利通区杨马湖乡。(总(母)课题与分(子)课题的关系)《关于血压正常值的探讨》样本为50例18-22岁女学生左右臂血压对比。文章结论:左臂高于右臂的比例大于右臂高于左臂的比例,与全国常模相反。(血压个体差异大,正常值需大样本测得,仅50例,又分年龄组,样本太小)年龄左高于右左右相等右高于左合计1881110191341229207007212024合计3051550血压《孕妇弓形虫感染胎盘垂直传播状况的调查》.引自《中国公共卫生》.2006.22(1).12-13.调查对象:随机抽取大连市妇产医院2003年9月-2004年1月住院产妇93人,年龄为21-36岁。质疑:仅1个城市1所医院5个月(以秋冬季节为主)收治的产妇,此样本显然不足以代表“孕妇”这一庞大总体。《8-12岁男孩唾液性激素水平半追踪研究》.引自《中国公共卫生》.2003.19(1).14-16.研究对象:选取沈阳市沈河区3所小学8岁63人、10岁66人,共129名男孩,连续观察3年。质疑:仅1个城市的1个区中2个年龄组的男孩,如何能代表“8-12”岁男孩这一总体。《中国儿童铅中毒及其研究现状》.引自《中华流行病学杂志》.2005.26(9).649-650.研究对象:采取分层随机抽样法抽取全国15个城市的儿童。文章写道:“我们认为这次调查的结果是可靠的,能代表城市儿童的铅中毒现状。”在同期刊物就同一课题发表的另一篇文章的标题却是《中国15城市儿童血铅水平及影响因素现状调查》。质疑:城市和农村在造成铅污染的途径、方式和程度上,存在着极大的差异。遭受严重工业、交通等污染的城市儿童与数量更多的农村儿童相比较,肯定会存在较大的差异。城市儿童即使样本量再大,也不能反映农村儿童的现状。故以此作为“中国儿童”这一总体的代表,显然是不确切的。该刊物后一篇论文的标题就准确多了。二、统计学检验和推断在论文的第一部份即材料(对象)与方法中,许多作者往往只说明调查、观察、实验等方法,而不给出数据资料用什么卫生统计方法处理;或仅笼统地介绍使用某种统计软件,而不说明采用何种统计描述及统计推断方法;在论文的结果部分,许多作者往往仅列出概率P值的大小。因为在方法中未介绍统计推断方法及相应的统计量值,致使读者无从知晓P值由何得出。作者必需注意:不同的统计处理方法都有其适用的前提条件。《高浓度大剂量局部灌注给药治疗耐多药肺结核》.引自《中国防痨杂志》.2004.26(2).89-91.文章对象与方法栏中指出;统计学处理组间比较采用χ2检验和t检验。全文的观察指标为耐药病例数、痰检阴转率、病灶显著吸收率、并发症及不良反应病例数等,均为定性(分类变量)资料。质疑;定性资料是不可能采用t检验来进行统计学推断的。希望作者在方法介绍时,认真注明统计推断方法,给出具体计算结果,再配以相应的P值,以免读者对其结论心存疑虑。三、频数分布表的组段划分大样本的定量(数值变量)资料,首先要编制频数分布表。在频数分布表的组段划分,各组段上、下限的确定上,容易出现以下问题:《98例慢性头痛患者脑血流图特点及临床分析》该文文字描述98例的年龄分组为:30岁以下2例,31-40岁28例,41-50岁43例,51-60岁22例,60岁以上3例。在其列表中年龄组段划分则为<30、31、41、51、>60。(前者各组上、下限封口,后者仅为各年龄组而非年龄段)《中国18岁及以上人群血脂水平及分布特征》及《中国18岁及以上人群血脂异常流行特点研究》.均引自《中华预防医学杂志》.2005.39(5).302-310.该研究对象为49253名18岁及以上人群,属大样本。两篇文章的文字描述和绝大部分附表中,年龄段的划分均为18-44岁、45-59岁、≥60岁。而第二篇文章的表1则将年龄段标为18-、45-、≥60。质疑:组段划分以上述文章为例,如上、下限均标出,即上下封口,它的确切含义应该理解为18-44岁组,即刚满18岁到刚满44岁止,而45-59岁组,则为刚满45岁到刚满59岁止。那么44岁零几个月而又足45岁者应划在哪个组?而后文表1年龄分组的标记方式是正确的,只给出各组段的下限值(或上限值),在其后(前)划一“~”符号即可。《会宁县1998年麻疹爆发的流行病学调查分析》.引自《西北预防医学杂志》.2005.8(2).32-34.文中各年龄段的划记为:<1岁、1-4岁、5-8岁、9-12岁、13-15岁、>15岁。关于频数表各组段标记的案例还有许多,笔者不再一一例举。正确的方法上例已经交待了。四、算术平均数及标准差《新生儿黄疸血清总胆汁酸测定的临床意义》该文对新生儿黄疸之血清总胆汁酸(TBA)、总胆红素(TBil),直接胆红素(DBil)》,丙氨酸氨基转移酶(ALT)进行测定。注:*与对照组比较p<0.01,△与母乳组比较p<0.01各组黄疸新生儿TBA的比较(sx,μmol╱L)nTBATBilDBilALT生理性黄疸组426.62±6.68160.75±56.205.06±2.8522.16±5.66母乳性黄疸组5017.60±10.98*264.89±57.2610.28±4.1224.87±6.84病理性黄疸组12633.25±28.51*△258.59±62.1629.06±19.6428.47±6.02《毒鼠强中毒救治方法的临床研究》毒毒鼠鼠强强中中毒毒患患者者中中毒毒前前后后血血中中毒毒鼠鼠强强浓浓度度比比较较表表((㎎㎎//ll))n治疗前治疗后tp综合组2398.82±113.1361.73±52.911.3200.05丙戊酸钠组1492.00±33.6469.50±39.620.6570.05二巯丙磺酸钠组2699.18±65.1570.41±57.461.6420.05《宁夏农村卫生室服务现状调查结果及成因分析》该文调查内容之一为村卫生室面积、使用年限及间数(表中缺单位)(由于样本量小仅26个村卫生室,各指标离散程度大,其分布状态不详,故计算及S是不合适的。)面积使用年限房间数平均值56.557.103.00标准差35.026.371.62最小值24.001.001.00最大值200.0030.0010.00x53例糖尿病患者膳食纤维的摄入量调查》.引自《中华预防医学杂志》.2005.39(5).342-344.本文在方法中未说明使用何种统计处理方法。表中数据也未标明是哪一类集中与离散趋势指标,是否是。再者,表中平均值含义不清。表4.膳食纤维食物来源食物种类调查人数食物摄入量总膳食纤维粗粮4149.4±51.03.90±3.25细粮53183.0±68.94.39±2.83豆类3649.0±72.52.60±2.02蔬菜类53508.7±292.013.47±7.97水果类3592.1±90.72.16±1.66平均值26.5±9.8sx《不同种类燃料对室内空气质量的影响》.引自《中国公共卫生》.2003.19(2).196.表2.餐厅室内空气质量检测结果(纵横标目作了互换)种类mg/m3甲醛二氧化氮二氧化硫一氧化碳二氧化碳(%)可吸入颗粒物sx0.09±0.060.15±0.110.06±0.115.96±9.950.09±0.030.21±0.22质疑:计算算术平均数的前提条件应该是该数据资料的分布是正态分布或近似正态分布,在双侧情况下,算术平均数值应大于2.58×s。但上述各例中,s均偏大,有的甚至大于均数。可以判定这些资料不可能是正态分布或近似正态分布,不适宜以算术平均数及其标准差进行统计描述;因此在进一步做统计推计时也不具备进行F检验或t检验的前提条件。健康人群的生理、生化等指标,往往多呈正态分布;病理状态下则可能有所改变,而中毒事故造成的人体内和环境中毒物的浓度,一般情况下多为正偏态分布。统计教课书中对此类资料的描述或推断,都有相应的方法介绍(如几何均数、中位数及百分位数;非参数统计等)。作者在使用各种统计软件包时,不要忽略了计算各种指标的前提条件,否则会得出不准确的结果,从而导致不可靠甚至错误的结论。五、率与构成比《临沂市无脊灰证实后急性弛缓性麻痹病例监测质量评价》文章的结论中认为“报告病例的各县区分布不均衡,病例相对集中的趋势较大”。x兰山河东罗庄沂南郯城苍山牛县平邑蒙阴沂水莒南临沐发病数105381626615751011构成比8.204.102.456.5513.1121.314.9212.305.744.108.209.022000-2002年AFP病例地区分布质疑:因各县人口基数不同,故应计算各自的报告率,再以此进行比较,才能反映其真实发病强度。《255例传染病统计分析》前言中提及“为了摸清临沂市兰山区近年来传染病流行特征及其发病动态”。病例来源为该市某医院2001-2003年住院的传染病病例。该文结论是“3个区2个县收治病例,临沂市最高139例,占75.6%,其次为城乡结合部的患者32例,占12.5%,而边远山区仅为10例。表明城市居民患病率偏高”。(仅一所医院收治的病例,因无法计算患病率,故很难分析流行特征、动态;且结论数据均为构成比。)《西吉县2000-2005年麻疹流行病学分析》其中关于职业分布:3例为幼托儿童,占1.42%,80例为散居儿童,占37.73%,100例为学生,占47.17%,27例为农民,占12.72%。(以上数据均为构成比,不能代表各类人群的发病强度。应分别计算以上几类人群的患病率/发病率。)《某市某病检出阳性率》人口资料n=107男67女401岁401-岁343-岁33(分母不应用n=107,而应以各组例数为分母。)检出阳性数阳性率(%)1岁2321.5(57.5%)1-87.38(23.5%)3-1312.15(39.4%)男3028.14(44.8%)女1413.08(35.0%)《某医院抗生素使用情况》(第一个为率,后三个均为构成比;且未标明比例基数)数率数率数率数率2