EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系统计学如何应用于科研?研究设计资料收集与加工统计分析结果解释与报告实验设计调查设计资料来源质量控制检错纠错数据预处理统计描述统计推断统计学结论专业结论撰写报告(包括论文)统计参与了科研的整个过程!EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系组别例数治疗前(±s)治疗后(±s)实验组(小剂量氨甲喋呤)3216.89±8.4611.81±4.18*对照组(安慰剂)2920.10±7.0216.10±3.87*P<0.05例1表1氨甲喋呤对哮喘患者外围血IL-2水平的影响xxEPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系原文中称采用随机化分配,但从上表可知,实验组32例,对照组仅29例;治疗前实验组IL-2活性水平为16.89±8.46,而对照组则为20.10±7.02。经t检验两组IL-2水平有差异,即在治疗前,两组IL-2水平不相同,不是来自同一总体。所以无法评价氨甲喋呤治疗后IL-2活性水平变化的影响。究其原因就是未严格随机化分配原则,识别方法就是对基线资料进行均衡性检验。EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系某人设计了4个组,每组用20只小鼠,观察定量指标的数值。第1组:空白对照组第2组:单用A药组第3组:A、B药联合使用组第4组:第3组的空白对照组此设计错在哪?这种安排在统计学上叫什么实验设计?例2EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例2的正确表达------------------------------------A药对应的分组结果----------------------------用否B药用否:不用使用------------------------------------不用空白组B药组使用A药组(A+B)药组------------------------------------这叫做两因素析因设计EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系为了观察甲紫注入某种动物正常腮腺后组织病理变化情况,有人选择6个月龄、体重2025kg的中国实验用小型猪15只,雄性9只、雌性6只。每只动物任选一侧腮腺为实验侧,另一侧作为正常对照,以消除个体差异及增龄对实验结果的影响。例3EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系注入药物后1周、2周、1个月、3个月及6个月将15只动物随机分为5组,每组3只(每个组的3只动物分别随机注入0.6ml、1.0ml及4.0ml1%某药物溶液),然后观察组织病理变化情况。实验设计错在哪?EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例4有人研究某地健康成人血清铁的正常值,选择了该地126名郊区农民献血员(其中部分献血员曾长期多次献血),于献血前取血样进行血清铁的测定,计算其平均值并将其平均值作为该地健康成人血清铁的正常值。EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系统计学如何应用于科研?研究设计资料收集与加工统计分析结果解释与报告实验设计调查设计资料来源质量控制检错纠错数据预处理统计描述统计推断统计学结论专业结论撰写报告(包括论文)统计参与了科研的整个过程!EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系•例5有人调查服用某减肥药物与某病的关联,采用病例对照研究方法,病例组当面询问其服药情况,但对照组用信函方法调查,结果见表1,OR=2,认为服某减肥药物和某病有关联。表2某病患者与对照服药情况比较暴露史病例组对照组合计服药400400800未服药250500750合计6509001550EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系表38例恶性滋养细胞肿瘤患者灌注治疗前后hcG值(pmol/L)病例号疗前值(x1)疗后值(x2)lgx1lgx2112800002100006.10725.322227550033004.87793.518531245022104.09523.3444415000009.36.17610.968551000025004.00003.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609例6EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系统计学如何应用于科研?研究设计资料收集与加工统计分析结果解释与报告实验设计调查设计资料来源质量控制检错纠错数据预处理统计描述统计推断统计学结论专业结论撰写报告(包括论文)统计参与了科研的整个过程!emphasisEPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系统计描述选用适宜的统计指标(和/或统计图/表)描述资料的特征统计推断用样本信息推断总体的特征统计分析参数估计:用样本信息估计总体参数的大小及其范围。假设检验:用样本信息比较多个总体参数或分布是否相同。总体样本sampling统计量参数inferenceEPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系统计描述选择指标统计表统计图μ//p…Xσ/SQ…EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系图12008-2012年沿淮某市乙肝发病率变化曲线例7EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系图22008-2012年沿淮某市乙肝各县区发病数构成例8EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例9EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例10表447份脑脊液荧抗法与培养法检验结果有学者进行一项研究,结论:两法的符合率83%,荧抗法假阳性率及假阴性率分别为14.9%、2.1%荧抗+培养+荧抗-培养-荧抗+培养-荧抗-培养+6337112.8%70.2%14.9%2.1%EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系荧抗培养+—合计+6713-13334合计74047表547份脑脊液荧抗法与培养法检验结果EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系数据类型分布特征背景知识体重坐高RBC数性别血型民族尿检、病情EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系常见数据类型•定量资料(数值变量资料)如:身高、体重、血压、血糖、RBC……•定性资料(分类变量资料)如:性别、民族、职业、血型……•等级资料(半定量资料)如:文化程度、尿检结果、疗效……EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系常见分布类型展示连续型变量资料(包括统计量)的分布正态分布泊松分布二项分布展示离散型变量资料的分布EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系对称分布、s表达和描述定量资料偏态分布M、Q表达和描述定性和等级资料:相对数或率xEPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例11表6两组褥疮愈合时间指数对比(±s)x组别愈合时间指数猪皮组1.34±2.63对照组0.75±1.47EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系应用相对数应注意的问题•计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,能够反映实际情况;观察单位过小,偶然性大,则可靠性差。一般要求观察单位数不小与30。•分析时不能以构成比代替率。•应注意不能用构成比的动态分析代替率的动态分析•在比较相对数时应注意可比性。影响率与构成比变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系表7甲醛灭菌处理6层以内缝线催化熏蒸的结果线轴种类(丝线型号)次数细菌培养阴性次数细菌培养阳性次数灭菌率(%)B(7)220100B(4)220100A(1)21150B(000)220100合计87187.3例12EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系率与比的区别•率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。•比(构成比):说明某一事物内部组成部分所占的比重。•率是动态变化的,与时间区间联系在一起,是动态发生变化者占原来全体的频率;构成比是反映点状态的比重构成,不反映时间区间内的变化过程。EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系•将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。•由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大小受到其他类别数量变化的影响,因而其应用有较大的局限性。•例如,我们不能由中性粒细胞比例的升高肯定患者有急性炎症,因为中性粒细胞百分比的升高也可以是由于淋巴细胞或其他类白细胞的数量减少所致。EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系•表8是某医院统计门诊沙眼病人年龄构成的数据。作者由此得出了20~岁组人口最易患沙眼的结论。表8某医院门诊沙眼病人的年龄构成年龄组(岁)沙眼人数%0~474.610~19819.320~33032.130~19819.340~12812.450~807.860~383.770~80.8合计1027100.0例13EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系•表9资料是假设的某地1995年和1997年疟疾发病人数资料,已知该地人口在两年中没有什么变动。表9各种疟疾的构成情况•从表中可以看到,1997年间日疟疾和三日疟的百分比都上升了,但由此得出间日疟和三日疟增多的结论,是否正确?*1995年1997年类别发病人数%发病人数%恶性疟6870.12142.0间日疟1212.41224.0三日疟1717.51734.0合计97100.050100.0例14EPIDEMIOLOGYANDHEALTHSTATISTICS1957卫安徽医科大学流行病与卫生统计学系例5表10两种方法治愈率的比较新疗法一般疗法组别治疗人数治愈人数治愈率(%)治疗人数治愈人数治愈率(%)成人423280704970儿童804050301240合计12072601006161例15EPIDEMIOLOGYANDHEALTHSTATISTICS19