统计设计、统计方法与结果表述概论(医学卫生)陈建明2007.08课程目标•立足使用•了解统计在课题研究中的应用•了解统计结果的表述内容提要一、统计研究项目工作的基本步骤二、研究设计的基本内容、重要性三、研究设计的基本类型、要素、原则四、研究设计的误差控制与抽样方法五、统计方法基本知识六、样本量估计七、数据的组织与结果表达一、统计研究项目工作的基本步骤•研究设计•搜集资料•整理资料•分析资料•结果表达基本步骤设计资料搜集整理分析调查设计实验设计资料来源质量控制审核合理分组描述性统计统计推断搜集资料(datacollection)搜集资料要遵循准确、完整、及时三个原则。资料搜集计划包括:①选择搜集资料的地点、人员和时间;②搜集资料人员的培训方案;③预调查或预实验方案拟定;④资料的记录方式;⑤调查表的拟订和印刷;⑥调查或实验仪器、试剂的准备;⑦调查资料的抽样复核比例和方法;⑧搜集资料所需经费的准备等。一、统计研究项目工作的基本步骤•人员选择:高素质、有相关专业基础、以往曾有类似研究经历的人员加以严格培训和管理是能够遵循三原则的保证。•搜集资料的方式:直接观察、采访、填表和通信。直接观察、采访:调查人员亲自参与和记录,若调查人员素质高,工作认真负责,并接受过统一的培训,调查结果可靠。填表和通信由被调查者自己填写,若被调查者文化水平高,素质高,乐意配合调查,也可以得到可靠的资料,否则资料的误差较大。一、统计研究项目工作的基本步骤整理资料(datasorting)目的是将搜集到的原始资料系统化、条理化,便于进一步计算与分析。1.编码,将数据输入计算机2.纠错改错、补漏等一、统计研究项目工作的基本步骤分析资料(dataanalysis)根据研究设计的目的、要求,资料的类型和分布的特征等选择统计分析方法。1.统计描述:即计算统计指标,如平均值、发病率等,绘制统计图。2.统计推断:即可信区间估计与统计学假设检验•总体均数、总体率的可信区间及其假设检验•两个总体均数、总体率差值的可信区间及其假设检验•多个总体指标之间的假设检验。3.模型分析等。一、统计研究项目工作的基本步骤二、研究设计的基本内容、重要性(一)、设计研究基本内容•确定选题、研究目的•选择合适的研究对象和数量•科学分组、设立适当的对照•制定可靠的测量、观察指标•制定较好的原始记录表•选择科学的统计分析的方法二、研究设计的基本内容、重要性主要步骤:专业设计:选题、假说、文献准备、记录表、预实验、操作指导手册统计设计:研究对象(分组、设置对照、样本含量)、处理因素、观察指标、数据的质量控制与管理、统计分析方法二、研究设计的基本内容、重要性(二)、研究设计的重要性•科研设计是科研的灵魂•严密的设计是取得有价值结果的先决条件•从这个意义上说没有“设计”就没有科研。设计好:(1)既省又可靠(2)可估计和控制误差(3)获取多方面知识设计不好:(1)杂乱无章、虽多犹无(2)只能罗列现象、无规律可言二、研究设计的基本内容、重要性专业设计:选题、假说、文献准备、记录表、预实验、操作指导手册1、选题、确定研究目的:选题是科研的起点,体现设计和实施的指导思想。影响科研全过程,在科研中始终处于主导地位。•选题就是要正确地发现和提出问题(来自于实践和文献资料)•提出新问题、新假设比完成一项科研更难。没有好的假设,再好的科研方法也不会有好的成果。选题比科研方法更重要。•内容不能包罗万象,明确研究主题。对解决特定问题(主攻方向)心中有数,不能“逮着什么算什么”。•缺乏严格设计或无设计的研究,即使有重要的发现也属偶然。二、研究设计的基本内容、重要性专业设计:选题、假说、文献准备、记录表、预实验、操作指导手册2、预实验:在进行正式实验之前,先在少量的人群中作的一种小规模的实验,称为预实验。•进行预实验的目的:•检验实验设计的方案是否合理、可行,•发现存在的问题,便于及时修正和完善,从而尽可能地保证正式实验能如期、顺利地完成。•须注意的是,预实验与正式实验除了规模不同外,其余主、客观条件均应一致,否则,就失去预实验的意义了。二、研究设计的基本内容、重要性专业设计:选题、假说、文献准备、记录表、预实验、操作指导手册3、记录表、操作指导手册:充分考虑细节,对研究的质量控制器、消除偏倚和混杂都起着非常重要的作用。二、研究设计的基本内容、重要性统计设计:研究对象(分组、设置对照、样本含量)、处理因素、观察指标、数据的质量控制与管理、统计分析方法统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。二、研究设计的基本内容、重要性三、研究统计设计的基本类型、要素、原则•研究设计的基本类型•研究设计的基本要素•研究设计的基本原则(一)、研究设计的基本类型1.实验(Experiment)研究(干预)受试对象:人——临床试验动物——动物实验临床试验:治疗——临床疗效实验预防——社区干预实验2.调查(Survey)研究(无干预)被动地观察、如实记录三、研究统计设计的基本类型、要素、原则(二)、研究设计的基本要素•处理因素(treatmentfactor)•受试对象(subject)•实验效应(experimentaleffect)降压药高血压病人血压值处理因素受试对象实验效应其他因素其他效应三、研究统计设计的基本类型、要素、原则例:药剂、手术方法、毒物确定处理因素的注意事项:(1)抓住实验中的主要因素(2)明确处理因素和非处理因素病人对治疗的反应除了治疗因素外,还包括病人的心理状态、生产、生活条件及社会心理因素等。后者可称为非处理因素。(3)处理因素须标准化处理因素在整个试验过程中保持不变例如,不同时期的药物批号,手术操作者熟练程度。处理因素(treatmentfactor)三、研究统计设计的基本类型、要素、原则受试对象(subject)例:人、动物1.受试对象的选入标准明确规定受试对象选入标准(eligibilitycriteria):纳入标准(inclusioncriteria)、排除标准(exclusioncriteria)2.受试对象的控制(1)受试对象的一致性人——年龄、性别、病情、病程等动物——种系、年龄、性别、体重等(2)受试对象影响因素的控制季节、温度、湿度、生活环境、嗜好、试验辅助措施等。三、研究统计设计的基本类型、要素、原则实验效应(experimentaleffect)处理因素作用于受试对象的结果,通过观察指标表达。观察指标应客观、精确。1.客观性:主观指标和客观指标。2.精确性:准确度(accuracy)或真实性(validity):观察值与真实值的接近程度,受系统误差的影响。常用指标:灵敏度、特异度精密度(precision)或可靠性(reliabiliy)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。常用指标:Kappa值(一致性的检验)、一致百分率三、研究统计设计的基本类型、要素、原则准确度与精密度准确度和精密度都好准确度差、精密度好准确度?、精密度差准确度和精密度都差三、研究统计设计的基本类型、要素、原则(三)、实验设计的基本原则•随机化原则(randomization)•对照原则(control)•重复原则(replication)三、研究统计设计的基本类型、要素、原则随机化原则随机分组:每个受试对象以机会均等的原则被随机地分配到各个处理组中。随机抽样:总体中每一个观察单位以机会均等的可能性被抽取。1.随机化的意义(1)随机分组使两组样本在非处理因素方面尽可能一致,使处理因素产生的效应更加客观;(2)随机抽样使抽取的样本具有代表(总体)性,减少误差;(3)抽样研究理论和统计分析方法的需要。三、研究统计设计的基本类型、要素、原则随机与随意•随机:random机会均等,客观性•随意:aswill随主观意愿,主观性•随机化分组,不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素。三、研究统计设计的基本类型、要素、原则随机的三个含义•分组随机-均衡性每个研究对象有同等机会被分配到各处理组•抽样随机-代表性总体中每个观察个体有同等机会被抽取•实验顺序随机-平衡顺序或季节的影响每个研究对象先后接受处理的机会相同。三、研究统计设计的基本类型、要素、原则2.随机化的方法(1)抛硬币法“徽”与“字”(2)掷骰子法6面1~6点(3)抽签法(捻阄)(4)随机数字表法(随机数字法)(5)计算器(计算机)产生随机数三、研究统计设计的基本类型、要素、原则几种不同设计类型的随机化分组:(1)完全随机设计(2)配对实验设计(3)随机区组实验设计(4)交叉设计三、研究统计设计的基本类型、要素、原则完全随机设计•将观察单位完全随机地分配到实验组与对照组或几个对比组中去。•完全随机抽取样本进入实验。三、研究统计设计的基本类型、要素、原则编号随机数随机数排序10.09292120.37337630.478907840.7671741050.988251160.16218470.13187380.411285790.5756079100.99074712110.130592120.193945方法(1)编号:按动物体重依次编号为1,2,3,…,12号。(2)产生随机数字:对于每一个编号,依次由计算器(计算机)产生随机数(共12次)。(3)归组:事先规定将较小随机数的4只动物分入甲组,将较大随机数的4只动物分入丙组,其他4只动物分入乙组。三、研究统计设计的基本类型、要素、原则【例】将中的12头动物用随机方法分配到甲、乙、丙三组中配对实验设计(pairedexperimentdesign)配对实验设计的两种情况:1.同源配对:同一受试对象用两种不同的实验方法;受试对象自身实验前后的对比。2.非同源配对:将具有相同条件的实验对象配成对子。三、研究统计设计的基本类型、要素、原则【例】将已按近似条件配好的对子,用随机方法分配到实验组和对照组。方法(1)编号:进行对子编号,同时每个对子内的对象也分别编号。(2)产生随机数字:对于每一组合编号,依次由计算器(计算机)产生随机数。(3)归组(对子内对象的随机):事先规定每个对子内随机数字较小者分配到对照组;随机数字较大者分配到实验组。非同源配对随机化分组三、研究统计设计的基本类型、要素、原则对子编号地区对子内编号随机数组别1厦门10.0031763对照组1深圳20.9202597实验组2福州10.2445094对照组2广州20.9427992实验组3泉州10.6761737对照组3珠海20.7463667实验组4漳州10.4142279对照组4汕头20.8398076实验组5龙岩10.480219对照组5梅州20.7791807实验组6三明10.2415867对照组6肇庆20.8018122实验组7南平10.8156095实验组7河源20.2788566对照组8宁德10.987038实验组8茂名20.5443965对照组9莆田10.4477156对照组9江门20.8354603实验组随机区组实验设计(1)将多方面条件相近的受试对象配成一组,称作一个区组(block)。(2)每个区组的受试对象个数取决于对比组组数。(3)每个区组的受试对象被随机地分配到各对比组中。三、研究统计设计的基本类型、要素、原则区组编号区组内编号随机数区组内分组110.45355甲120.8047乙130.89871丁140.87764丙210.83579丙220.61839甲230.90212丁240.62258乙310.42427丙320.12236甲330.85204丁340.36042乙配对设计的扩展,故又称配伍组设计交叉设计(cross-overexperimentdesign)每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。同源配对设计的扩展优点:(1)控制个体间的差异,(2)减少受试者人数。三、