医学统计学四川大学华西公共卫生学院卫生统计学教授李晓松医学统计学(第二版)李晓松第一章绪论医学统计学(第二版)李晓松第一节医学统计学的地位和作用医学统计学(第二版)李晓松第一节医学统计学的地位和作用当研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?患者一组服用对照药一组服用新药观察疗效然后分析该新药的有效性和安全性医学统计学(第二版)李晓松统计学扮演什么角色?在这个“临床试验”中有诸多问题需要回答:需要多少名患者参加试验?如何将患者分为两个组?哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应?第一节医学统计学的地位和作用医学统计学(第二版)李晓松第一节医学统计学的地位和作用应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别?统计学将回答上述问题!医学统计学(第二版)李晓松第一节医学统计学的地位和作用另一种情形:为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。如何在这个城市选取这一部分个体?需要选取多少人进行调查?如何保证收集到的资料是准确和可靠的?如何评价这种准确性和可靠性?医学统计学(第二版)李晓松第一节医学统计学的地位和作用如何描述这部分人高血压病的患病状况?如何从这部分人推论到整个城市人群?对于这种推论的正确性抱有多大的信心?统计学也可以回答上述问题!医学统计学(第二版)李晓松每个人的血压都不一样,每个高血压病患者对同一种药物治疗的反应也存在着差别,这就是个体差异和不确定性。第一节医学统计学的地位和作用医学统计学(第二版)李晓松第一节医学统计学的地位和作用变异(variation):由于个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。个体差异是自然界普遍存在的现象。统计学将这种差异称为变异。变异同样条件下对同一个体进行重复观测结果具有不确定性医学统计学(第二版)李晓松第一节医学统计学的地位和作用WilliamOsler爵士曾指出“医学就是关于不确定性的科学和概率的艺术(Medicineisascienceofuncertaintyandanartofprobability)”。医学统计学(第二版)李晓松第一节医学统计学的地位和作用医学中充满了个体变异和不确定性。客观事物在数量上所表现出来的现象既受到本质规律的约束,又受到诸多偶然因素的影响。统计学正是分析数据中变异和不确定性的一门科学和艺术,它透过具有偶然性的现象来探测和揭示那些令人困惑的医学问题的特征和规律,对不确定性的数据作出科学推断。因此,统计学是认识客观世界的重要工作工具和手段。医学统计学(第二版)李晓松第一节医学统计学的地位和作用医学统计学:运用数理统计学的基本原理和方法来研究医学问题的一门学科,它包括了研究设计、数据收集、整理、分析以及分析结果的解释和表达。医学统计学?卫生统计学?生物统计学?医学统计学(第二版)李晓松第一节医学统计学的地位和作用医学统计学在医学科学研究中的地位和作用举足轻重由于研究设计、数据收集、统计分析、结果解释及结果报告任何一个环节的缺陷或错误,已经断送了许多先进的甚至非常前沿的医学研究成果,即使已经发表的研究成果也存在着大量的统计学缺陷或错误。现在,人们已逐步认识到统计学在医学和公共卫生科学研究中的极端重要性。医学统计学正日益彰显其蓬勃的生命力和广阔的应用空间。医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤在统计设计的基础上,对数据进行收集、整理和分析,并对分析结果进行正确解释和表达。统计设计是医学统计学的重要内容,也是统计工作的第一步和最关键的一步。医学统计学(第二版)李晓松一个常见和普遍的误解:“统计”就是分析数据第二节医学统计学基本内容和统计工作基本步骤医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤“做完实验后才找统计学家无异于请他作尸体解剖,他能做的全部事情就是告诉你这实验死于什么原因”。现代统计学奠基人之一、世界著名统计学家Fisher曾精辟指出医学统计学(第二版)李晓松没有科学严谨的统计设计,数据的收集以及分析常常是没有价值的。对于不准确或不可靠的数据,统计分析所得出的结论常常是站不住脚的,甚至是误导的。第二节医学统计学基本内容和统计工作基本步骤医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤医学科研的统计设计和统计分析是统计学不可分割的两个重要组成部分。医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤统计研究设计观察性研究(observationalstudy)实验性研究(experimentalstudy)临床试验(clinicaltrial)动物实验(animalexperiment)病例对照研究(case-controlstudy)队列研究(cohortstudy)社区干预试验(communityinterventiontrial)横断面调查(cross-sectionalsurvey)医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤不同研究设计所获得的数据,采用统计分析方法常常不同,而且所得研究结论也存在差异。医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤统计分析统计描述(statisticaldescription)统计推断(statisticalinference)参数估计假设检验医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤统计描述主要是运用一些统计指标诸如均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推断总体的问题。统计推断在一定置信度或概率保证下,根据样本信息去推断总体特征。医学统计学(第二版)李晓松第二节医学统计学基本内容和统计工作基本步骤参数估计:指用样本指标推断总体相应的指标如根据部分城市人群的原发性高血压患病率去估计整个城市的原发性高血压患病率。假设检验:指由样本之间的差异推断总体之间是否可能存在差异如原发性高血压治疗药物在两组的疗效存在一定差别,假设检验回答这种差别是机会造成的,还是真实存在的。医学统计学(第二版)李晓松第三节统计学的若干基本概念医学统计学(第二版)李晓松一总体与样本第三节统计学的若干基本概念医学统计学(第二版)李晓松总体(population):所有同质观察单位某种观察值(即变量值)的全体。样本(sample):总体中抽取部分观察单位的观测值的集合。注意观察单位间的同质性是构成总体的必备条件,也是进行研究的基本前提。第三节统计学的若干基本概念一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念一总体无限总体:指总体中的个体是无限的有限总体:指总体中的个体是有限的总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念注意总体中的“个体”(individual)在多数情形下是人,但也可以是其他个体。注意识别鉴别“个体”即基本单位到底是什么,在统计分析以及结果解释中都至关重要。一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念参数(parameter):总体的某些数值特征称为参数。统计量(statistic):根据样本算得的某些数值特征称为统计量。一总体与样本医学统计学(第二版)李晓松只有当样本代表了总体时,根据统计量所估计的参数才是准确的。因此,选择样本的方法至关重要。第三节统计学的若干基本概念一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念正确的方法就是采用客观的概率抽样方法选择样本。一总体与样本医学统计学(第二版)李晓松选择偏性将具有某一类特征的个体排除在样本之外所表现出的系统倾向性称为选择偏性。当存在选择偏性时,抽取一个更大的样本无助于统计推断。相反,它只是在一个更大的规模上去重复错误。第三节统计学的若干基本概念一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念概率抽样:每一个体都有同样的机会被选入样本,在理论上可计算出总体中任一个体被选入样本的机会大小。样本含量:样本包含的观察单位数称为样本含量或样本大小(samplesize)。抽样误差(samplingerror):即便采用概率抽样方法抽取样本,但毕竟样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念对于一次具体的概率抽样,抽样误差可能有多大?它对样本含量的依赖程度怎样?为了将抽样误差置于控制之下,样本含量需取多少?这时用统计量估计总体参数时,会达到怎样的接近程度?这些都是统计学中至关重要的问题一总体与样本医学统计学(第二版)李晓松第三节统计学的若干基本概念2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念变量(variable):观测单位的某种特征或属性变量值:变量的观测值就是所谓变量值数据或资料(data):具有若干变量值的观测单位所组成2二变量医学统计学(第二版)李晓松你年龄多大?——年龄什么学历?——学历结婚了吗?——婚姻状况有工作吗?——就业状况家里有多少人?——家庭人口数医学统计学(第二版)李晓松第三节统计学的若干基本概念定量变量有些问题的答案如年龄、家庭人口数是具体的数值,所对应的变量是定量的,称为定量变量。定性变量有些问题的答案如学历、婚姻状况和就业状况是用语言来描述的,对应的变量是定性的,称为定性变量。2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念变量定量变量定性变量有序分类变量无序分类变量连续变量离散变量2二二项分类变量多项分类变量变量医学统计学(第二版)李晓松第三节统计学的若干基本概念定量变量要么是连续的,要么是离散的连续变量如年龄就是一个连续变量,因为不同人的年龄差异在理论上可以任意地小。一般有度量衡单位。离散变量如家庭人口数就是一个离散变量,不同家庭的人口数可相差0、1、2等,在这些量之间不可能取其他量。2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念定性变量往往表现为互不相容的类别和属性有序分类变量:指其取值的各类别之间存在着程度上的差别,给人以“半定量”感觉,也称等级变量,如学历。二项分类变量:取值为相互对立的两类,如性别。多项分类变量:取值为互不相容的多个类别,如血型。2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念变量类型的区分在统计学中至关重要,它不仅决定了统计分析方法的选择,还与识别分析的基本单位有关、与分析结果的解释有关。2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念出于特定研究目的,不同类型变量间可以进行转换。一般从定量到半定量,再到定性(注意信息量将减少)。当然,为了对定性变量进行统计学处理,需要对其进行编码处理。2二变量医学统计学(第二版)李晓松第三节统计学的若干基本概念2三误差医学统计学(第二版)李晓松第三节统计学的若干基本概念误差(error)泛指实测值与真实值之差,一般可区分为随机误差和非随机误差两大类。2三误差医学统计学(第二版)李晓松随机误差是一类不恒定的、随机变化的误差,往往使实测值无方向性地围绕着某一数值左右波动。抽样误差即为随机误差,即由于随机抽样造成的实测值与真实值之差。随机误差在随机抽样和观测中是不可避免的,但一般遵从一定规律,可通过统计学方法进行分析。第三节统计学的若干基本概念2三误差医学统计学(第二版)李晓松第三节统计学的若干基本概念非随机误差最常见的非随机误差即系统误差