国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善卫生统计学卫生统计学卫生统计学卫生统计学国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善卫生统计学卫生统计学卫生统计学卫生统计学•运用概率论和数理统计的原理、方法运用概率论和数理统计的原理、方法运用概率论和数理统计的原理、方法运用概率论和数理统计的原理、方法•紧密结合紧密结合紧密结合紧密结合医学实践医学实践医学实践医学实践,,,,•研究医药卫生领域中资料的收集、整理、分析和研究医药卫生领域中资料的收集、整理、分析和研究医药卫生领域中资料的收集、整理、分析和研究医药卫生领域中资料的收集、整理、分析和推断的一门应用学科。推断的一门应用学科。推断的一门应用学科。推断的一门应用学科。国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善卫生统计学的内容卫生统计学的内容卫生统计学的内容卫生统计学的内容•1.1.1.1.基本原理和方法基本原理和方法基本原理和方法基本原理和方法•2.2.2.2.健康统计:人口统计、疾病统计和生长发育统健康统计:人口统计、疾病统计和生长发育统健康统计:人口统计、疾病统计和生长发育统健康统计:人口统计、疾病统计和生长发育统计计计计•3.3.3.3.卫生服务统计卫生服务统计卫生服务统计卫生服务统计国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善医学中的统计思维---百年发展•1834统计学的目标---数据搜集•1894Pearson现代统计教育Pearson和Galton的努力将其变为高级的应用数学学科,并用于解决医学、生物学问题•1903Lister预防医学研究所创建第一个统计系•统计在医学中的作用开始得到强调和认可强调医学艺术统计艺术强调个人经验科学证据国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善医学领域的应用•实验室研究---实验数据分析•临床研究---个体–临床试验---临床治疗的有效性和安全性临床用某种药物治疗缺铁性贫血的疗效甲:治疗10人,8人有效乙:治疗10人,4人有效–临床科研外科医生观察了50例肿瘤病人的术后生存情况(月):3,10,20,12,28,7,9……、–反应停事件:“医学专业判断”?国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善医学领域的应用•公共卫生---群体–流行病研究---吸烟与肺癌(Doll和Hill)–卫生服务---卫生资源需求和利用、医保改革–健康统计---医学人口、生长发育、疾病统计等•药学–药物筛选–药代动力学等国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善统计工作的基本步骤统计工作的基本步骤统计工作的基本步骤统计工作的基本步骤•第一步:设计,即制定调查研究和实(试)验研究第一步:设计,即制定调查研究和实(试)验研究第一步:设计,即制定调查研究和实(试)验研究第一步:设计,即制定调查研究和实(试)验研究的计划。的计划。的计划。的计划。•第二步:搜集资料,即取得准确可靠的原始资料第二步:搜集资料,即取得准确可靠的原始资料第二步:搜集资料,即取得准确可靠的原始资料第二步:搜集资料,即取得准确可靠的原始资料。。。。•第三步:整理资料,即对资料进行清第三步:整理资料,即对资料进行清第三步:整理资料,即对资料进行清第三步:整理资料,即对资料进行清理、理、理、理、差错并差错并差错并差错并加以存储。加以存储。加以存储。加以存储。•第四步:分析资料,即计算相应指标以反映研究对第四步:分析资料,即计算相应指标以反映研究对第四步:分析资料,即计算相应指标以反映研究对第四步:分析资料,即计算相应指标以反映研究对象的内在特征和规律。象的内在特征和规律。象的内在特征和规律。象的内在特征和规律。–统计描述和统计推断,由样本估计总体,由样本统计量估计总体参数;–阐明事物的内在联系和规律,合理呈现国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善基本概念基本概念基本概念基本概念•一、变量一、变量一、变量一、变量变异:变异:变异:变异:研究对象中各观察单位个体间的差异研究对象中各观察单位个体间的差异研究对象中各观察单位个体间的差异研究对象中各观察单位个体间的差异观察单位:观察单位:观察单位:观察单位:要研究的对象要研究的对象要研究的对象要研究的对象变量:变量:变量:变量:观察单位的某项特征观察单位的某项特征观察单位的某项特征观察单位的某项特征例:例:例:例:某地儿童的身高某地儿童的身高某地儿童的身高某地儿童的身高观察单位观察单位观察单位观察单位变量变量变量变量国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善•变量的分类变量的分类变量的分类变量的分类•(一)数值变量(一)数值变量(一)数值变量(一)数值变量定量的,有数值大小,通常有度量衡单位定量的,有数值大小,通常有度量衡单位定量的,有数值大小,通常有度量衡单位定量的,有数值大小,通常有度量衡单位如如如如血血血血压压压压身高身高身高身高等等等等•(二)分类变量(二)分类变量(二)分类变量(二)分类变量无序变量:如无序变量:如无序变量:如无序变量:如性别性别性别性别血型血型血型血型等等等等有序变量:如疗效结果:治愈、显效、有序变量:如疗效结果:治愈、显效、有序变量:如疗效结果:治愈、显效、有序变量:如疗效结果:治愈、显效、•(三)变量之间的转化(三)变量之间的转化(三)变量之间的转化(三)变量之间的转化国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善变量类型变量值表现实例资料类型数值变量定量(具体数值)身高(cmcmcmcm)计量资料分类变量无序二分类对立的两类属性性别(男,女)计数资料多分类不相容的多类属性血型(A,B,OA,B,OA,B,OA,B,O)有序多分类类间有程度差异的属性(又称等级资料)文化程度(初中、高中、大学............)卫生统计中的几种资料类型国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善二、同质与变异•同同同同质:指被研究指标(变量)的影响因素相同。质:指被研究指标(变量)的影响因素相同。质:指被研究指标(变量)的影响因素相同。质:指被研究指标(变量)的影响因素相同。•实际中只有相对的同质,如研究身高时对性别、地区实际中只有相对的同质,如研究身高时对性别、地区实际中只有相对的同质,如研究身高时对性别、地区实际中只有相对的同质,如研究身高时对性别、地区、年龄的控制。、年龄的控制。、年龄的控制。、年龄的控制。•变异:同质基础上的差异。变异:同质基础上的差异。变异:同质基础上的差异。变异:同质基础上的差异。国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善三、总体与样本三、总体与样本三、总体与样本三、总体与样本•((((1111)总体:根据研究目的确定的同质观察单位()总体:根据研究目的确定的同质观察单位()总体:根据研究目的确定的同质观察单位()总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。研究对象)的全体,实际上是某一变量值的集合。研究对象)的全体,实际上是某一变量值的集合。研究对象)的全体,实际上是某一变量值的集合。分为有限总体(观察单位数有限)和无限总体(观分为有限总体(观察单位数有限)和无限总体(观分为有限总体(观察单位数有限)和无限总体(观分为有限总体(观察单位数有限)和无限总体(观察单位数无限)两类。察单位数无限)两类。察单位数无限)两类。察单位数无限)两类。•((((2222)样本:是从总体中抽取的部分个体,个体数)样本:是从总体中抽取的部分个体,个体数)样本:是从总体中抽取的部分个体,个体数)样本:是从总体中抽取的部分个体,个体数的多少称样本含量或样本例数。由于直接研究总体的多少称样本含量或样本例数。由于直接研究总体的多少称样本含量或样本例数。由于直接研究总体的多少称样本含量或样本例数。由于直接研究总体经常是不可能的,故而大多采用抽样研究,即通过经常是不可能的,故而大多采用抽样研究,即通过经常是不可能的,故而大多采用抽样研究,即通过经常是不可能的,故而大多采用抽样研究,即通过抽取样本来推断总体,抽样研究就会有抽样误差,抽取样本来推断总体,抽样研究就会有抽样误差,抽取样本来推断总体,抽样研究就会有抽样误差,抽取样本来推断总体,抽样研究就会有抽样误差,即样本指标值与总体指标值总有差异。即样本指标值与总体指标值总有差异。即样本指标值与总体指标值总有差异。即样本指标值与总体指标值总有差异。国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善四、参数与统计量四、参数与统计量四、参数与统计量四、参数与统计量•参数:总体的指标称为参数参数:总体的指标称为参数参数:总体的指标称为参数参数:总体的指标称为参数•统计量:是根据样本变量计算出来的指标。统计量:是根据样本变量计算出来的指标。统计量:是根据样本变量计算出来的指标。统计量:是根据样本变量计算出来的指标。如总体均数、样本均数如总体均数、样本均数如总体均数、样本均数如总体均数、样本均数国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善五、五、五、五、频率与概率频率与概率频率与概率频率与概率•((((1111)频率:某种现象在样本中出现的比率,是样)频率:某种现象在样本中出现的比率,是样)频率:某种现象在样本中出现的比率,是样)频率:某种现象在样本中出现的比率,是样本特征。本特征。本特征。本特征。•((((2222)概率:随机事件发生可能性的数值度量,常)概率:随机事件发生可能性的数值度量,常)概率:随机事件发生可能性的数值度量,常)概率:随机事件发生可能性的数值度量,常用用用用PPPP表示,取值范围表示,取值范围表示,取值范围表示,取值范围0000≤≤≤≤PPPP≤≤≤≤1111,,,,是总体的特征。是总体的特征。是总体的特征。是总体的特征。• 特别的,小概率事件,特指发生概率特别的,小概率事件,特指发生概率特别的,小概率事件,特指发生概率特别的,小概率事件,特指发生概率PPPP≤≤≤≤0.050.050.050.05或或或或PPPP≤≤≤≤0.010.010.010.01的事件。的事件。的事件。的事件。国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善六、随机误差和系统误差六、随机误差和系统误差六、随机误差和系统误差六、随机误差和系统误差•随机误差包括:抽样误差和随机测量误差随机误差包括:抽样误差和随机测量误差随机误差包括:抽样误差和随机测量误差随机误差包括:抽样误差和随机测量误差–由抽样引起的差异称为抽样误差由抽样引起的差异称为抽样误差由抽样引起的差异称为抽样误差由抽样引起的差异称为抽样误差–抽样误差是不可避免的抽样误差是不可避免的抽样误差是不可避免的抽样误差是不可避免的–抽样误差是有规律的抽样误差是有规律的抽样误差是有规律的抽样误差是有规律的•系统误差:由确定原因引进的观察值和真值间的系统误差:由确定原因引进的观察值和真值间的系统误差:由确定原因引进的观察值和真值间的系统误差:由确定原因引进的观察值和真值间的偏差偏差偏差偏差–观察条件不同:仪器观察条件不同:仪器观察条件不同:仪器观察条件不同:仪器国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善总总总总体体体体样本随机抽样统计推断抽样误差参数(μ,σ)统计量(,ssss)XX国内唯一由医学院教授治理医学教育机构修身尊贤�至于至善练习练习练习练习试区分以下资料属于哪种类型?试区分以下资料属于哪种类型?试区分以下资料属于哪种类型?试区分以下资料属于哪种类型?• 1.1.1.1.某地一批人的血红蛋白值资料某地一批人的血红蛋白值资料某地一批人的血红蛋白值资料某地一批人的血红蛋白值资料• 比色法测得的具体值(如比色法测得的具体值(如比色法测得的具体值(如比色法测得的具体值(如135135135135g/Lg/Lg/Lg/L),),),),为何类为何类为何类为何类资料?现在就看答案资料?现在就看答案资料?现在就看答案资料?现在就看答案• 根据测得值进行分类(如根据测得值进行分类(如根据测得值进行分类(如根据测得值