第1章绪论1医学统计学主讲程琮TheteachingplanformedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege预防医学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程的教学及科研工作,每年听课学生500-800人。自2000年起连续六年,为硕士研究生开设《医学统计学》、《SPSS统计分析简明教程》、《卫生经济学》等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文30多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,,“行列相关的测度”等。主编、副主编各类教材及专著8部,代表作有《医学统计学》、《SPSS统计分析简明教程》获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。程琮教授简介医学统计学总目录第1章绪论第2章定量资料统计描述第3章总体均数的区间估计和假设检验第4章方差分析第5章定性资料的统计描述第6章总体率的区间估计和假设检验第7章二项分布与泊松分布第8章秩和检验第9章直线相关与回归第10章实验设计第11章调查设计第12章统计表与统计图第1章绪论目录第五节学习统计学应注意的几个问题第二节统计工作的基本步骤第三节统计资料的类型第四节统计学中的几个基本概念第一节医学统计学的定义和内容第一章绪论第一节医学统计学的定义和内容•医学统计学(medicalstatistics)---是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。医学研究的对象----主要是人以及与其健康有关的各种影响因素。医学统计学的主要内容:1.统计设计包括实验设计和调查设计,它可以合理地、科学地安排实验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠的结果。2.资料的统计描述和总体指标的估计通过计算各种统计指标和统计图表来描述资料的集中趋势、离散趋势和分布特征况(如正态分布或偏态分布);利用样本指标来估计总体指标的大小。3.假设检验是通过统计检验方法(如t检验、u检验、F检验、卡方检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。4.相关与回归医学中存在许多相互联系、相互制约的现象。如儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归来分析。5.多因素分析如多元回归、判别分析、聚类分析、正交设计分析、主成分分析、因子分析、logistic回归、Cox比例风险回归等,都是分析医学中多因素有效的方法(本书不涉及,请参考有关统计书籍)。这些方法计算复杂,大部分需借助计算机来完成。6.健康统计研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预测等方法医学统计工作可分为四个步骤:统计设计、搜集资料、整理资料和分析资料。这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误,都会影响统计结果的正确性。第二节统计工作的基本步骤设计(design)是统计工作的第一步,也是关键的一步,是对统计工作全过程的设想和计划安排。统计设计---就是根据研究目的确定试验因素、受试对象和观察指标,并在现有的客观条件下决定用什么方式和方法来获取原始资料,并对原始资料如何进行整理,以及整理后的资料应该计算什么统计指标和统计分析的预期结果如何等。一、统计设计搜集资料(collectionofdate)——是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。医学统计资料的来源主要有以下三个方面:1.统计报表统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。二、搜集资料2.医疗卫生工作记录如病历、医学检查记录、卫生监测记录等。3.专题调查或实验研究它是根据研究目的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科研资料的主要来源。整理资料(sortingdata)的目的就是将搜集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。整理资料的过程如下:1.审核:认真检查核对,保证资料的准确性和完整性。2.分组:归纳分组,分组方法有两种:①质量分组,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。②数量分组,即将观察单位按其数值的大小分组,如按年龄的大小、药物剂量的大小等分组。三、整理资料3.汇总:分组后的资料要按照设计的要求进行汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。四、分析资料•分析资料(analysisofdata)——是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。1.统计描述(descriptivestatistics)将计算出的统计指标与统计表、统计图相结合,全面描述资料的数量特征及分布规律。2.统计推断(inferentialstatistics)使用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假设检验,以达到了解总体的数量特征及其分布规律,才是最终的研究目的。统计分析包括以下两大内容:医学统计资料按研究指标的性质一般分为定量资料、定性资料和等级资料三大类。一、定量资料定量资料(quantitativedata)亦称计量资料(measurementdata),是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa)等为数值变量,其组成的资料为定量资料。第三节统计资料的类型定性资料(qualitativedata)亦称计数资料(enumerationdata)或分类资料(categoricaldata),是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称定性资料。定性资料的观察指标为分类变量(categoricalvariable)。如人的性别按男、女分组;化验结果按阳性、阴性分组;动物实验按生存、死亡分组;调查某人群的血型按A、B、O、AB分组等,观察单位出现的结果为分类变量,分类变量没有量的差别,只有质的不同,其组成的资料为定性资料。二、定性资料三、等级资料等级资料(rankeddata)亦称有序分类资料(ordinalcategoricaldata),是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。如治疗结果分为治愈、显效、好转、无效四个等级。根据需要,各类变量可以互相转化。若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。如调查某人群的尿糖的情况,以人为观察单位,结果可分—、±、+、++、+++五个等级。同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。第四节统计学中的几个基本概念一、同质与变异二、总体与样本样本(sample):是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本含量(samplesize)。注意:1。总体是相对的,总体的大小是根据研究目的而确定的。2。样本应有代表性,即应该随机抽样并有足够的样本含量。图示:总体与样本populationsample2sample1sample3sample4sample5三、参数与统计量参数(parameter):由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价值。如总体均数μ,总体标准差σ等。统计量(statistic):由样本计算的指标称为统计量。如样本均数,样本标准差s等。注意:一般不容易得到参数,而容易获得样本统计量。四、抽样误差抽样误差(sampleerror):由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率的差别等。注意:抽样误差是不可避免的。无论抽样抽得多么好,也会存在抽样误差。五、概率•概率(probability):是描述随机事件发生可能性大小的量值。用英文大写字母P来表示。概率的取值范围在0~1之间。当P=0时,称为不可能事件;当P=1时,称为必然事件。•小概率事件:统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件。•小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。第五节学习医学统计学应注意的问题1.重点掌握医学统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事项。2.要培养科学的统计思维方法,提高分析问题、解决问题的能力。3.掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。课后作业列举出计量资料、分类资料、等级资料各10个实例。列举出可能事件、必然事件、不可能事件及小概率事件各10个。认真复习本章已学过的基本概念2-3遍。BestWishestoAllofYou!ThankYouforListening!医学本科生用主讲程琮泰山医学院预防医学教研室zcheng@tsmc.edu.cn医学统计学TheteachingplanformedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege第2章定量资料的统计描述目录第二节集中趋势的描述第三节离散趋势的描述第四节正态分布第一节频数分布表统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。频数分布表(frequencydistributiontable):主要由组段和频数两部分组成表格。第一节频数分布表第二章定量资料的统计描述二、频数分布表的编制•编制步骤:•1.计算全距(range):一组变量值最大值和最小值之差称为全距(range),亦称极差,常用R表示。•2.确定组距(classinterval):组距用i表示;•3.划分组段:每个组段的起点称组下限,终点称组上限。一般分为8~15组。;•4.统计频数:将所有变量值通过划记逐个归入相应组段;•5.频率与累计频率:将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。表2-2某年某市120名12岁健康男孩身高(cm)的频数分布身高组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)125~10.8310.83129~43.3354.17133~108.341512.50…………………………合计120100.00二、频数分布表的用途1.揭示资料的分布类型2.观察资料的集中趋势和离散趋势3.便于发现某些特大或特小的可疑值4.便于进一步计算统计指标和作统计处理第二节集中趋势的描述集中趋势:代表一组同质变量值的集中趋势或平均水平。常用的平均数有算术均数、几何均数和中位数。另外不常用的有:众数,调和平均数和调整均数等。一、算术均数算术均数(a