1医学统计学绪论第二军医大学卫生统计学教研室第二军医大学临床流行病学与循证医学中心zhangluoman@yahoo.com.cn张罗漫2学习医学统计学的目的医学统计学定义统计学的几个基本概念(重点)统计工作的基本步骤医学统计学的应用讲课内容3班次、教材、时间、课代表教员:张罗漫学科性质:工具学科、交叉学科学习目的:科学研究中的设计与数据处理、阅读文献、撰写论文等。学习方法:理解基本概念、对实际资料能用正确方法描述与分析、准确计算、对计算结果能够正确理解与解释;不要死记公式与追求公式推导。学习要求:认真作作业;注重统计思想、抽象思维与严谨作风的培养。教学安排与要求4教学内容(2010年级硕士研究生周末班)1.第一章绪论2.第二章计量资料的统计描述SPSS统计分析软件简介3.4.第三章总体均数的估计与假设检验5.第四章多个样本均数比较的方差分析6.第五章计数资料的统计描述第十章统计表与统计图7.第七章χ2检验8.第八章秩转换的非参数检验9.第九章双变量回归与相关510.第十一章多因素试验资料的方差分析11.第十四章第一节多变量数据的统计描述第十五章多元线性回归分析12.第十六章logistic回归分析13.第十七章生存分析14.第二十九章数据处理的一般原则与方法答疑15.考试6教学内容(临床医学八年制2007年级)1.第一章绪论第十章统计表与统计图2.第二章计量资料的统计描述3.第三章总体均数的估计与假设检验4.第四章多个样本均数比较的方差分析5.统计软件实习16.第五章计数资料的统计描述第六章第一节二项分布7.第七章χ2检验8.第八章秩转换的非参数检验9.统计软件实习210.第九章双变量回归与相关711.第十一章多因素试验资料的方差分析12.第十二章重复测量设计资料的方差分析13.统计软件实习314.第十四章第一节多变量数据的统计描述第十五章多元线性回归分析15.第十六章logistic回归分析16.统计软件实习417.第二十八章临床诊断试验与评价18.第二十九章数据处理的一般原则与方法答疑19.统计软件实习520.考试8教学内容(2009年级硕士研究生)1.第一章绪论2.第二章计量资料的统计描述3.4.第三章总体均数的估计与假设检验5.第四章多个样本均数比较的方差分析6.第五章计数资料的统计描述第六章第一节二项分布7.第七章χ2检验8.第八章秩转换的非参数检验第十章统计表与统计图9.第九章双变量回归与相关910.第十一章多因素试验资料的方差分析11.第十二章重复测量设计资料的方差分析12.第十三章协方差分析13.第十四章第一节多变量数据的统计描述第十五章多元线性回归分析14.第十六章logistic回归分析15.第十七章生存分析16.第二十章主成分分析与因子分析1017.第二十五章医学科学研究概况第二十七章实验研究设计18.第二十六章观察性研究设计19.第二十九章数据处理的一般原则与方法答疑20.考试11确定性现象在相同的条件下出现相同的结果。如纯水在一个大气压下加热到1000C必然沸腾。随机性现象在相同的条件下出现不同的结果,但结果是确定的。如红细胞计数检测。模糊性现象在相同的条件下出现不同的结果,结果是不确定的。如体操运动员比赛成绩。自然界和人类社会活动中存在三类现象12确定性现象经典数学随机性现象概率统计学模糊性现象模糊数学不同现象与数学研究方法13医学统计学运用概率论、数理统计等原理与方法,研究医学研究中有关数据的搜集、整理、分析的科学。14Statisticsisthesciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata.—Webster’sInternationalDictionaryStatisticsisthescienceandartofdealingwithvariationthroughcollection,classification,andanalysisinsuchawayastoobtainreliableresult.—JohnM.Last,ADictionaryofEpidemiology15数理统计学与生物医学的结合生物统计学(Biostatistics)侧重于生物学研究又称生物测量学(Biometrics)医学统计学(MedicalStatistics)侧重于临床医学研究。卫生统计学(HealthStatistics)侧重于社会医学研究。16统计工作收集数据的活动统计数据对现象进行计量的结果统计学分析数据的方法与技术与统计有关的几个名词内涵17统计学与数学的区别数学研究的是抽象的数量规律统计学研究的是具体实际现象的数量规律数学研究的是没有量纲的抽象的数统计学研究的是有具体实物的数据数学研究所使用的方法主要是演绎法统计学研究所使用的方法主要是归纳法18第一节统计学的几个基本概念19一、个体变异二、随机三、随机试验与随机事件四、总体与样本五、变量与资料六、误差七、频率与概率20同质个体间的差异。一种或多种不可控因素(已知的或未知的)作用下所产生的综合表现。结果是随机的(无法绝对正确地预测)。个体变异是普遍存在的。个体变异是有规律的。没有个体变异,就没有统计学!一、个体变异(individualvariation)21二、随机(random)机会均等,不等同于随意或随便。随机抽样(randomsampling)有相同的机会被抽到随机分组(randomallocation)有相同的机会被分到不同的组中22三、随机试验与随机事件1.随机试验(1)可以在相同的条件下重复进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定那一个结果会出现。23医学随机试验举例对某人某项生理生化指标的检测某种疾病的治疗结果抽烟与肺癌的关系18岁正常中国男子的身高测量┇242.随机事件在随机试验中,每一次试验可能出现的结果称为随机事件。随机事件的发生在大量重复试验中具有某种规律性,称为资料的概率分布或总体分布。揭示和研究这种规律性是统计学所要研究的问题。25四、总体与样本1.总体(population)根据研究目的确定的同质观察单位的全体;是同质的所有观察单位某种观察值的集合。研究目的:某地某年全体正常18岁男子身高总体:该地某年全体正常18岁男子身高值观测单位:每个正常18岁男子观测值:正常18岁男子身高值26(1)无限总体(infinitepopulation)总体的概念是设想的或抽象的,没有时间和空间范围的限制。研究总体(2)有限总体(finitepopulation)规定了时间、空间范围内有限个观察单位的总体。目标总体总体参数(populationparameter)总体特征值。未知的,固有的,不变的!27抽样研究(samplingresearch)从总体中抽取样本,根据样本信息推断总体特征。抽样应遵循随机化(randomization)原则3.样本(randomsample)从总体中随机抽取部分观察单位的实测值集合。代表性,包含总体特征。2.个体(individual)观测单位28样本统计量(samplestatistic)样本数据的函数。已知的,变化的,有误差的!样本含量(samplesize)该样本包含的观察单位数。29五、变量与资料1.变量(variable)总体确定后,对每个观察单位的某项特征进行观测,这种特性能反映观察单位的变异性,称为变量。随机变量(randomvariable)取值不能事先确定的变量。2.资料(data)对变量的观测结果称为变量值,由许多变量值构成资料。30(1)计量资料(quantitativedata)变量值有度量衡单位,表现为数值大小。(2)计数资料(qualitativedata)将观察单位按某种属性进行分组,分组汇总各组观察单位数。(3)等级资料(rankeddata,ordinaldata)将观察单位按某种属性的不同程度分成等级后分组计数,变量值具有半定量性质。资料的分类31资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业血RBC(1012/L)135女1.65A正常-教师4.67244男1.74B正常-工人5.21326男1.80O正常+职员4.10425女1.61AB正常+农民3.92541男1.71A异常++工人3.49645女1.58B正常++工人5.48750女1.60O异常++干部6.78828男1.76AB正常+++干部7.10931女1.62O正常+军人5.2432计数资料性别例数男4女5计数资料血型例数A2B2O3AB2等级资料尿WBC例数-2+3++3+++133有效正常11.5816.80B组女55108……………………无效异常15.6622.56对照男554有效异常10.9317.33B组女433好转正常12.5720.00对照女452治愈正常11.4718.67A组男371疗效评价心电图舒张压(kPa)收缩压(kPa)治疗分组性别年龄(岁)患者编号108例高血压患者治疗后的临床记录34资料的另一种分类数值变量资料(numericalvariable)分类资料(categoricalvariable)二分类(binaryvariable)多分类(polytomousvariable)无序多分类(multinominal)有序多分类(ordinal)(等级资料rankeddata)35数学上的分类连续型资料(continuousdata)计量资料实数范围内任意取值离散型资料(discretedata)实数范围内只取整数值计数资料离散型计量资料如:脉搏次数/分;人数/家庭;白细胞计数/L36不同类型资料转化举例(每分钟脉搏次数)计量资料计数资料等级资料75缓脉(60)82正常(60~100)125正常脉(60~100)96异常(60或100)56速脉(100)37六、误差实际测量值与真值之差,即样本指标与总体指标之差。1.随机误差(randomerror)一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。如测量一个人体重(71.3kg):71.171.471.371.271.3kg随机误差呈正态分布38抽样误差(samplingerror)随机误差一种,由抽样引起的样本统计量与总体参数间的差别。原因:个体变异+抽样方式表现:样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是有规律的!39其值恒定不变或遵循一定变化规律,产生原因往往是已知或可能掌握的。原因:抽样不均匀,分配不随机,实验者感觉或操作上的差异,仪器不准确等,可以通过周密的研究设计和严格的技术措施消除。2.系统误差(systematicerror)40在实验过程中,由研究者偶然失误而造成的误差。3.过失误差(grosserror)仪器失灵,抄错数字,点错小数点,写错单位等,可以通过认真的检查核对予以清除。4190mmHg85mmHg真值血压计测定值。。。。。。。。。。。。系统误差随机误差42准确度(accuracy)在一定测量条件下,观测值与其真实值的偏离程度。精确度(precision)在一定测量条件下,对同一样品进行重复测定所得结果之间的离散程度。效度(validity)量表是否测量了研究希望测量的东西信度(reliability)测量的一致性43准确度和精确度都好准确度差、精确度好准确度较好、精确度差准确度和精确度都差44七、频率与概率实验者Buffon(法)k.Pearson(英)k.Pearson(英)投掷次数40401200024000“正面”次数2048601912012频率0.50690.50160.50051.频率(frequency)在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A