主要内容1234前言医学研究资料的统计处理统计表与统计图医学统计资料的统计描述统计是什么?WhatisStatistics?若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。FlorenceNightingale1820一1910一、前言FlorenceNightingale•在她的时代,各医院的统计资料非常不准确。但是南丁格尔却有先知灼见,她认为医学上的统计资料,有助于改进医疗与护理的方法与措施,而最后可促进医学的进步。•1858年《影响英国军队健康、效率以及医院行政的笔记》。这本书被称为“有史以来写得最好的一本统计图表书籍”。FlorenceNightingale•在书中,有一个章节是她所做的统计图表;她是以图表陈述统计数据的先驱者,也是首位发明圆饼图(Polar-areaCharts,或称为PieCharts),用来呈现统计数据比率的人。•1858年,她获选为英国统计学会的第一位女性会员,不久又成为美国统计学会的荣誉会员。6•统计学是收集、分析、解释与呈现数据资料的一门科学。医学统计学--是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。什么是统计学?天气预报生活中的统计数据数据处理的工具和技能•同质与变异•变量与变量值•参数与统计量•总体和样本•概率•误差二、医学研究资料的统计处理(一)常用基本概念(一)常用基本概念同质与变异同质:被研究指标的影响因素相同。e.g.比较两种不同药物的降压效果。在医学研究中,对被观测指标有影响的可控制的非实验因素达到相同或基本相同就可认为是同质。–同质性是构成研究总体的必备条件;–研究内容不同,对同质性的要求不同;实验因素观测指标实验因素观测指标制定血红蛋白参考值范围时:制定白细胞参考值范围时:同质与变异变异(variation)是指在同质的基础上各观察单位(或个体)之间的差异。e.g.同为20岁健康男大学生,身高有高有矮、体重有重有轻,这种差异就是变异。不可控因素作用下所产生的一种综合表现。结果是随机的。个体变异是普遍存在的。个体变异是有规律的。没有个体变异,就没有统计学!(一)常用基本概念变量及变量值变量是指观察单位的某项特征或指标。e.g.人的年龄、性别、身高、体重等。变量值是变量的观察结果。e.g.定性结果:男、女;已婚、未婚……定量结果:厘米、千克……(一)常用基本概念(一)常用基本概念总体和样本总体是根据研究目的确定的同质观察单位某种变量值的集合。有限总体:调查某地成年女性红细胞数。无限总体:调查A厂30岁成年女性红细胞数。样本是指在研究总体中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集合。挪威统计学家凯尔(A.N.Kiaer),1895年提出抽样调查。参数与统计量描述总体特征的有关指标,称为参数。–未知的,固有的,不变的!反映样本特性的有关指标,称为统计量。–已知的,变化的,有误差的!(一)常用基本概念平均身高μ总体样本平均身高x总体参数样本统计量概率又称机率。是描述事件发生可能性大小的一个度量,常用P来表示,取值范围为0≤P≤1。(一)常用基本概念1.不可能事件:P=02.必然事件:P=13.随机事件:0〈P〈1随机机会均等随机抽样有相同的机会被抽到随机分组有相同的机会被分到不同的组中实验顺序随机先后接受处理的机会相同(一)常用基本概念抛硬币试验在概率的统计学定义上的诠释试验者投掷次数出现“正面”次数频率XXX20120.6000Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005(一)常用基本概念•当观察次数n越来越大,频率f的随机波动幅度越来越小,并最终趋向于一个常数:随机事件A发生的概率。频率:用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例为频率。显然有。(一)常用基本概念mfn01f小概率原理当某事件发生的概率P≤0.05或P≤0.01时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。小概率原理是进行统计推断的依据。(一)常用基本概念小概率原理小概率事件在一次试验中认为是不会发生的。误差指实际测量值与真实什之差。(一)常用基本概念1.系统误差:P=0—可避免2.随机测量误差:P=1—不可避免,可控3.抽样误差:0〈P〈1—不可避免,不可控1.系统误差:P=0—可避免2.随机测量误差:P=1—不可避免,可控3.抽样误差:0〈P〈1—不可避免,不可控(一)常用基本概念抽样误差指由抽样引起的样本统计量与总体参数间的差别。•原因:个体差异+抽样–表现:•样本统计量与总体参数间的差别•不同样本统计量间的差别–抽样误差是有规律的!•数值变量资料•分类变量资料(二)医学统计资料的类型无序多分类有序多分类(等级资料)二分类多分类二分类多分类无序多分类有序多分类(等级资料)无序多分类有序多分类(等级资料)二分类多分类无序多分类有序多分类(等级资料)数值变量资料以定量方法表达每个观察单位的某项观察指标,又称定量资料或计量资料。①变量值是固定的,有度量衡单位:cm、kg、kPa•特征②数据间有连续性:体重55kg~60kg③统计描述指标有④统计推断方法:t检验、u检验、方差分析、相关回归(二)医学统计资料的类型集中趋势:平均数离散趋势:标准差分类变量资料将观察单位按某种属性来分类计数的资料,亦称定性或计数资料。①数据为整数,无度量衡单位•特征②统计描述指标常用相对数:率、构成比、相对比③统计推断方法:u检验、X2检验•分类(二)医学统计资料的类型二分类:有效、无效;阴性、阳性多分类:血型:A、B、O、AB无序多分类有序多分类:(等级资料)治愈、好转、无效、死亡;+、++、+++、++++住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料Units;elements三类资料间关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料计数资料资料的转化(变量类型的转化)•数值变量等级资料•等级资料积分制计量资料如测得5人的WBC(个/m3)数如下:300060005000800012000数值变量过低正常正常正常异常等级变量•若按正常3人,异常2人分组→二分类变量•若按过低1人,正常3人,过高1人分组→等级资料1.设计:根据研究目的制定计划。2.收集资料:根据设计要求获取准确完整的原始资料。来源3整理资料:条理化、系统化4.分析资料:按设计要求和资料类型对数据进行分析。(三)医学统计工作的基本步骤统计报表日常工作记录专题调查核查资料设计分组分类汇总质量分组数量分组统计描述:用指标或图表描述资料的数量特征分布规律。统计推断:用样本信息推断总体特征。参数估计假设检验(一)统计表的概念将统计分析的事物与指标用表格列出整理资料的整理表广义狭义统计表统计分析结果的描述表报表统计分析结果的描述表搜集资料的登记表与调查表二、医学研究资料的统计处理●代替冗长的文字叙述,简明、有条理地罗列数据与统计量,方便阅读、比较与计算;●展示数据的结构、分布和主要特征,便于在进一步分析中选择与计算统计量。(二)统计表的作用e.g.某外科医生统计了32例老年胆道感染死亡病例的死亡相关因素32例胆道感染死亡病例中,有顽固性休克的31例,占所有死亡病例的91.17%;有急性肺衰者30例,占所有死亡病例的88.23%;有急性肾衰者9例,占所有死亡病例的26.47%;有胆源性败血症者10例,占所有死亡病例的29.41%;有急性肝衰的3例,占所有死亡病例的8.82%;有低血钾者20例,占所有死亡病例的58.82%;有代谢性酸中毒者18例,占所有死亡患者的52.95%;多发性肝衰者1例,占所有死亡病例的2.94%。死亡相关因素例数占死亡人数百分比(%)顽固性休克3191.17急性肺衰3088.23低血钾2058.82代谢性酸中毒1852.94胆源性败血症1029.41急性肾衰926.47急性肝衰38.12多发性肝衰12.9432例老年胆道感染死亡病例死亡相关因素(三)统计表的结构⒈形式:标题:概括说明表的内容、地点与时间标目:横标目:说明横行数字涵义纵标目:说明纵列数字涵义总标目:横标目或纵标目的概括线条:数字:备注:对表或表内项目的说明2.内容:主语:被描述的事物宾语:被描述事物的指标纵标目的总标目纵标目的总标目横标目的总标目纵标目纵标目纵标目纵标目横标目××××××××.××××.××横标目××××××.×××.××┇┇┇┇┇┇┇┇┇┇合计×××××××××.××××.××表号标题(可包括时间、地点)宾语主语(三)统计表的结构(四)统计表的种类1.简单表(simpletable)主语只按一个主要标志分组某地1980年男、女HBsAg阳性率性别调查数阳性数阳性率(%)男女合计42343037.1645301814.0087644845.522.复合表(combinativetable)主语按两个或两个以上主要标志分组复方猪胆胶囊治疗老年慢性气管炎的近期疗效类型例数病情疗效重中轻治愈显效好转无效单纯型喘息型合计22113654316098511218293563323836511403229110648318111623(四)统计表的种类(五)编制统计表的原则●重点突出,一张表只表达一个中心内容。●主语在左,宾语在右,从左至右构成一句完整而通顺的话。●简单明了,文字、数字与线条尽量简洁。(六)编制统计表的要求1.标题概括说明表的内容,必要时注明时间和地点,字数一般不超过20个。常见缺点:过于简单;过于繁琐;题意不确切、具体。外伤类型病例数构成比(%)创伤38140.57挫伤30532.48眼外伤11812.57烧伤929.80其它434.58合计939100.00表×1992年某市机械工业生产性外伤分类(六)编制统计表的要求2.标目:简明确切,有单位的要注明单位。常见缺点:标目层次过多;含意不确切;有单位的标目没有注明单位。(六)编制统计表的要求中山市死亡率(1/10万)南澳县死亡率(1/10万)年龄(岁)男女合计男女合计10~0.470.150.21………20~2.641.351.991.031.851.4630~17.446.5412.047.101.064.3440~43.8817.2330.969.0313.2911.1850~64.8726.4645.4732.2025.7828.7660~76.8925.2349.1626.338.2716.2170~54.1712.2932.2853.1012.5723.1980~34.018.0414.147.5515.2710.19表×广东省两市县1970~1988年鼻咽癌死亡情况(六)编制统计表的要求3.线条:(六)编制统计表的要求4.数字:●一律用阿拉伯字表示;●准确;●整齐:同一指标的小数位数应一致;位次对齐。●表内不留空格:暂缺或未记录不应出现数字—数字为零0(六)编制统计表的要求5.备注:非表中必要的元素,