社区常用医学统计方法——基本概念和步骤学习目标1.掌握统计基本概念及其联系2.叙述统计基本步骤及其要点常用医学统计方法统计学的研究对象:统计学是一门方法学,是以数学方法观察和比较事物的科学。1、变异:同质(性质相同)对象之间存在的差异。喂,我比你个大可你我都是同类呀存在变异的事物或现象同质与不同质个体之间的差异属于同质,称为变异。此时,测量值总是比较接近均数。以成人舒张压为例,相距均数75mmHg太远则属于血压异常。故变异是有规律的!607590mmHg血压正常范围低血压区高血压区卫生领域中的变异现象同为健康人,但身高、肺活量、血细胞数、代谢物含量、……都可能不一样服用同样剂量的药物,但患者的疗效、副反应、药物的血浓度、……都可能不一样同一份样品(空气、食物、血液),测试方法或人不同,测得某物质浓度都可能不一样你能举出一些变异事例吗?变异事物的观察必须通过群体观察认识变异事物群体观察以某同学成绩代表所有同学的学习能力,你同意吗?2、总体:同质研究对象的全体3、样本:对总体有代表性的部分欲了解某地6岁健康男孩身高情况,总体是?经总体观察是最正确的方法,但往往不能直接观察观察样本只是手段,反映总体才是目的总体样本应怎样正确反映?样本具备“代表性”应遵循的原则(1)随机抽样:总体中每一个体被抽取的机会相同(2)样本含量适宜:太小代表性差,太大则调查费力(3)样本与总体同源:样本来源于欲观察的总体4、抽样误差:指样本指标之间或与总体指标之间存在的差别。例如:随机抽取110名7岁男孩,样本的平均身高一般不等于全体7岁男孩的平均身高;再抽取另一个样本,平均身高可能又有差别抽样误差也是同质虽然有抽样误差存在,但样本均数总是与总体均数相差不大。因此抽样误差是有规律的,可用统计方法估计。总体样本1样本2这些不同称之为?同质抽样误差抽样误差也是同质虽然有抽样误差存在,但样本均数总是与总体均数相差不大。因此抽样误差是有规律的,可用统计学的方法估计。总体样本1样本2这些不同称之为?同质抽样误差抽样误差也是同质虽然有抽样误差存在,但样本均数总是与总体均数相差不大。因此抽样误差是有规律的,可用统计学的方法估计。总体样本1样本2这些不同称之为?不同质本质差别抽样误差与变异的异同与联系联系:变异是导致抽样误差的原因。共性:两者均为同质基础上所产生差异区别:变异是个体水平上表现出来的差异抽样误差是群体水平上表现出来的差异群体个体统计基本概念之间的联系统计学研究对象是存在变异的事物,反映变异的特征和变化规律,应经群体观察。总体观察一般不可行,通过样本观察时,通常存在抽样误差。观察样本是手段,反映总体才是目的。变异和抽样误差都属同质,差异仅为表象。其他常见误差Ω系统误差Ω随机测量误差各种常见误差的区别种类原因性质表现存在与解决测量误差(系统)单一因素测值-真值方向单一大小一致可避免查明并去除原因测量误差(随机)测量变异测值-真值随机不可避免提高测量精度抽样误差(随机)个体变异样本--总体样本--样本随机不可避免增加样本含量5、概率:P≤0.05(5%)的事件,称为小概率事件,可认为这类事件不会发生。指事件发生的可能性,用符号“P”表示P越接近0(0%),表示发生可能性越小P越接近1(100%),表示发生可能性越大统计资料种类计量资料:由定量数据组成,可以计算平均数计数资料:由定性数据组成,可以计算率、比等级资料:既有计量又有计数性质(了解)意义:资料不同,所需统计指标和分析方法均不同认识统计资料的分类如果将对象分为高血压患者200名,健康者800名,又属于什么资料?如果再将200名患者分为轻度、中度和重度患者,此时属于什么资料?某社区调查1000名居民,由测出的1000个血压值组成资料,属于什么资料?统计工作的基本步骤1、研究设计:是统计工作最关键的步骤确定研究目的、对象、内容;对照;误差控制组织、设备、资金、程序、时间安排设计原则——重复、随机、对照、齐同、双盲研究设计2、资料收集:&经常性资料:&专题调查资料:&实验室资料:研究设计资料收集3、资料整理:使资料条理化、系统化,以便进一步统计分析。下面以计量资料整理成频数表的过程为例,认识一下资料的整理。资料整理研究设计资料收集4、资料分析:以统计指标(均数、率等)描述样本资料为个体定性提供依据——医学参考值估计以样本指标估计总体——总体均数估计判断不同样本是否同质—假设检验反映不同事物间的关系—相关分析由甲事物推测乙事物——回归分析资料收集资料整理资料分析研究设计讨论一某医院将糖尿病患者随机分为两组,每组30人。分别给予不同的医护方法,以比较疗效。病情用血糖浓度表示。某医院将糖尿病患者随机分为两组,每组30人。分别给予不同的医护方法,以比较疗效。病情用血糖浓度表示。(1)研究开始以前,两组患者病情要求相同吗?两组血糖均数一定要求相等吗?(2)假设两组用了相同的疗法,观察一段时间以后,两组血糖均数出现不相等的情况?你认为这种差异反映了疗效不同吗?某医院将糖尿病患者随机分为两组,每组30人。分别给予不同的医护方法,以比较疗效。病情用血糖浓度表示。(4)理解观察样本是手段,反映总体才是目的?(3)现在两组疗法不同,观察结束时也出现了血糖均数不等的现象,你是否意识到这种均数差异反映了两种可能?疗效相同——差异属于抽样误差疗效不同——差异属于本质区别讨论二(1)指出下列可能由变异导致的现象:(2)指出下列可能由抽样误差导致的现象:X:个体观察值,X:样本平均数,μ:总体平均数A、X1≠X2B、X1≠X2C、X≠XD、X≠μE、μ1≠μ2频数表的制作过程某地130名12岁健康男孩身高(cm)测量资料155.5143.6142.4156.1149.0139.6144.4145.9150.0146.1142.4148.9146.7143.4140.2143.3146.7138.7137.4144.0157.9145.4146.5139.2142.3156.6148.8133.5145.2149.8147.0151.1141.2147.5139.2143.5134.7147.3150.8144.5125.9152.7154.2138.5134.7129.4142.5142.7132.4146.8145.4148.8144.7138.1137.1152.9137.9138.9141.2145.7138.2141.6145.5132.5149.8145.8151.3137.9148.8135.1150.3153.1142.7143.9140.7141.9156.3148.3146.2140.1151.6154.5146.4143.8138.9140.5147.8141.9139.2145.2137.4145.1145.8147.9142.3143.6134.9142.9147.1147.9141.8141.4140.9141.4160.9148.1152.9147.5149.7139.9137.7138.5159.6143.5142.9146.6152.3147.7154.0148.9142.6143.8130.5153.3136.7154.4149.8146.9139.2151.6某地130名12岁健康男孩身高资料组段频数(cm)(f)125~2130~7135~21140~36145~40150~17155~6160~1合计130左侧是130个未经整理的原始数据,右侧是经过整理形成的”频数表”故将上述资料分为8个组段。其中最小和最大组段,分别容纳了最小和最大数据,125.9与160.9。频数表的制作过程某地130名12岁健康男孩身高(cm)测量资料155.5143.6142.4156.1149.0139.6144.4145.9150.0146.1142.4148.9146.7143.4140.2143.3146.7138.7137.4144.0157.9145.4146.5139.2142.3156.6148.8133.5145.2149.8147.0151.1141.2147.5139.2143.5134.7147.3150.8144.5125.9152.7154.2138.5134.7129.4142.5142.7132.4146.8145.4148.8144.7138.1137.1152.9137.9138.9141.2145.7138.2141.6145.5132.5149.8145.8151.3137.9148.8135.1150.3153.1142.7143.9140.7141.9156.3148.3146.2140.1151.6154.5146.4143.8138.9140.5147.8141.9139.2145.2137.4145.1145.8147.9142.3143.6134.9142.9147.1147.9141.8141.4140.9141.4160.9148.1152.9147.5149.7139.9137.7138.5159.6143.5142.9146.6152.3147.7154.0148.9142.6143.8130.5153.3136.7154.4149.8146.9139.2151.6频数表制作分为三个步骤:1、求全距:即数据最大值与最小值之差找出资料最大值为160.9最小值为125.9全距=160.9-125.9=35160.92、确定组段数和组距:频数表一般分为10个组段左右。即将全距除以10。125.93、制作频数表:一般采用划记“正”字法。35÷10=3.5≈5(cm)频数表的制作过程某地130名12岁健康男孩身高(cm)测量资料155.5143.6142.4156.1149.0139.6144.4145.9150.0146.1142.4148.9146.7143.4140.2143.3146.7138.7137.4144.0157.9145.4146.5139.2142.3156.6148.8133.5145.2149.8147.0151.1141.2147.5139.2143.5134.7147.3150.8144.5125.9152.7154.2138.5134.7129.4142.5142.7132.4146.8145.4148.8144.7138.1137.1152.9137.9138.9141.2145.7138.2141.6145.5132.5149.8145.8151.3137.9148.8135.1150.3153.1142.7143.9140.7141.9156.3148.3146.2140.1151.6154.5146.4143.8138.9140.5147.8141.9139.2145.2137.4145.1145.8147.9142.3143.6134.9142.9147.1147.9141.8141.4140.9141.4160.9148.1152.9147.5149.7139.9137.7138.5159.6143.5142.9146.6152.3147.7154.0148.9142.6143.8130.5153.3136.7154.4149.8146.9139.2151.6155.5某地130名12岁健康男孩身高资料组段(cm)125~130~135~140~145~150~155~160~合计划记用“正”字划记法,将原始数据整理成频数表。143.6142.4156.1149.0139.6144.4频数表的制作过程某地130名12岁健康男孩身高(cm)测量资料155.5143.6142.4156.1149.0139.6144.4145.9150.0146.1142.4148.9146.7143.4140.2143.3146.7138.7137.4144.0157.9145.4146.5139.2142.3156.6148.8133.5145.2149.8147.0151.1141.2147.5139.2143.5134