正态分布NormalDistribution山东大学公共卫生学院:刘静正态分布A0510152025B00.10.20.30.40.5C00.050.10.150.20.250.3-5-4-3-2-1012345图2-1频数分布逐渐接近正态分布示意图提纲•正态分布的概念•正态分布的特征•标准正态分布•正态曲线下的面积分布规律•正态分布的应用1.制定医学参考值范围2.正态分布是许多统计方法的理论基础一、正态分布的概念1、定义:若随机变量x的概率密度函数可以表示为:则称x服从正态分布,记为x~N(,2),其中。2)(21_21)(xexf,x2、正态分布的图形xf(x)二、正态分布的特征(1)正态曲线(normalcurve)在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有2个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数(亦称变异度参数),当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用N(,2)表示均数为,方差为的正态分布。(4)正态分布在处各有一个拐点。(5)正态曲线下面积的分布有一定规律。(1)正态曲线为单峰曲线,在横轴上方均数处最高,曲线两端均以横轴为渐近线。(2)正态分布以均数为中心,左右对称。正态分布的特征(3)正态分布有2个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数(亦称变异度参数),当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用N(,2)表示均数为,方差为的正态分布。不变,发生变化不变,发生变化正态分布的特征(4)正态分布在处各有一个拐点。+凸凹凹(5)正态曲线下的面积分布有一定规律。(见下文)正态分布的特征三、标准正态分布(standardnormaldistribution)1.概念:均数为0,方差为1的正态分布称为标准正态分布,记为N(0,1)。2.概率密度函数:2221)(ueu3.标准正态分布与一般正态分布的关系:若x~N(,2),对x进行如下变换:则可证明,u服从标准正态分布,即u~N(0,1)。xu标准正态变换标准正态离差x~N(,2)u~N(0,1)标准正态变换00.10.20.30.40.50.6-4-3-2-101234Xf(X)标准正态分布四、正态曲线下的面积分布规律(一)正态曲线下面积的计算:图1中阴影部分(-,x)的面积称为正态分布的分布函数,记为图2中阴影部分(代表任意区间)的面积,理论上可以如下计算:xdxexFxx22221abdxeaFbFxba22221三、正态曲线下的面积分布规律(二)标准正态曲线下的面积:对于标准正态分布,其分布函数记为即标准正态曲线下(-,u)的面积随u变化而变化。统计学家编制了标准正态曲线下的面积分布表(见教材P245,附表1标准正态曲线下的面积),可以根据u值查表得到区间(-,u)的面积。dueuuu2221附表1标准正态分布曲线下的面积,Φ(u)值u0.000.01┅0.040.050.06┅0.080.09-3.0.0013.0013┅.0012.0011.0011┅.0010.0010-2.9.0019.0018┅.0016.0016.0015┅.0014.0014-2.8.0026.0025┅.0023.0022.0021┅.0020.0019-2.7.0035.0034┅.0031.0030.0029┅.0027.0026-2.6.0047.0045┅.0041.0040.0039┅.0037.0036-2.5.0062.0060┅.0055.0054.0052┅.0049.0048┇┇┇┇┇┇┇┇┇┇-1.9.0287.0281┅.0262.0256.0250┅.0239.0233-1.8.0359.0351┅.0329.0322.0314┅.0301.0294-1.7.0446.0436┅.0409.0401.0392┅.0375.0367-1.6.0548.0537┅.0505.0495.0485┅.0465.0455-1.5.0668.0655┅.0618.0606.0594┅.0571.0559┇┇┇┇┇┇┇┇┇┇-0.4.3446.3409┅.3300.3264.3228┅.3156.3121-0.3.3821.3783┅.3669.3632.3594┅.3520.3483-0.2.4207.4168┅.4052.4013.3974┅.3807.3859-0.1.4602.4562┅.4443.4404.4364┅.4286.4247-0.0.5000.4960┅.4840.4801.4761┅.4681.4641注:Φ(u)=1-(-u)(三)一般正态曲线下的面积:对于一般的正态分布N(,2),其曲线下(-,x)区间的面积除与x有关外,还与和有关。即不同的正态曲线,由于其位置和形状不同,同一区间内的面积是不同的。但可利用标准正态变换,将N(,2)转化为标准正态分布,再根据标准正态曲线下的面积分布表推算。xu三、正态曲线下的面积分布规律三、正态曲线下的面积分布规律(四)常用的正态曲线下面积及其对应的分位数:表1正态分布曲线下的面积及其分位数标准正态分布N(0,1)一般正态分布N(,2)面积(%)-1u1-x68.27-1.645u1.645-1.645x+1.64590.00-1.96u1.96-1.96x+1.9695.00-2.326u2.326-2.326x+2.32698.00-2.58u2.58-2.58x+2.5899.00xux=+u-+-1.645+1.645-1.96+1.96-2.58+2.5815.866%15.866%68.27%5%5%90%2.5%2.5%95%99%0.5%0.5%0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%标准正态分布N(0,1)正态分布N(,2)表2-4100名18岁男大学生身高的实际分布与理论分布实际分布sX身高范围(cm)人数(%)理论分布(%)sX1168.69176.716767.0068.27sX96.1164.84180.569595.0095.00sX58.2162.35183.059999.0099.00表2-5常用u值表参考值范围()单侧双侧800.8421.282901.2821.645951.6451.960992.3262.576五、正态分布的应用•许多医学现象服从正态分布或近似正态分布,如同性别、同年龄的儿童的身高;同性别健康成年人的红细胞数、血红蛋白含量、胆固醇、心率等生理生化指标;医学实验中的随机误差等,一般都呈现正态或近似正态分布,故可按正态分布规律处理。•有些医学资料虽然本身呈偏态分布,但经数据变换后可成为正态或近似正态分布,如疾病的潜伏期、医院病人的住院天数等,在施加对数变换后,转化成正态分布或近似正态分布,也可以按正态分布规律处理。五、正态分布的应用(一)制定医学参考值范围(二)正态分布是许多统计方法的理论基础(一)制定医学参考值范围1、医学参考值范围(referenceranges)的概念:指特定健康状况人群的解剖、生理、生化、免疫学指标及组织代谢产物等数据中绝大多数个体取值的波动范围,亦称正常值范围。2、医学参考值范围的用途:①作为诊断标准,划分正常与异常的界限;②根据传染病传染期的长短确定该病患者的隔离期限,或根据潜伏期长短确定接触者的留验期限。③制订卫生标准及有害物质的容许浓度,作为保护健康的安全界限。④制订不同性别、年龄儿童某项生长发育指标的等级标准。⑤在质量控制中制订各种控制限。五、正态分布的应用医学参考值范围的单侧或双侧界值单侧下限异常正常异常正常双侧下限双侧上限异常单侧上限异常正常五、正态分布的应用(一)制定医学参考值范围3、确定医学参考值范围的步骤和要求:(1)选取一批正常人作为研究对象。①要保证研究对象的同质性;②样本含量必须足够大,通常要求n100。(2)测定每一个观察单位的指标取值。要求按统一规定的测量标准,严格控制误差。(3)确定分组。若该指标在不同人群的分布特征不同,如男、女性别间有差异,应分组分别制订各人群的医学参考值范围。(4)确定单、双侧。根据指标的用途确定制订双侧界限、单侧下限还是单侧上限。(5)确定适当的百分界限,如80%、90%、95%等。通常取95%“正常”人指标值的波动范围作为医学参考值范围。(6)根据资料的分布特点,选用适当的统计方法。五、正态分布的应用4、确定医学参考值范围的方法:(1)正态分布法:适用于正态或近似正态分布的资料。双侧界值:单侧上界:单侧下界:95%参考值范围,取u/2=1.96,u=1.645。(2)对数正态分布法:适用于对数正态分布资料。(3)百分位数法:用于偏态分布资料双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。suX2suXsuX双侧界值:)(lglg2lg1xxsuX;单侧上界:)(lglglg1xxsuX,或单侧下界:)(lglglg1xxsuX。五、正态分布的应用例题(二)正态分布是许多统计方法的理论基础如t分布、F分布、2分布都是在正态分布的基础上推导出来的,检验也是以正态分布为基础的。此外,t分布、二项分布、Possion分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。五、正态分布的应用