第三章正态分布及其应用第一节正态分布的概念和特征正态分布的概念正态分布(normaldistribution),又称高斯分布,是医学和生物界最常见的分布。该分布是以均数为中心,低于均数的频数与高于均数的频数大致相等,越接近均数,频数越多,离均数越远,频数逐渐减少,形成以均数为中心两侧基本对称的钟型分布。这种资料在临床中很常见,称为正态分布。用N(μ、σ2)表示。正态分布的特征1、正态曲线在横轴上方,均数处最高。2、正态分布以均数为中心,左右对称。3、正态分布有两个参数:均数μ是位置参数标准差σ是变异度参数。4、正态曲线下面积有一定的分布规律。标准正态分布当μ=0,σ=1时为标准正态分布,为了应用方便可通过下列公式进行变量变换,将原点在任何位置的正态分布变换为标准正态分布,式中的u称为标准正态变量或标准正态离差。u=(X–μ)/σ第二节正态曲线下面积的分布规律实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频率)或观察值落在该区间的概率。此时,需利用正态曲线下的面积分布规律:μ±1σ区间面积占总面积的68.27%;μ±1.96σ区间面积占总面积的95%;μ±2.58σ区间面积占总面积99%。例3.1前例2.1中,某市1982年110名7岁男童的身高,已知均数=119.6cm,标准差=4.72cm。试(1)估计该地7岁男童身高在110cm以下者占该地7岁男童总数的百分数。(2)分别求,,范围内7岁男童人数占该组儿童总数的实际百分数(频率),并与理论频率比较。SX1SX96.1SX58.2分析过程(1)求u值u=(110–119.5)/4.72=-2.11查标准正态分布曲线下的面积表,得该地7岁男童身高在110cm以下者约占1.74%。(2)计算结果见表3.1表3.1110名7岁男童的实际分布与理论分布比较可见本资料的实际分布与理论分布是很接近的。X±S身高范围(cm)实际分布人数(%)理论分布(%)X±1S119.95±1×4.72115.23-124.6775(68.18)68.27X±1.96S119.95±1.96×4.72110.70-129.20104(94.55)95.00X±2.58S119.9±2.58×4.72107.77-132.13109(99.10)99.00第三节正态分布的应用1、正态分布是很多统计方法的理论基础:后面要讨论到的χ2分布、t分布、F分布等都是在正态分布的基础上推导出来的。某些分布,如t分布、二项分布、Poisson分布等的极限均为正态分布,在一定条件下,均可按正态近似的原理来处理。2、制作质量控制图利用正态分布规律检查和确认可疑值的性质。正常波动或系统误差。3、估计医学参考值范围3、估计医学参考值范围亦称医学正常值范围,它是指特定人群“正常人”的解剖、生理、生化及组织代谢产物含量等数据的波动范围。1)制定正常值范围的原则●确保研究对象(正常人)的同质性。◆控制检测误差:正常值的变异是生理变异和检测变异的总和。如检测误差过大,所得的正常值范围将影响疾病诊断的准确性。▼确定样本含量:样本含量越大,得到的正常值范围越可靠,一般认为样本含量应在100例以上;若被研究指标影响因素复杂,数据变异大,则样本含量可达上千例。★确定单侧或双侧正常值。■选择适当的百分界限。◆选择适当的方法:制定医学正常值的方法很多,常用的有正态分布法和百分位数法。可根据资料的分布特点及研究的设计要求决定用何种方法。2)制定正常值范围的方法l正态分布法:计算公式:适用于正态分布资料。根据正态分布规律,将正态曲线下的百分面积(相当于正常值范围的百分数)在横轴上的对应点作为正常值范围的界值(见表3.2)。表3.2正常值范围的常用u界值SuX百分界限单侧下限值上限值双侧99%X-2.326SX+2.326SX±2.576S95%X-1.645SX+1.645SX±1.960S90%X-1.282SX+1.282SX±1.645S80%X-0.842SX+0.842SX±1.282S.例3.2已知某市120名男孩身高的均数为143.1cm,标准差为5.67cm,试估计该市12岁男孩身高的95%正常值范围。将已知条件代入公式:X±1.96S即143.10-1.96×5.67143.10+1.96×5.67得131.99~154.21cm即该市12岁男孩身高的95%正常值范围是131.99~154.21cm。l百分位数法:该法是利用百分位数计算正常值范围,可用于任何分布资料,尤其偏态分布资料。表3.4常用正常值范围所对应的百分位数百分范围(%)单侧下限上限双侧下限上限80P20P80P10P9090P10P90P5P9595P5P95P2.5P97.599P1P99P0.5P99.5例3.3某市238例正常人发汞值见表3.3,试求该地发汞的95%正常值范围。表3.3某市238例正常人发汞值频数分布发汞值(μg/g)频数累计频数累计频率(%)0.320208.400.7668636.131.16014661.361.54819481.511.91821289.082.31622895.802.762343.112353.502353.93238合计238——因为发汞值过高才为异常,故应计算正常值上限。取95%界限,则代入公式:Px=L+i/fx(nx%-Σfl)P95=2.3+0.4/16(238×95%-212)=2.65(μg/g)即该地正常人发汞95%的正常值上限为2.65μg/g。