正态分布的基本特征及应用樊婵预防医学教研室一、正态分布的概念编号血清甘油三脂编号血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77表160名正常成年女子的血清甘油三酯(mmol/L)组段频数,f组中值,XfX0.5~30.551.650.6~90.655.850.7~120.759.000.8~130.8511.050.9~170.9516.151.0~181.0518.901.1~201.1523.001.2~181.2522.501.3~171.3522.951.4~131.4518.851.5~91.5512.401.6~81.6514.851.7~1.8合计31.755.25160182.30加权计算法1.计算组中值:组中值指组段的中间值第一组段的组中值X=(0.5+0.6)÷2=0.55第二组段的组中值X=(0.6+0.7)÷2=0.65其他组段以此类推2.计算各组的fX即各组的f和X的乘积第一组段的fX=3×0.55=1.65第二组段的fX=9×0.65=5.85其他组段以此类推3.计算ΣfX=182.30ΣfΣfXX=4.计算=182.30/160=1.14图160名正常成年女子的血清甘油三酯的频数分布图05101520250.500.700.901.101.301.501.701.90血清甘油三酯(mmol/L)频数组段频数,f0.5~30.6~90.7~120.8~130.9~171.0~181.1~201.2~181.3~171.4~131.5~91.6~81.7~1.8合计3160中间高、两边低、左右对称如果观察例数逐渐增多,组段不断分细,频数分布“中间高,两侧低”的特征会越来越明显直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图“中间高、两边低、左右对称”正态分布曲线•正态分布曲线:高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。身高、体重、血压、红细胞数、血红蛋白等的分布均属于正态分布。正态分布用N(μ,σ2)表示。标准正态分布当μ=0,σ=1时的正态分布为标准正态分布,即N(0,1)。μ=0正态分布转换成标准正态分布•转换公式xu例:某地1992年抽样调查了100名18岁男大学生身高,均数为170.2cm,标准差为3.5cm,估计该地18岁男大学生身高在173.7cm以上者占18岁男大学生的比例为多少?15.32.1707.173xu查附表1,可知当u等于-1时,左侧尾部概率为15.87%,大于1的时候右侧尾部概率也为15.87%二、正态分布曲线的特征正态概率密度曲线的特点:(1)在x=μ处取得最大值。(2)关于x=μ对称。(3)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。(4)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“扁平”;σ越小,数据越集中,曲线越“陡峭”。-4-3-2-1012345标准差相同、均数不同的四条正态曲线F00.00.10.20.30.40.50.60.70.8U-3-2-10123均数相同、标准差不同的四条正态曲线5.正态曲线下的面积有一定的分布规律(把曲线下到横轴之间的总面积看作1或100%)0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%标准正态分布正态分布面积或概率-1~1μ±σ68.27%-1.96~1.96μ±1.96σ95.00%-2.58~2.58μ±2.58σ99.00%曲线下面积分布规律正态曲线下面积的分布规律由μ和σ所决定。三、正态分布的基本特征在临床上的应用(一)判断资料的分布类型观察该资料中该地7岁男童的身高是否符合正态分布。(一)判断资料的分布类型(二)确定医学参考值范围•医学参考值:只大多数正常人的解剖、生理、生化、免疫及其组织代谢产物的含量等各种数据的波动范围。步骤:1.从“正常人”总体中抽样:明确研究总体2.统一测定方法以控制系统误差。3.判断是否需要分组(如性别、年龄)确定。4.判断是正态分布还是偏态分布4.根据专业知识决定单侧还是双侧。单侧下限---过低异常单侧上限---过高异常双侧---过高、过低均异常单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常(下限)上限SuXSuXSuX)(2/双侧100(1-α)%正常值范围:单侧100(1-α)%正常值范围:如:血压如:24小时尿糖含量如:肺活量正态分布法双侧100(1-α)%正常值范围:单侧100(1-α)%正常值范围:(下限)上限SuXSuXSuX)(2/双侧95%正常值范围:单侧95%正常值范围:(下限)上限SXSXSX65.1)(65.196.1双侧95%正常值范围:P2.5~P97.5单侧95%正常值范围:P95(上限)或P5(下限)适用于偏态分布资料百分位数法例题:•见书P45例3-15(三)质量控制•实验误差sx2上下警戒值上下控制值sx3s96.1s58.2即95%的医学参考值即99%的医学参考值(四)正态分布是许多统计方法应用的理论基础•t分布、F分布、卡方分布等都是在正态分布的基础上推导出来。•u分布、F检验及相关回归分析等多种统计方法也均要求分析的数据资料服从正态分布。•二项分布、t分布、泊松分布的极限分布为正态分布。练习题1μ确定后,δ越大,则正态曲线()•A.越陡峭B.形状不变C.越平缓D.向左移动E.向右移动2制定医学参考值不必备下列哪项()A.选用适当的计算方法B.选定适当的百分界值C.确定样本D.确定指标的单侧或双侧界值E.算出抽样误差练习题3决定个体值正态分布的参数是()A.均数与标准误B.均数与标准差C.均数与方差D.均数与变异系数E.均数与极差4标准正态分布的均数与标准差分别为()A.0和0B.0和1C.1和1D.1和0E.1和2练习题5横轴上,标准正态分布曲线下从0到1.96的面积为()•A.95%B.45%C.97.5%D.47.5%E.50%6要评价某市一名5岁男孩身高是否偏高或偏矮,其统计方法是()A.用95%NR来评价B.用差别的显著性来评价C.用95%CI来评价D.不能作评价E.用99%CI来评价练习题7某市500名10岁男孩体重有95%的人在18-30Kg范围内,由此可知此500名男孩体重的标准差为()A.2KgB.2.326KgC.6.122KgD.3.061KgE.4.321Kg8正态分布曲线下,横轴上从均数μ到μ+2.58σ的面积为A.95%B.45%C.97.5%D.49.5%E.48.8%练习题9.如果原始数据近似正态分布,可用估计95%参考值范围A.x±t0.05(v)sB.x±1.96sC.x±sxD.x±t0.05(v)sxE.x±2.58s请同学们做好练习和预习