医学统计学正态分布及应用【统计学】

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第五章正态分布及其应用主讲人:余小金公共卫生学院流行病与卫生统计学系2一个问题一个1.72米的男生和一个1.72米的女生哪个高?3频数1081101121141161181221241261281301320510152025120该直方图给了我们什么信息?120名7岁男童的身高分布的频率分布图身高低于116厘米的儿童累计频率为多少?身高(cm)身高大于124厘米的儿童累计频率为多少?4表2.1120名7岁男童身高的频数(率)分布组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)108~20.01720.167110~30.02550.417112~70.058120.100114~140.117260.217116~190.158450.375118~240.20690.575120~180.15870.725122~150.1251020.850124~90.0751110.923126~50.0421160.967128~30.0251190.992130~13210.0081201合计1205如果观察的是远大于120的研究总体呢?关于总体的概率分布第五章正态分布与二项分布正态分布是最基础的一种理论分布6主要内容正态分布历史-关于误差的分布正态分布的特征正态分布在生物医学中的应用7正态分布的历史德国数学家Gauss法国数学家Laplace误差函数最早用于物理学、天文学Gaussiandistribution8从频率分布到概率分布(a)(b)(d)(c)9正态分布的概率密度函数如果随机变量X的概率密度函数则称X服从正态分布,记作X~N(,2),其中,为分布的均数,为分布的标准差。XfXe22()21()2(-∞<X<+∞)10正态分布的特征正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。充分统计量高峰在均数处;均数两侧完全对称。正态曲线下的面积分布有一定的规律。uXe221()211正态分布图示bell-shapedcurvex0.1.2.3.4f(x)uXe221()212方差相等、均数不等的正态分布图示31213均数相等、方差不等的正态分布图示21314正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1。对称区域面积相等。S(-,-X)S(X,)=S(-,-X)15正态曲线下的面积规律对称区域面积相等。S(-x1,-x2)-x1-x2x2x1S(x1,x2)=S(-x2,-x1)16正态曲线下的面积规律-4-3-2-101234-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.6587S(-,)=117正态曲线下的面积规律-4-3-2-101234-3-2-++2+31-S(-3,+3)=0.00261-S(-2,+2)=0.04561-S(-,+)=0.317418正态曲线下的面积规律-4-3-2-101234-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,)=0.5S(-,+3)=0.9987S(-,+2)=0.9772S(-,+1)=0.6587S(-,)=119正态曲线下的面积规律-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413-4-3-2-10123420正态曲线下的面积规律-3-2-++2+3S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.5S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413-3-2-1012321正态曲线下的面积规律-3-++3-2+2S(-3,-2)=0.0115S(-2,-1)=0.1359S(-1,)=0.3413S(-,-3)=0.0013S(-,-2)=0.0228S(-,-1)=0.1587S(-,-0)=0.522正态曲线下的面积规律-1.96+1.962.5%2.5%95%23正态曲线下的面积规律-1.64+1.645%5%90%24正态曲线下的面积规律-2.58+2.580.5%0.5%99%25正态曲线下的面积规律小结正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等;-1.64~+1.64内面积为90%;-1.96~+1.96内面积为95%;-2.58~+2.58内面积为99%。小于-3的面积为0.13%;小于-2的面积为2.28%;小于-的面积为15.87%。26标准正态分布标准正态分布(standardnormaldistribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。概率密度函数:uXe221()2(-∞<u<+∞)27正态分布转换为标准正态分布若X~N(,2),作变换:则u服从标准正态分布。u称为标准正态离差(standardnormaldeviate)Xu28标准正态分布曲线下面积(u)u0.00-0.02-0.04-0.06-0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.281000.50000.49200.48400.47610.46810u29关于正态分布总结正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;正态分布的优良性质-函数的分布正态分布是由两个参数决定的一簇分布正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标准正态离差为单位)。30正态分布的应用二次大战期间们,英国生物学家peterblackett向海军部建议组建科研小组协助解决战略,战术问题.运筹学(operationalresearch)诞生.应用到企业管理,制造业等.统计模型和科学思维的应用-当条件满足时用正态分布去解决问题.31正态分布的应用估计频数分布正态分布的假定简化了数据处理质量控制确定临床参考值范围32估计频数分布例2.1120名7岁男童的身高,计算得均数为119.41cmg,标准差为4.38cm.试估计该7岁男童110cm以下的比例。首先计算标准离差:查标准正态分布表:(-2.15)=0.0158估计低体重儿的比例为1.58%.15.238.441.119110u33质量管理qualitymanagement质量控制的意义监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。医院质量管理实验室质量管理六西格玛管理(6)参考阅读:周纪芗茆诗松质量管理统计方法中国统计出版社34关于六西格玛管理拯救摩托罗拉的开始70-80年代GE公司六西格玛水平为99.99966%的合格率,也就是每百万次出错机会中只出现3.4个错误。35质量控制图(qualitycontrolchart)UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3SDM+2SDMM-2SDM-3SD36质量控制图(qualitycontrolchart)UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+2.58SDM+1.96SDMM-1.96SDM-2.58SD37质量控制图(qualitycontrolchart)123456789101112131415取样时间M+3SDM+2SDMM-2SDM-3SD38医学参考值范围问题医学诊断检验中所用的正常范围是什么意思?如何得到的?39参考值范围的定义(referenceinterval)又称正常值范围(normalrange)。参考值范围的经典定义:绝大多数正常人的某解剖,生理,生化等指标观察值所在的范围。绝大多数:90%,95%,99%等等。参考值范围的扩展(extension)用于分类判别与综合评价的所有相关领域环境媒介中化学物含量标准(容许区间);标准动物指标;医院管理等.“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。40参考值范围确定的原则与步骤抽取足够例数的正常人样本同质定义明确(性别年龄等)准确而统一的测量-控制检测误差决定单、双侧问题选择适当的百分界值(90%,95%)估计界值41单侧与双侧参考值范围双侧(在界值范围内为正常):白细胞计数,血清总胆固醇单侧上限(低于界值为正常):尿铅,发汞,牛奶中的三聚氰胺下限(高于界值为正常):肺活量,IQ,•根据医学专业知识确定!42正常人病人假阳性率假阴性率正常人与病人的数据分布重叠(单侧)43正常人病人假阳性率假阴性率正常人与病人的数据分布重叠(单侧)44正常人病人假阳性率假阴性率病人正常人与病人的数据分布重叠(双侧)45参考值范围的估计方法方法双侧单侧下限上限正态分布法百分位数法P2.5~P97.5P5P95Xus/2XusXus46谢谢您的专心听讲!

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功