第四章正态分布数学与信息技术系第一节正态分布的概率密度与分布函数本章我们讨论概率论与数理统计中最常用、最重要的一种连续型随机变量的分布——正态分布实例1零件的尺寸(P49例)在自动机床加工制造零件的过程中,我们周期地抽取一些样品,测量它们的尺寸,并记录在专用的表格上。设共抽取250个零件,测得零件尺寸与规定尺寸的偏差如下表现实世界中有许多事件服从或者近似服从这一分布,如:频数偏差/μm偏差适中的零件较多,偏差大的零件只是少数其直方图如下图实例2年降雨量问题,我们用上海九十九年年降雨量的数据画出的频率直方图。年降雨量在1100附近的较多,降雨量特多或者特少的情形只是少数年份实例3(某大学大学生)下图是用某大学大学生的身高的数据画出的频率直方图。红线是拟合的曲线具有“两头低,中间高,左右对称”除了我们在前面介绍过的零件的尺寸、年降雨量和身高外,在正常条件下各种产品的其它质量指标如纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从这样一种分布——正态分布.复习:连续型随机变量的刻画方式有哪些?1.概率分布函数或分布函数F(x):=P(X≤x)2.概率分布密度或概率密度:0()lim,xPxXxxfxx性质:1o0)(xf2o1)(dxxff(x)xo面积为1这两条性质是判定一个函数f(x)是否为某随机变量X的概率密度函数的充要条件.分布函数与概率密度的内在联系:0()limxFxxFxfxx或者(),xFxPXxftdt设定义如下)(xf22()21(),2xfxex它能成为某个随机变量的概率密度吗?回答是肯定的。这是因为(I)、正态分布的定义显然满足,1()0fx2()1fxdx下面验证也成立22()21()2xfxdxedx其实,此时只要令就有xt至于的证明参见华东师大版数学分析下册P187例7,或者利用Γ函数的性质.222tedt22112122tedt.222tedty=f(x)所确定的曲线叫作正态分布曲线.),(~2NX记作(Normal)若随机变量X的概率密度为22()21(),2xfxex其中和都是常数,任意,0,则称X服从参数为和的正态分布(高斯分布).由此我们给出如下的定义(II)、正态分布分布曲线的特点),(2N正态分布的分布曲线是一条关于对称的钟形曲线.x特点是“两头低,中间高,左右对称”.12令x=μ+c,x=μ-c(c0),分别代入f(x),可得f(μ+c)=f(μ-c)且f(μ+c)≤f(μ),f(μ-c)≤f(μ)故f(x)以μ为对称轴,并在x=μ处达到最大值21)(f22()21(),2xfxex因为22()21(),2xfxex当x→∞时,f(x)→0,这说明曲线f(x)向左右伸展时,越来越贴近x轴。即f(x)以x轴为渐近线。12这是数学分析的内容,如果忘记了,课下再复习一下。华东师大版数学分析上册P152页用求导的方法可以证明,x=μσ为f(x)的两个拐点的横坐标。xexfx,)()(22221对固定,变化时的图形0fx01x55决定了图形的中心位置固定,变化时的图形0.51.0fxx1.50.7980.3990.266021)(f决定了图形中峰的陡峭程度.(III)、正态分布的分布函数因为X~即故),(2N222)(21)(xexf22()21(),2txFxedtx(IV)、标准正态分布)(x12)(x221(),,2xxex221(),,2txxedtx其概率密度和分布函数常用和表示:()x()x1,0的正态分布称为标准正态分布x-xФ(x)的一个重要性质1xx任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.它的依据是下面的定理:标准正态分布的重要性在于,定理),(~2NXXY~N(0,1)设,则(V)、标准正态分布与一般正态分布的关系:1YXyafyfbb事实上,由公式其中Y=a+bX,可知当时有XYYXfyfy222()2211~0,122yyeeN(VI)、利用正态分布表进行计算若X~N(0,1),则PaXbPaXb()()ba当a0时,可以通过附录正态分布函数数值表(表2)查得;当a,b中至少有一个为负数(不妨设a为负数)时,则没办法直接查表到,这时可以先查得,然后利用公式可以,求得(),()ba1xx()a1aa()a),,(~2NX若XY~N(0,1)bXaPabPYab这说明,X的取值几乎全部集中在(-3,3)区间内,超出这个范围的可能性仅占不到0.3%.由标准正态分布的查表计算可以求得,当X~N(0,1)时,P(|X|1)=2(1)-1=0.6826P(|X|2)=2(2)-1=0.9544P(|X|3)=2(3)-1=0.9974(VII)、3准则由标准正态分布与一般正态分布的关系,若时,),(~X2N6826.0)1Y()|X(|P9544.0)2Y()2|(|XP9974.0)3Y()3|(|YP~N(0,1)XY实际可能的取值区间,这在统计学上称作可以认为,X的取值几乎全部集中在区间(3,3)因而根据小概率事件的实际不可能性原理,3准则”(三倍标准差原则)我们常把看作是随机变量X(3,3)例1(1)假设某地区成年男性的身高(单位:cm)X~N(170,7.692),求该地区成年男性的身高超过175cm的概率。解:(1)根据假设X~N(170,7.692),则).1,0(~69.7170NX故事件X175的概率为P(X175)=1751XP)65.0(169.71701751=0.2578P289查表解:(2)设车门高度为hcm,按设计要求P(X≥h)≤0.01或下面我们来求满足上式的最小的h.(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的,问车门高度应如何确定?P(Xh)≥0.99,因为X~N(170,7.692),)1,0(~69.7170NX)69.7170(h故P(Xh)=0.99查表得(2.33)=0.99010.9969.7170h所以=2.33,即h=170+17.92188设计车门高度为188厘米时,可使男子与车门碰头机会不超过0.01.P(Xh)0.99求满足的最小的h.例2设随机变量X服从标准正态分布,求随机变量函数Y=X2的概率密度。)1,0(N解:FY(y)=P(Y≤y)=P(X2≤y)当y≤0时,显然FY(y)=0分析:要求Y的密度函数,只要求出其分布函数FY(y)即可被积函数为偶函数222201222xxyyyedxedx当y0时,FY(y)=P()yXy所以,Y的分布函数为2202,020,0xyYedxyFyy故,Y的概率密度为所得分布称为自由度为1的分布(参看§5.3)20,00,21221yyeyyfyY小结:这一讲,我们介绍了正态分布(一般正态分布以及标准正态分布)概率密度、分布函数及相关性质,以及如何将一般正态分布转化为标准正态分布进行计算等问题