正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.第五讲正态分布(高斯Gauss分布)高尔顿钉板试验这条曲线就近似我们将要介绍的正态分布的密度曲线。正态分布的定义是什么呢?对于连续型随机变量,一般是给出它的概率密度函数。一、正态分布的定义若r.vX的概率密度为),(~2NX记作f(x)所确定的曲线叫作正态曲线.xexfx,)()(22221其中和都是常数,任意,0,则称X服从参数为和的正态分布.22下面验证满足概率密度性质:(1)f(x)≥0,1dxxf)((2)证明:dttdxuxdxxfuxt)2exp(21]2)(exp[21)(,222则令])2exp(][)2exp([])2exp([2222duudttdttdtduut)exp(222而令t=ρcosθ,u=ρsinθ20020222.))exp((ddd,222dtet1dxxf)(从而二、正态分布的图形特点),(2N正态分布的密度曲线是一条关于对称的钟形曲线.特点是“两头小,中间大,左右对称”.决定了图形的中心位置,决定了图形中峰的陡峭程度.正态分布的图形特点),(2N能不能根据密度函数的表达式,得出正态分布的图形特点呢?xexfx,)()(22221容易看到,f(x)≥0即整个概率密度曲线都在x轴的上方;故f(x)以μ为对称轴,并在x=μ处达到最大值:xexfx,)()(22221令x=μ+c,x=μ-c(c0),分别代入f(x),可得f(μ+c)=f(μ-c)且f(μ+c)≤f(μ),f(μ-c)≤f(μ)21)(f这说明曲线f(x)向左右伸展时,越来越贴近x轴。即f(x)以x轴为渐近线。xexfx,)()(22221当x→∞时,f(x)→0,用求导的方法可以证明,xexfx,)()(22221为f(x)的两个拐点的横坐标。x=μσ这是高等数学的内容,如果忘记了,课下再复习一下。根据对密度函数的分析,也可初步画出正态分布的概率密度曲线图。下面是我们用某大学男大学生的身高的数据画出的频率直方图。红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布。人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。除了我们在前面遇到过的身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.xexfx,)()(22221服从正态分布的随机变量X的概率密度是),(2NX的分布函数P(X≤x)是怎样的呢?设X~,),(2NX的分布函数是xdtexFxt,)()(22221正态分布由它的两个参数μ和σ唯一确定,当μ和σ不同时,是不同的正态分布。标准正态分布下面我们介绍一种最重要的正态分布dtexxt2221)(三、标准正态分布1,0的正态分布称为标准正态分布.xexx,21)(22其密度函数和分布函数常用和表示:)(x)(x)(x)(x为偶函数)(),()(xxx).()()()()()()()(xduuduuduudttxxxxxxut11它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.),(~2NXXY,则~N(0,1)设定理1书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.四、正态分布表)(1)(xxdtexxt2221)(表中给的是x0时,Φ(x)的值.当x0时xx),,(~2NX若XY~N(0,1)若X~N(0,1),)(bYaP)(bXaP)()()(abbXaP)()(ab由标准正态分布的查表计算可以求得,这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.当X~N(0,1)时,P(|X|1)=2(1)-1=0.6826P(|X|2)=2(2)-1=0.9544P(|X|3)=2(3)-1=0.9974五、3准则将上述结论推广到一般的正态分布,),(~2NY时,6826.0)|(|YP9544.0)2|(|YP9974.0)3|(|YP可以认为,Y的取值几乎全部集中在]3,3[区间内.这在统计学上称作“3准则”(三倍标准差原则).例2公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子身高X~N(170,62),问车门高度应如何确定?解:设车门高度为hcm,按设计要求P(X≥h)≤0.01或P(Xh)≥0.99,下面我们来求满足上式的最小的h.再看一个应用正态分布的例子:因为X~N(170,62),)1,0(~6170NX)6170(h故P(Xh)=0.99查表得(2.33)=0.99010.996170h所以=2.33,即h=170+13.98184设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01.P(Xh)0.99求满足的最小的h.这一讲,我们介绍了正态分布,它的应用极为广泛,在本课程中我们一直要和它打交道.后面第五章中,我们还将介绍为什么这么多随机现象都近似服从正态分布.一、问题的提出在实际中,人们常常对随机变量的函数更感兴趣.42d求截面面积A=的分布.例如,已知圆轴截面直径d的分布,第六讲随机变量函数分布一、问题的提出在实际中,人们常常对随机变量的函数更感兴趣.已知t=t0时刻噪声电压V的分布,求功率W=V2/R(R为电阻)的分布等.t0t0设随机变量X的分布已知,Y=g(X)(设g是连续函数),如何由X的分布求出Y的分布?下面进行讨论.这个问题无论在实践中还是在理论上都是重要的.二、离散型随机变量函数的分布解:当X取值1,2,5时,Y取对应值5,7,13,例1求Y=2X+3的概率分布.而且X取某值与Y取其对应值是两个同时发生的事件,两者具有相同的概率.故X125P0.20.50.3X5713P0.20.50.3如果g(xk)中有一些是相同的,把它们作适当并项即可.一般,若X是离散型r.v,X的概率分布列为则Y=g(X)~nnpppxgxgxg2121)()()(Xx1x2…xn…Pp1p2…pn…g(X)g(x1)g(x2)…g(xn)…Pp1p2…pn…如:则Y=X2的概率函数为:X-101P0.30.60.1X01P0.60.4三、连续型随机变量函数的分布已知随机变量X的分布函数FX(x),概率密度fX(x),求随机变量Y=g(X)的分布函数FY(y),概率密度fY(y)时,有两种方法:1.分布函数法:(1)FY(y)=P(Y≤y)=P{g(X)≤y}将它用FX(x)表示,不存在时当,存在时当)('0)('),(')(yFyFyFyfYYYY(2)解:设Y的分布函数为FY(y),例2设X~其它,040,8/)(xxxfX求Y=2X+8的概率密度.FY(y)=P{Yy}=P(2X+8y)=P{X}=FX()28y28y于是Y的密度函数21)28()()(yfdyydFyfXYY0)28(yfX168)28(yyfX0故其它,0168,328)(yyyfY21)28()()(yfdyydFyfXYY注意到0x4时,0)(xfX即8y16时,0)28(yfX此时168)28(yyfXY=2X+8其它,040,8/)(xxxfX例3设X具有概率密度,求Y=X2的概率密度.)(xfX)(yXyP求导可得0,00,)()(21)()(yyyfyfydyydFyfXXYY当y0时,)()(yYPyFY)(2yXP注意到Y=X20,故当y0时,0)(yFY)(xFX)(yFY设Y和X的分布函数分别为和,)()(yFyFXX解:若exxfX2221)(则Y=X2的概率密度为:0,00,21)(221yyyfeyyY0,00,)()(21)()(yyyfyfydyydFyfXXYYx从上述两例中可以看到,在求P(Y≤y)的过程中,关键的一步是设法从{g(X)≤y}中解出X,从而得到与{g(X)≤y}等价的X的不等式.例如,用代替{2X+8≤y}{X}28y用代替{X2≤y}}{yXy这样做是为了利用已知的X的分布,从而求出相应的概率.这是求r.v的函数的分布的一种常用方法.例4设随机变量X的概率密度为其它002)(2xxxf求Y=sinX的概率密度.,0)(yFY当y0时,当y1时,1)(yFY10yx0当时故解:注意到,)()(yYPyFY)(sinyXP=P(0Xarcsiny)+P(-arcsinyX)ydxxarcsin022ydxxarcsin22解:当0y1时,例4设随机变量X的概率密度为其它002)(2xxxf求Y=sinX的概率密度.当0y1时,)()(yYPyFY)(sinyXPydxxarcsin022ydxxarcsin22解:2)arcsin(y2)arcsin(1y=P(0Xarcsiny)+P(-arcsinyX)dyydFyfYY)()(而dyydFyfYY)()(求导得:其它,010,12)(2yyyfY例5已知随机变量X的分布函数F(x)是严格单调的连续函数,证明Y=F(X)服从[0,1]上的均匀分布.又由于X的分布函数F是严格递增的连续函数,其反函数F-1存在且严格递增.证明:设Y的分布函数是G(y),于是对y1,G(y)=1;对y0,G(y)=0;10y由于对0≤y≤1,G(y)=P(Y≤y)=P(F(X)≤y)=P(X≤(y))1F1F=F((y))=y1,110,0,0)(yyyyyG即Y的分布函数是其它,010,1)(yyg求导得Y的密度函数可见,Y服从[0,1]上的均匀分布.本例的结论在计算机模拟中有重要的应用.例如,想得到具有密度函数为的随机数.000)(xxexfx0参数为的指数分布根据前面的结论,Y=F(X)服从[0,1]上的均匀分布.由于当x≥0时,xexF1)(是严格单调的连续函数.应如何做呢?于是得到产生指数分布的随机数的方法如下:均匀随机数ui给指数分布参数λ令)1ln(1iiuxix指数随机数下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数的概率密度.2.公式法:定理1:若y=g(x)连续且严格单调,其反函数x=h(y)具有连续导数,则Y=g(X)