正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.不知你们是否注意到街头的一种赌博活动?用一个钉板作赌具。街头请看也许很多人不相信,玩这种赌博游戏十有八九是要输掉的,不少人总想碰碰运气,然而中大奖的概率实在是太低了。下面我们在计算机上模拟这个游戏:街头赌博高尔顿钉板试验平时,我们很少有人会去关心小球下落位置的规律性,人们可能不相信它是有规律的。一旦试验次数增多并且注意观察的话,你就会发现,最后得出的竟是一条优美的曲线。高尔顿钉板试验这条曲线就近似我们将要介绍的正态分布的密度曲线。正态分布的定义是什么呢?对于连续型随机变量,一般是给出它的概率密度函数。一、正态分布的定义若r.vX的概率密度为),(~2NX记作f(x)所确定的曲线叫作正态曲线.xexfx,)()(22221其中和都是常数,任意,0,则称X服从参数为和的正态分布.22正态分布有些什么性质呢?由于连续型随机变量唯一地由它的密度函数所描述,我们来看看正态分布的密度函数有什么特点。正态分布请看演示二、正态分布的图形特点),(2N正态分布的密度曲线是一条关于对称的钟形曲线.特点是“两头小,中间大,左右对称”.决定了图形的中心位置,决定了图形中峰的陡峭程度.正态分布的图形特点),(2N能不能根据密度函数的表达式,得出正态分布的图形特点呢?xexfx,)()(22221容易看到,f(x)≥0即整个概率密度曲线都在x轴的上方;故f(x)以μ为对称轴,并在x=μ处达到最大值:xexfx,)()(22221令x=μ+c,x=μ-c(c0),分别代入f(x),可得f(μ+c)=f(μ-c)且f(μ+c)≤f(μ),f(μ-c)≤f(μ)21)(f这说明曲线f(x)向左右伸展时,越来越贴近x轴。即f(x)以x轴为渐近线。xexfx,)()(22221当x→∞时,f(x)→0,用求导的方法可以证明,xexfx,)()(22221为f(x)的两个拐点的横坐标。x=μσ这是高等数学的内容,如果忘记了,课下再复习一下。根据对密度函数的分析,也可初步画出正态分布的概率密度曲线图。回忆我们在本章第三讲中遇到过的年降雨量问题,我们用上海99年年降雨量的数据画出了频率直方图。从直方图,我们可以初步看出,年降雨量近似服从正态分布。下面是我们用某大学男大学生的身高的数据画出的频率直方图。红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布。人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。请同学们想一想,实际生活中具有这种特点的随机变量还有那些呢?除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.xexfx,)()(22221服从正态分布的随机变量X的概率密度是),(2NX的分布函数P(X≤x)是怎样的呢?设X~,),(2NX的分布函数是xdtexFxt,)()(22221正态分布由它的两个参数μ和σ唯一确定,当μ和σ不同时,是不同的正态分布。标准正态分布下面我们介绍一种最重要的正态分布dtexxt2221)(三、标准正态分布1,0的正态分布称为标准正态分布.xexx,21)(22其密度函数和分布函数常用和表示:)(x)(x)(x)(x它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.),(~2NXXY,则~N(0,1)设定理1书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.四、正态分布表)(1)(xxdtexxt2221)(表中给的是x0时,Φ(x)的值.当-x0时xx),,(~2NX若XY~N(0,1)若X~N(0,1),)(bYaP)(bXaP)()()(abbXaP)()(ab由标准正态分布的查表计算可以求得,这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.当X~N(0,1)时,P(|X|1)=2(1)-1=0.6826P(|X|2)=2(2)-1=0.9544P(|X|3)=2(3)-1=0.9974五、3准则将上述结论推广到一般的正态分布,),(~2NY时,6826.0)|(|YP9544.0)2|(|YP9974.0)3|(|YP可以认为,Y的取值几乎全部集中在]3,3[区间内.这在统计学上称作“3准则”(三倍标准差原则).上一讲我们已经看到,当n很大,p接近0或1时,二项分布近似泊松分布;如果n很大,而p不接近于0或1,那么可以证明,二项分布近似于正态分布.下面我们不加证明地介绍有关二项分布近似于正态分布的一个定理,称为棣莫佛-拉普拉斯定理.它是第五章要介绍的中心极限定理的一个最重要的特殊情况.六、二项分布的正态近似定理(棣莫佛-拉普拉斯定理)})1({limxpnpnpYPnn设随机变量服从参数n,p(0p1)的二项分布,则对任意x,有nYdtext2221定理表明,当n很大,0p1是一个定值时(或者说,np(1-p)也不太小时),二项变量的分布近似正态分布N(np,np(1-p)).nY二项分布的正态近似实用中,n30,np10时正态近似的效果较好.见教学软件中的计算机演示例1将一枚硬币抛掷10000次,出现正面5800次,认为这枚硬币不均匀是否合理?试说明理由.解:设X为10000次试验中出现正面的次数,采用正态近似,np=5000,np(1-p)=2500,若硬币是均匀的,X~B(10000,0.5),505000)1(XpnpnpX近似正态分布N(0,1).即=1-Φ(16))5050005800(1≈0此概率接近于0,故认为这枚硬币不均匀是合理的.P(X≥5800)=1-P(X5800)505000)1(XpnpnpX近似正态分布N(0,1).例2公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子身高X~N(170,62),问车门高度应如何确定?解:设车门高度为hcm,按设计要求P(X≥h)≤0.01或P(Xh)≥0.99,下面我们来求满足上式的最小的h.再看一个应用正态分布的例子:因为X~N(170,62),)1,0(~6170NX)6170(h故P(Xh)=0.99查表得(2.33)=0.99010.996170h所以=2.33,即h=170+13.98184设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01.P(Xh)0.99求满足的最小的h.这一讲,我们介绍了正态分布,它的应用极为广泛,在本课程中我们一直要和它打交道.后面第五章中,我们还将介绍为什么这么多随机现象都近似服从正态分布.