第五章正态分布、常用统计分布和极限定理一、什么是正态分布正态分布(NormalDistribution)服从一类确定的规律,又称为常态分布或高斯分布。如统计了96人的初婚年龄18.520.522.524.526.528.530.532.5xφ(x)表5-1图5-1φ(x)xxxxxPxx)22(lim)(01.正态分布曲线是单峰,有一个最高点;2.分布曲线有一个对称轴x=μ;3.分布曲线以横轴为渐近线。中位值、中值、均值三者重叠。分布密度曲线的特征:1.曲线在x=μ处达到最高值,并且以x=μ对称。正态分布的概率密度表达式为:222)(21)(uxex2.在μ不变的情况下,ơ越小,图形越尖锐,反之则低阔。μ1μ2μ3图5-2图5-3Ơ=0.5Ơ=1Ơ=2参数μ和ơ代表的意义)()(,)()()()()(,)()(222方差即数学期望即DdxxuxDuEudxxxE正态曲线下每一小块面积就是随机变量在该小块取值所出现的概率,曲线下的整个面积由无数个小直方形拼成。ix)22()(iiiiiixxxxPxx宽长每小块面积曲线下任意两点的概率,就是对从到的所有小块面积进行累加,即21xx1x2xixxiixxxxP21)()(21dxxxxP,xxxi21)()(021时当几个典型取值区间的概率值uudxxuuP6827.0)()(.1229545.0)()22(.2uudxxuuP9973.0)()33(.333dxxuuPuu图5-434.13%34.13%13.6%13.6%2.16%2.16%0.11%0.11%1)()(dxxP3u2uuu2u3u二、标准正态分布根据Z值所得到的分布就是标准正态分布,概率密度为uxZ变量值标准化222)(21)(10uxex,u代入如果把2221)(xex2221)(zeZ标准正态分布其实是一般正态分布的一个特例,记作N(0,1),一般正态分布记作N(μ,σ2)。一般正态分布之所以能变成唯一的标准正态分布,就是把原来坐标中的零点沿着X轴迁到μ点,并且以σ为单位记分。图5-50σ=1(一)正态分布与标准正态分布的特点对比1.标准正态曲线在Z=0处达到最高点;2.标准正态曲线以Z=0为中心,双侧对称;3.标准正态曲线从最高点向左右缓慢下降,并无限延伸,但永不与基线相交;4.平均数为0,标准差为1;5.标准正态曲线从最高点向左右延伸时,正负1个标准差内向下向内弯,从正负1个标准差开始,向下向外弯。(二)正态分布与标准正态分布面积之间的对应关系1,1uuux,Zuxuuux,Zux时当时当6827.0)()11(6827.0)()(11dZZPdxxuuPuu则有22229545.0)()22(9545.0)()22(2222dZZPdxxuuP,Zu,x,Zuxuu时时9973.0)()33(9973.0)()33(3333dZZPdxxuuP:uu同理34.13%34.13%13.6%13.6%2.16%2.16%0.11%0.11%3211230图5-6(三)标准分的实际意义例1:甲、乙、丙3个同学《社会统计学》分数都是80分,甲同学所在班平均成绩μ甲=80分,μ乙=75分,μ丙=70分,标准差都是10,比较甲、乙、丙3个同学在班上的成绩。甲乙丙丙乙甲;;解ZZZZZ:Z11070805.01075800108080例2:设甲、乙、丙三个学生所在班级的平均成绩都为75分,σ甲=10分,σ乙=15分,σ丙=20分,比较甲、乙、丙三个学生在班上的成绩。25.020758033.01575805.0107580丙乙甲;;解ZZ:Z如果各科原始分数呈正态分布,可将各科原始分数转换成标准分,求其总和,再比较总分大小。iiiiuxZ总成绩例3:甲、乙两生高考的政治分数分别为70分、60分,物理分数分别为60分、70分,从总分上看,两生的总成绩相等,但政治的平均分是70分,δ=20,而物理的平均分是50分,δ=40。040507020706025.0405060207070iiiiiiiiuxZuxZ乙甲总成绩总成绩为了使标准分Z值变成形式上的原始分数,一般将Z值乘以10,加上50,就变成了T分数:T=10Z+50T甲=0.25×10+50=52.5;T乙=0×10+50=50标准分数的大小和正负可以反映某一个考生在全体考分中所处的地位,如甲生英语分数为Z=-0.44之上有67%的考生;乙生Z=0.25之上有40.13%的考生,通过每个考生在总体中的位置比较优劣,所以称为相对分数。三、标准正态分布表的使用标准正态分布表是根据概率密度,用积分计算Z取不同值时正态分布曲线下的面积。有的从Z=-∞开始,Z逐渐增加,表中所列是某个Z分数以下的累积概率;有的从Z=0开始,Z逐渐变化,计算从Z=0到某一定值之间的概率,因为正态分布对称,且对称轴为μ=0,所以当Z0与Z0时相应的Z分数概率值相等。任意两点[Z1,Z2]之间的面积就是)(12ZZ图5-71Z)(1Z图5-82Z)(2Z图5-91Z2Z)(12ZZ例4:?)3.1()10(P,,N求服从标准正态分布已知0968.0)3.1(1)3.1(1)3.1(1)3.1()3.1()(,1)(PPP:所以因为解例5:?)3.1()1,0(P,N求服从标准正态分布已知0968.0)3.1(1)3.1()3.1(0)(04PP,Z,ZZ:我们知道对称的原理正态图形以但根据标准值时的中没有给出附表解例6:?)3.23.1()1,0(P,N求服从标准正态分布已知8925.018925.11)3.1()3.2()]3.1(1[)3.2()3.1()3.2()3.23.1(:P解例7:?)3.13.2(),1,0(PN求服从正态分布已知0861.09032.09893.0)3.1()3.2()]3.2(1[)]3.1(1[)3.2()3.1()3.13.2(:P解例8:。P,值中的求满足服从标准正态分布已知05.0)(96.1975.0205.01)(;205.0)(105.0)](1[2)(2)()()(PPP:P解例9:?,X,X的学生中间包括问在平均数上下多少分标准分其平均分布某次测验分数是正态分%95,67224.60696.17276.83696.172,96.1975.0475.05.0)(4475.0295.0XXXZX:XZXX,XXZZZ,,:平均数以下的分数为平均数以上的分数是移项得根据所对应的找与查附表以上的面积作为正态曲线下平均数将解即在60.24分到83.76分之间包括有95%的学生。图5-101Z2Z95%例10:?,,X,,,,X问录取分数线是多少分准差标分平均分考分接近正态人录取准备人参加考试的有某项职业录取考试11742001600)(65.861115.174,15.14875.0125.01125.01600/200分那么录取分数线对应查附表然后根据的面积作为正态分布上端首先将录取率XZXxZ,,表5-2图5-110Z?Z分数以上的概率是多少求)1(15866.034134.05.0,34134.0)(1以上的概率为时解ZZ,:Z?Z以下的概率呢那么115866.034134.05.0)(Z分数之间的概率两个Z)2(13595.034134.047725.0)1()2()21(P?Z之间的概率呢那么168268.034134.034134.0)1()1()11(P四、常用统计分布样本具有两重性:假设x1、x2…xn是从总体X中抽取的样本,在一次具体的观测或试验中,它们是一批测量值,是一些已知数,即样本具有数的属性。在不同的观测中样本取值可能不同,因此当脱离开特定的具体试验或观测时,并不知道样本x1、x2…xn的具体取值是多少,可以把它们看作随机变量,即样本具有随机变量的属性。如果在相同条件下对总体X进行n次重复的独立观测,那么可以认为所获得的样本x1、x2…xn是独立的,并且服从相同分布的随机变量。如:当我们把一个长度为μ的物体测量了n次,获得样本x1、x2…xn之后,要计算其算术平均数作为μ的估计,其平均数就是对样本进行处理后得到的一个统计量。样本均值、样本方差是几个主要的统计量。三大分布:x2分布、t分布和F分布(一)x2分布。k,k,,、kn)(2222221221记作分布的服从自由度为则它们的平方和且都服从标准正态分布相互独立设随机变量。n,xn,nx,xx、xn,iniin11121所以自由度为可以自由取值个只有实际为一定的情况下当它们的平均值个数如有自由取值的数目自由度即随机变量可以分布的特点2x⑴随着自由度增加,图形渐趋对称;⑵x2具有可加性。设ξ~x2(k1)、η~x2(k2),且ξ与η相互独立,则ξ+η=x2(k1+k2),即ξ+η~x2(k1+k2)图5-12x)(2xxK=1K=2K=6X2分布表的编制与使用(附表6)dxxPk。,,,22)()()10(122222给出了满足等式不同的数及对不同的自由度比不同上所含面积与总面积之值以下或以同一但随着自由度不同面积都是曲线下的分布函数计算出来的分布表是根据。P,,k:值中之求满足式已知例21212)(025.0970.2)9(975.0025.01)(025.0)(1)()(2025.0121221221221221可求得查表而所以用公式不能直接查表题中解,PPPP,:(二)t分布(学生分布)设随机变量ξ~N(0,1),η~x2(k),且ξ与η相互独立,则随机变量kt的分布称为自由度为k的t分布或学生分布,并记作t(k)。图5-13x)(xt0)1,0(,Nk6k2kt分布表的使用。tt,,tdxxttPk,t,ttt右端的概率即只给出这是单侧检验值的给出了满足等式及不同的数即对不同的自由度布函数计算得到的分中所列的值是由附表变化分布的形态随自由度而)()(),10(5。,tt,t概率的一半或者说单侧概率是双侧倍率的正数的概率和为单侧概大于某个小于某个负数与即分布表上列的是双侧有的2。tt2/,双侧记作单侧记作(三)F分布。,,k,k,kkF,Fkk,kkF,kk由度称为第二自为分母的自由度称为第一自由度是分子的自由度其中记作分布的和称为自由度为的分布则随机变量相互独立与且设随机变量212121212212),(//),(~),(~图5-140x)(xF(1,10)(5,10)(10,10)(∞,10)F分布表是根据F