中心极限定理(精)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

5.2中心极限定理大数定律讨论的是多个随机变量的算术平均的渐近性质.现在我们来讨论独立随机变量和的极限分布.先给出一个例子.第5章大数定律和中心极限定理【例5-4】误差分析是人们经常遇到且感兴趣的随机变量,大量的研究表明,误差是由大量微小的相互独立的随机因素叠加而成的.现在考虑一位操作工在机床上加工机械轴,要求其直径应符合规定要求,但加工后的机械轴与规定要求总会有一定误差,这是因为在加工时受到一些随机因素的影响,它们是:(1)在机床方面有机床振动与转速的影响;(2)在刀具方面有装配与磨损的影响;5.2中心极限定理(3)在材料方面有钢材的成分、产地的影响;(4)在操作者方面有注意力集中程度、当天的情绪的影响;(5)在测量方面有度量工具误差、测量技术的影响;(6)在环境方面有车间温度、湿度、照明、工作电压的影响;(7)在具体场合还可列出许多其他影响因素.5.2中心极限定理由于这些因素很多,每个因素对加工精度的影响都是很微小的,而且每个因素的出现又都是人们无法控制的、随机的、时有时无、时正时负的.这些因素的综合影响最终使每个机械轴的直径产生误差,若将这个误差记为Yn,那么Yn是随机变量,且可以将Yn看作很多微小的随机波动X1,X2,…,Xn之和,即Yn=X1+X2+…+Xn,这里n是很大的,那么我们关心的是,当时,Yn的分布是什么?5.2中心极限定理当然,我们可以考虑用卷积公式去计算Yn的分布,但这样的计算是相当复杂的、不现实的,而且也是不易实现的.有时即使能写出Yn的分布,但由于其形式过于复杂而无法使用.本节研究在相当一般的条件下独立随机变量的和的分布收敛于正态分布的问题.5.2中心极限定理5.2.1独立同分布的中心极限定理定理5.5(独立同分布的中心极限定理)设X1,X2,…,Xn,…为相互独立、服从同一分布的随机变量序列,且D(Xi)=20(i=1,2,…),则对于任意x,有(5.6)该定理我们通常称之为林德伯格-莱维(Lindeberg-Levy)定理,该定理是这两位学者在上世纪20年代证明的,这里证明从略.,)(iXE)(21lim212xΦdtexnnXPxtniin5.2中心极限定理我们来看一下(5.6)式含义:若记记为Yn的分布函数,则(5.6)式可以写成这表明,当充分大时,Yn近似服从标准正态分布N(0,1),即从而当n充分大时,(5.7),1nnXYniin)(xFnY)()(limxΦxFnYn)1,0(~1NnnXnki近似),(~21nnNXnii近似5.2.1独立同分布的中心极限定理(5.7)(5.7)式说明,不论X1,X2,…,Xn服从什么分布,只要满足定理的条件,当n充分大时,就可以把作为正态随机变量处理,这在理论研究和实际计算上都非常重要.我们将上述结论稍作变形,还可以得到定理结论的另外表现形式.),(~21nnNXnii近似niiX15.2.1独立同分布的中心极限定理推论5.1设相互独立的随机变量X1,X2,…,Xn服从同一分布,其均值为,方差为20,则当n充分大时即(5.8)其中由推论可知,无论X1,X2,…,Xn是服从什么分布,其算术平均值当n充分大时总是近似地服从正态分布.这一结果是数理统计中大样本理论的基础.)1,0(~NnX近似),(~2nNX近似.11niiXnX5.2.1独立同分布的中心极限定理【例5.5】用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20400克的概率.解:设箱中第i袋味精的净重为Xi克,是200个相互独立同分布的随机变量.且由定理5.5即,100)(,100)(iiXDXE200,,2,1i)100200,100200(~2001NXii近似)20000,20000(~2001NXii近似20021,,,XXX5.2.1独立同分布的中心极限定理所以)20000,20000(~2001NXii近似}20400{1}20400{20012001iiiiXPXP)83.2(1200002000020400200002000012001ΦXPii0023.09977.015.2.1独立同分布的中心极限定理5.2.2二项分布的正态近似现在将定理5.5应用于服从0-1分布的随机变量,即设X1,X2,…,Xn,…相互独立,且都服从参数为的0-1分布:P{Xi=k}=pk(1–p)1-k,k=0,1;i=1,2,…此时,又记,则n~B(n,p).此时定理5.5的结论可写成),2,1(),1()(,)(ippXDpXEiiniinX1)(21)1(lim22xΦdtexppnnpPxtnn于是,有下述定理:定理5.6(棣莫弗—拉普拉斯定理)设n(n=1,2,…)服从参数为n,p(0p1)的二项分布,则对于任意实数x,有这个定理表明,当n充分大时,服从二项分布的随机变量n的标准化变量近似服从标准正态分布.即有)(21)1(lim22xΦdtexpnpnpPxtnn)1,0(~)1(Npnpnpn近似5.2.2二项分布的正态近似从而即当n充分大时,服从二项分布的随机变量n近似服从正态分布.))1(,(~pnpnpNn近似5.2.2二项分布的正态近似一般来说,当n较大时,二项分布的概率计算起来非常复杂,这时我们就可以用正态分布来近似二项分布,使概率计算得到简化.即对于任意正数n1和n2,有(5.10)}{)1(2121nnknknkknnnPppC))1(())1((12pnpnpnpnpnpn})1()1()1({21pnpnpnpnpnppnpnpnPn5.2.2二项分布的正态近似【例5.6】设电路供电网内有10000盏相同的灯,夜间每一盏灯开着的概率为0.8,假设各灯的开关彼此独立,计算同时开着的灯数在7800与8200之间的概率.解:记同时开着的灯数为X,它服从二项分布B(10000,0.8),于是由定理5.6,有))1(260260()1(260260)1(260260}{pppxΦpppxpppPxP%95))1(260260(pppxΦ令95.09505.0)65.1(查表得65.1)1(260260pppx故取5.2.2二项分布的正态近似【例5.6】设电路供电网内有10000盏相同的灯,夜间每一盏灯开着的概率为0.8,假设各灯的开关彼此独立,计算同时开着的灯数在7800与8200之间的概率.解:记同时开着的灯数为X,它服从二项分布B(10000,0.8),于是由定理5.6,有}82007800{XP11)5(21)4.02(2)2.08.01000080007800()2.08.01000080008200(ΦΦ5.2.2二项分布的正态近似【例5.7】某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能以95%的概率满足每个分机在用外线时不用等候?解:设表示同时使用外线的分机数,则~B(260,p),其中p=0.04.根据题意应确定最小的使成立.由定理5.6,有%95}{xP))1(260260()1(260260)1(260260}{pppxΦpppxpppPxP5.2.2二项分布的正态近似令查得故取于是也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候.%95))1(260260(pppxΦ95.09505.0)65.1(65.1)1(260260pppxpppx260)1(26065.161.1504.026096.004.026065.15.2.2二项分布的正态近似【实验5.1】用Excel验证二项分布逼近正态分布.实验准备:(1)函数SUMXMY2的使用格式:SUMXMY2(array_x,array_y)功能:返回两数组中对应数值之差的平方和.其中Array_x为第一个数组或数值区域,Array_y为第二个数组或数值区域.5.2.2二项分布的正态近似(2)函数BINOMDIST的使用格式:BINOMDIST(number_s,trials,probability_s,cumulative)功能:返回二项分布的概率值.其中,number_s为试验成功的次数,trials为独立试验的次数,probability_s为每次试验中成功的概率,cumulative为一逻辑值,用于确定函数的形式.如果cumulative为TRUE,返回累积分布函数值,即至多number_s次成功的概率;如果为FALSE,返回概率函数值,即number_s次成功的概率.5.2.2二项分布的正态近似(3)函数NORMDIST的使用格式:NORMDIST(x,mean,standard_dev,cumulative)功能:返回给定均值和标准偏差的正态分布函数值.其中,x为一实数值,mean为正态分布的均值,standard_dev正态分布的标准偏差,cumulative为一逻辑值,指明函数的形式.如果cumulative为TRUE,函数NORMDIST返回累积分布函数值;如果为FALSE,返回概率密度函数值.5.2.2二项分布的正态近似实验步骤:(1)按图5-1左所示,在Excel中做实验准备.(2)在单元格C3中输入公式:=C1*C2(3)在单元格C4中输入公式:=C3*(1-C2)(4)在单元格B6中输入二项分布概率函数:=BINOMDIST(A6,$C$1,$C$2,FALSE)并将其复制到单元格区域B7:B15中.5.2.2二项分布的正态近似(5)在单元格C6中输入正态分布概率密度函数:=NORMDIST(A6,C$3,SQRT(C$4),FALSE)并将其复制到单元格区域C7:C15中(6)在单元格D6中输入计算两列数据的误差平方和公式:=SUMXMY2(B6:B15,C6:C15)即得计算结果如图5-1右所示.图5-1实验准备与计算结果5.2.2二项分布的正态近似注意到其中的误差平方和为:0.000204023(7)用鼠标选中单元格区域B5:C15,做折线图如图5-2左所示.图5-2n=7、10、100时二项分布的概率函数图和正态分布的概率密度图5.2.2二项分布的正态近似(8)修改单元格C1中数据为10,并将单元格区域B6:C6中公式复制到区域B7:C15中.(9)修改单元格D6中公式为:=SUMXMY2(B6:B15,C6:C15)得到误差平方和为:0.000007757.做出的折线图如图5-2中所示.5.2.2二项分布的正态近似(10)再次修改单元格C1中数据为100,与8)、9)相仿,可以依次得到误差平方和2.5798410-07,折线图如图5-2右所示.说明:随着n的增大,二项分布逐渐逼近正态分布.5.2.2二项分布的正态近似【吸烟率调查问题解答】某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计,现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%,问至少要调查多少对象?解:设共调查n个成年男子,记则Xi独立同分布,且又记n个调查对象中,吸烟的人数为X,则有.,2,10,1niiiXi个成年男子不吸烟,第,个成年男子吸烟,第由大数定理知,当n很大时,频率X/n与概率p很接近,可用X/n作为p的估计.依

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功