阜师院数科院第五章大数定理与中心极限定理•“概率是频率的稳定值”。前面已经提到,当随机试验的次数无限增大时,频率总在其概率附近摆动,逼近某一定值。大数定理就是从理论上说明这一结果。正态分布是概率论中的一个重要分布,它有着非常广泛的应用。中心极限定理阐明,原本不是正态分布的一般随机变量总和的分布,在一定条件下可以渐近服从正态分布。这两类定理是概率统计中的基本理论,在概率统计中具有重要地位。阜师院数科院§1大数定理22||XP•定理(契比雪夫(Chebyshev)不等式):设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有221XP§1.1契比雪夫(Chebyshev)不等式阜师院数科院||)(}|{|xdxxpXP||}{}|{|kxkxXPXP证明(1)设X的概率密度为p(x),则有(2)设离散型随机变量X的分布律为P{X=xk}=pk,则有||22)(||xdxxpx2222)()(1dxxpx||22}{][kxkkxXPx2222][1kkkpx阜师院数科院4142}4|20{|22XP•例:在供暖的季节,住房的平均温度为20度,标准差为2度,试估计住房温度与平均温度的偏差的绝对值小于4度的概率的下界.解}4|20{|XP}4|20{|1XP43411阜师院数科院例:已知随机变量X的数学期望为E(X)=μ,方差2)(XD,当2和3时,试用切比雪夫不等式求概率XP的近似值.解时当2412222XP时当3913322XP阜师院数科院§1.2大数定律1}|)(11{|lim11nkknkknXEnXnP•定义:设{Xk}是随机变量序列,数学期望E(Xk)(k=1,2,...)存在,若对于任意ε0,有则称随机变量序列{Xn}服从大数定律.阜师院数科院1}|)(11{|lim11nkknkknXEnXnP,11nkknXnX记•定理(契比雪夫(Chebyshev)大数定律):设{Xk}是两两不相关的随机变量序列,具有数学期望E(Xk)和方差D(Xk)[k=1,2,...].若存在常数C,使得D(Xk)≤C(k=1,2,…),则对于任意给定的ε0,恒有证明}|)(11{|lim11nkknkknXEnXnP所以nCXDnXnDXDnkknkkn11)(1)1()(1)1(lim))(1(lim22nCXDnnnnkknkknXEnXnEXE11)(1)1()(则}|)({|limnnnXEXP阜师院数科院1}|1{|1limnkknXnP•推论(契比雪夫大数定律的特殊情况):设{Xk}是两两不相关的随机变量序列,具有相同的数学期望E(Xk)=μ和方差D(Xk)=σ2(k=1,2,…),则对于任意给定的ε0,恒有注:nkknkkXEnXnE11)(1)1(阜师院数科院例:设随机变量,,,,21nXXX相互独立,且有如下表的分布律,问:对随机变量,,,,21nXXX可否使用大数定理?iX202ip412141),,,2,1(ni解因为,,,,21nXXX相互独立,0iXE,12iXE又22iiiXEXEXD101,,,,2,1ni所以,满足切比雪夫大数定理的条件,可使用大数定理.阜师院数科院伯努里大数定律:设进行n次独立重复试验,每次试验中事件A发生的概率为p,记fn为n次试验中事件A发生的频率,则npfpn证明:设01iX第i次试验事件A发生第i次试验事件A不发生则)1()(,)(ppXDpXEii由切比雪夫大数定律pnXfPniin1阜师院数科院§2中心极限定理•在一定条件下,许多随机变量的极限分布是正态分布:“若一个随机变量X可以看着许多微小而独立的随机因素作用的总后果,每一种因素的影响都很小,都有不起压倒一切的主导作用,则X一般都可以认为近似地服从正态分布.”•例如对某物的长度进行测量,在测量时有许多随机因素影响测量的结果.如温度和湿度等因素对测量仪器的影响,使测量产生误差X1;测量者观察时视线所产生的误差X1;测量者心理和生理上的变化产生的测量误差X3;…显然这些误差是微小的、随机的,而且相互没有影响.测量的总误差是上述各个因素产生的误差之和,即∑Xi.阜师院数科院•一般地,在研究许多随机因素产生的总影响时,很多可以归结为研究相互独立的随机变量之和的分布问题,而通常这种和的项数都很大.因此,需要构造一个项数越来越多的随机变量和的序列:,...2,1,1nXnii•我们关心的是当n→∞时,随机变量和∑Xi的极限分布是什么?由于直接研究∑Xi的极限分布不方便,故先将其标准化为:)()(111niiniiniinXDXEXY再来研究随机变量序列{Yn}的极限分布.阜师院数科院nknkknkknknkkknnkknBXXDXEXYXDB111112)()()(dtexYPtnn2221}{lim•定义:设{Xk}为相互独立的随机变量序列,有有限的数学期望E(Xk)=μk和方差D(Xk)=σk2,令若对于一切实数x,有则称随机变量序列{Xk}服从中心极限定理.阜师院数科院nkknkknkknknkkknnXnnXXDXEXY11111)()()(21}{)(22limlimxdtexYPxFtnnnn•定理(林德贝尔格-勒维(Lindeberg-Levy)定理):设{Xk}为相互独立的随机变量序列,服从同一分布,且具有数学期望E(Xk)=μ和方差D(Xk)=σ2,则随机变量的分布函数Fn(x),对于任意x,满足阜师院数科院例:将一颗骰子连掷100次,则点数之和不少于500的概率是多少?解设Xk为第k次掷出的点数,k=1,2,…,100,则X1,…,X100独立同分布.123544961)(,27)(61211ikXDXE由中心极限定理123510271005001}500{1001iiXP0)78.8(1阜师院数科院例:设随机变量,,,,21nXXX相互独立均服从泊松分布)2(.若随机变量1001100iiXY,求210190100YP.解因为iX服从)2(,,2,1i即2!2ekkXPki,),2,1(k所以2)(,2)(iiXDXE,100,,2,1i100Y近似服从2210,200N,于是210190100YP21020019021020021052.01707.02阜师院数科院dtexpnpnpYPtnn2221})1({lim•定理(DeMoivre-Laplace中心极限定理):设随机变量Yn服从二项分布Yn~B(n,p),(op1),则对于任意x,恒有dtexpnpnpYPpnpnpXPtnnniin21221})1({})1({limlim证明设X1,X2,…,Xn是n个相互独立的服从(0-1)分布(P{Xi=0}=1-p,P{Xi=1}=p)的随机变量,则Yn=X1+X2+…+Xn由于E(Xi)=p,D(Xi)=p(1-p)(i=1,2,…,n),由此得阜师院数科院例:设某妇产医院出生男孩的概率为0.515,求在10000个新生儿中,出生的女孩不少于男孩的概率.解法1设X为10000个新生儿中男孩个数则X服从B(n,p),其中n=10000,p=0.515由德莫弗-拉普拉斯中心极限定理,所求概率为5000XP)1(5000)1(pnpnppnpnpXP)1(5000pnpnp00135.03)515.01(515.010000515.0100005000阜师院数科院个是女孩第个是男孩第i0i1iX),,,(1000021i则100001iiXX,且1000021,,,XXX独立同分布)(iXE515.0)515.01(0515.01222)()()(iiiXEXEXD22515.0515.01249775.0设X为10000个新生儿中男孩个数则女孩不少于男孩的概率为5000XP249775.010000515.0100005000249775.010000515.010000XP00135.03249775.010000515.0100005000解法2阜师院数科院12/1002010012/10020520201VVZkk348.0}105{348.0)387.0(1211}387.012/10020100{1}12/1002010010512/10020100{}105{387.022VPdteVPVPVPt即有•例:一加法器同时收到20个噪声电压Vk(k=1,2,…,20),它们相互独立且都在区间[0,10]上服从均匀分布,噪声电压总和V=V1+V2+…+V20,求P{V105}的近似值.•解:易知E(Vk)=5,D(Vk)=100/12,由独立同分布的中心极限定理知近似服从标准正态分布N(0,1),于是阜师院数科院例:在一家保险公司里有10000个人参加寿命保险,每人每年付12元保险费。在一年内一个人死亡的概率为0.6%,死亡时其家属可向保险公司领得1000元,问:(1)保险公司亏本的概率有多大?(2)其他条件不变,为使保险公司一年的利润不少于60000元,赔偿金至多可设为多少?阜师院数科院解设X表示一年内死亡的人数,则X~B(n,p),其中n=10000,p=0.6%,设Y表示保险公司一年的利润,Y=1000012-1000X于是由中心极限定理(1)P{Y0}=P{1000012-1000X0}=1P{X120}1(7.75)=0;阜师院数科院9.0}60000{YPP{Y60000}=P{1000012-aX60000}=P{X60000/a}0.9;9.0)994.0006.010000006.01000060000(a(2)设赔偿金为a元,则令3017a由中心极限定理,上式等价于