第五章大数定理与中心极限定理“概率是频率的稳定值”。前面已经提到,当随机试验的次数无限增大时,频率总在其概率附近摆动,逼近某一定值。大数定理就是从理论上阐明并推广这一结果。中心极限定理阐明,原本不是正态分布的一般随机变量总和的分布,在一定条件下可以渐近服从正态分布。这两类定理在概率统计中具有重要地位。11lim{||}1.nknkPXn•定理(辛钦大数定律):设{Xk}是相互独立同分布的随机变量序列,且具有相同的数学期望µ,则对于任意给定的ε0,恒有§1大数定理下面仅在Xk方差有限的条件下证明本定理。22||PX设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有221PX或者契比雪夫(Chebyshev)不等式11,nnkkXXn辛钦大数定律的证明:11{||}nkkPXn所以221111()()()nnnkkkkDXDXDXnnn222()11nDXn1111()()()nnnkkkkEXEXEXnn{|()|}nnPXEX定义设随机变量序列{Yn},如果存在一个常数a,使得对任意的ε0,有limnnPYa=1则称Yn依概率收敛于a,记作pnYa11.npkkXn•定理(辛钦大数定律):设{Xk}是相互独立同分布的随机变量序列,且具有相同的数学期望µ,则对于任意给定的ε0,恒有伯努利大数定律:设fn为n次独立重复试验中事件A发生的次数,每次试验中事件A发生的概率为p,则.pnfpn证明:设10iX第i次试验事件A发生第i次试验事件A不发生则X1,X2,…,Xn,…为独立同分布的随机变量序列,而且()iEXp同时1nniifX故由辛钦大数定律1niPniXfpnn例:11211,,,,~(1,1).111nnnkkkkXXXUXXnn设随机变量相互独立同分布,则(),(2)分别依概率收敛吗?如果依概率收敛,分别收敛于什么?1122211211,,,,(),,,,()11nnnnkkkkXXEXXXEXXXnn解:由辛钦大数定律,相互独立同分布,存在,相互独立同分布,存在,故,,均依概率收敛。1()0,EX因为,11nkkXnP故0;12211(),EXxdx1123211.nkkXnP1故31111()()nnnkkkkkknnkkXEXXnYnDX221(){}()2limlimtxnnnnFxPYxedtx定理(林德贝尔格-勒维(Lindeberg-Levy)定理):设{Xk}为相互独立的随机变量序列,服从同一分布,且具有数学期望E(Xk)=μ和方差D(Xk)=σ2,则随机变量的分布函数Fn(x),对于任意x,满足§2中心极限定理中心极限定理阐明了这样一个道理:如果一个随机变量X可以看着许多微小而独立的随机因素作用的总后果,每一种因素的影响都很小,则X近似地服从正态分布.这也正态分布广泛存在的原因。例如对某物的长度进行测量,在测量时有许多随机因素影响测量的结果.如温度和湿度等因素对测量仪器的影响,使测量产生误差X1;测量者观察时视线所产生的误差X2;测量者心理和生理上的变化产生的测量误差X3;…显然这些误差是微小的、随机的,而且相互没有影响.测量的总误差是上述各个因素产生的误差之和,即∑Xi,因此根据中心极限定理,我们可以认为测量误差近似服从正态分布。221{}()(1)2limtxnnYnpPxedtxnpp定理(DeMoivre-Laplace中心极限定理):设随机变量Yn服从二项分布Yn~B(n,p),(0p1),则对于任意x,恒有2121{}{}(1)(1)2limlimntixninnXnpYnpPxPxedtnppnpp证明设X1,X2,…,Xn是n个相互独立的服从(0-1)分布(P{Xi=0}=1-p,P{Xi=1}=p)的随机变量,则Yn=X1+X2+…+Xn由于E(Xi)=p,D(Xi)=p(1-p)(i=1,2,…,n),由此得例.用机器包装味精,每袋味精净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率?解:设一箱味精净重为X,箱中第i袋味精净重为Xi,(i=1,2,…,200)则X1,X2,…,X200独立同分布,EXi=100,DXi=102=100,且2001iiXX由独立同分布的中心极限定理得:X近似服从正态分布,且EX=200EXi=20000,DX=200DXi=20000,所求为P(X20500)=1-P(X≤20500))200002000020500(1)54.3(1=0.0002故一箱味精净重大于20500的概率为0.0002.20120510020100/1220100/12kkVVZ100105100100{105}{}1{0.387}20100/1220100/1220100/121(0.387)0.348{105}0.348VVPVPPPV即有•例:一加法器同时收到20个噪声电压Vk(k=1,2,…,20),它们相互独立且都在区间[0,10]上服从均匀分布,噪声电压总和V=V1+V2+…+V20,求P{V105}的近似值.•解:易知E(Vk)=5,D(Vk)=100/12,由独立同分布的中心极限定理知近似服从标准正态分布N(0,1),于是例现有一批良种率为0.6的种子,从其中任意抽出1000粒,试问在这1000粒种子中,良种所占的比例在2/5至4/5之间的概率是多少?解抽一粒种子看成是一次随机试验,因此抽1000粒种子看作是1000重伯努利试验.若令X表示1000粒种子中的良种数,则X服从n=1000,p=0.6的二项分布,故由德莫佛-拉普拉斯中心极限定理可知:10000.610000.60.4(0,1).XYN近似服从标准正态分布于是24400800510005XPPX40010000.610000.680010000.610000.60.410000.60.410000.60.4XP12.9112.91212.9111.10000.612.9112.9110000.60.4XP例:某保险公司接纳了1100辆摩托车保险,每辆摩托车每年付80元保险费。若摩托车丢失,则车主得赔偿2000元.假设摩托车的丢失率为0.01。问:(1)保险公司亏本的概率有多大?(2)其他条件不变,为使保险公司一年的利润不少于50000元的概率不小于90%,赔偿金至多可设为多少?解设X表示一年内摩托车的丢失数,则X~B(n,p),其中n=1100,p=0.01,设Y表示保险公司一年的利润,Y=110080-2000X.由中心极限定理可知:11000.0111000.010.99X近似服从标准正态分布N(0,1).(0)PY(1)(11008020000)PX(44)PX1(44)PX11000.011(11000.010.994411000.01)11000.010.99XP11000.011(10)11000.010.99XP1(10)0.{50000}0.9PYP{Y50000}=P{110080-aX50000}=P{X38000/a}0.9;3800011000.0138000()()0.911000.010.99aPXa(2)设赔偿金为a元,则令由中心极限定理,上式等价于注意到(1.28)0.9,于是3800011000.011.2811000.010.99a2496a