课件制作:应用数学系概率统计课程组概率论与数理统计第五章大数定律与中心极限定理本章要解决的问题1.为何能以某事件发生的频率作为该事件的概率的估计?2.为何能以样本均值作为总体期望的估计?3.为何正态分布在概率论中占有极其重要的地位?4.大样本统计推断的理论基础是什么?ANSWER大数定律中心极限定理设非负随机变量X的期望E(X)存在,则对于任意实数0,)()(XEXP马尔可夫(Markov)不等式证仅证连续型随机变量的情形dxxfXP)()(dxxfx)(0)(1dxxxf)(XE重要不等式5.1大数定律设随机变量X的k阶绝对原点矩E(|X|k)存在,则对于任意实数0,kkXEXP)|(|)|(|推论1设随机变量X的方差D(X)存在,则对于任意实数0,2)()|)((|XDXEXP推论2——切贝雪夫(chebyshev)不等式或2)(1)|)((|XDXEXP示意图ExExExj(x)xDx/2例1设x是掷一颗骰子所出现的点数,若给定e=1,2,实际计算P(|x-Ex|e),并验证切贝谢夫不等式成立.解因P(x=k)=1/6,(k=1,2,3,4,5,6))2|27(|31483512435:2)1|27(|321235:1123512147182449691)(6916362516941,27665432122222xxxxxxxxxPDPDEEDEE例2设有一大批种子,其中良种占1/6.试估计在任选的6000粒种子中,良种所占比例与1/6比较上下小于1%的概率.解设X表示6000粒种子中的良种数,X~B(6000,1/6)01.0616000XP65000)(,1000)(XDXE)60|1000(|XP2606500017685.010883实际精确计算:1060940XP01.0616000XP1059941600060006561kkkkC959036.0用Poisson分布近似计算:1060940XP01.0616000XP937934.010599411000!1000kkke取=1000例3设每次试验中,事件A发生的概率为0.75,试用Chebyshev不等式估计,n多大时,才能在n次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率大于0.90?解设X表示n次独立重复试验中事件A发生的次数,则X~B(n,0.75)nXDnXE1875.0)(,75.0)(90.076.074.0nXP要使,求n即90.076.074.0nXnP即90.001.0|75.0|nnXP由Chebyshev不等式,=0.01n,故2)01.0(1875.0101.0|75.0|nnnnXP令90.0)01.0(1875.012nn解得18750n若E(X)=,D(X)=2,类似于正态分布的3原理,由Chebyshev不等式可估计1111.0913||XP25.0412||XP由Chebyshev不等式,可看出D(X)反映了X偏离E(X)的程度.固定,较小者,22||XP较小.Chebyshev不等式对于22无实际意义大数定律贝努里(Bernoulli)大数定律设nA是n次独立重复试验中事件A发生的次数,p是每次试验中A发生的概率,则0有0limpnnPAn或1limpnnPAn证引入随机变量序列{Xk}发生次试验第发生次试验第AkAkXk,0,1设,)1(pXPk则pqXDpXEkk)(,)(nXXX,,,21相互独立,nkkAXn1记,11nkknXnYnpqYDpYEnn)(,)(由Chebyshev不等式pnnPA0故0limpnnPAn)(nnYEYPnpq21)(1knkkXEnXP在概率的统计定义中,事件A发生的频率“稳定于”事件A在一次试验中发生的概率是指:nnAnnA频率与p有较大偏差pnnA是小概率事件,因而在n足够大时,可以用频率近似代替p.这种稳定称为依概率稳定.贝努里(Bernoulli)大数定律的意义:定义a是一常数,0limaYPnn(或)1limaYPnn则称随机变量序列,,,,21nYYY依概率收敛于常数a,记作aYnPn故pnnnPA,,,,21nYYY是一系列随机变量,设0有若在Bernoulli定理的证明过程中,Yn是相互独立的服从0-1分布的随机变量序列{Xk}的算术平均值,Yn依概率收敛于其数学期望p.结果同样适用于服从其它分布的独立随机变量序列Chebyshev大数定律,,,,21nXXX相互独立,设随机变量序列(指任意给定n1,相互独立),且具有相同的数学期望和方差nXXX,,,21,2,1,)(,)(2kXDXEkk则0有01lim1nkknXnP或11lim1nkknXnP定理的意义:当n足够大时,算术平均值几乎就是一个常数,可以用算术平均值近似地代替数学期望.具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望.注2:,,,,21nXXX相互独立的条件可以去掉,代之以0112nnkkXDn注1:,,,,21nXXX不一定有相同的数学期望与方差,可设,2,1,)(,)(22kXDXEkkkk有011lim11nkknkknnXnP辛钦大数定律设,,,,21nXXX相互独立,服从同一分布,且具有数学期望E(Xk)=,k=1,2,…,则对任意正数001lim1nkknXnP,,,,21nXXX相互独立,注3:设随机变量序列,2,1,)(iXEkki则0有01lim1knikinXnP具有相同的分布,且记knikiMXn1111nPM),,,(21kMMMgnP),,,(21kg则则22nPMknPkM),,,(21kxxxg连续,若§5.2中心极限定理定理1独立同分布的中心极限定理设随机变量序列,,,,21nXXX相互独立,服从同一分布,且有期望和方差:,2,1,0)(,)(2kXDXEkk则对于任意实数x,xtnkkndtexnnXP21221lim注:则Yn为nkkX1的标准化随机变量.)(limxxYPnn即n足够大时,Yn的分布函数近似于标准正态随机变量的分布函数nnXYnkkn1记)1,0(~NYn近似nkkX1nYnn),(2nnN近似服从定理2李雅普诺夫(Liapunov)定理设随机变量序列,,,,21nXXX相互独立,且有有限的期望和方差:,2,1,0)(,)(2kXDXEkkkk记nkknkknXDB1212)(若0)|(|1,0122nnkkknXEB则对于任意实数x,xBXPnnkknkkn11lim)(xxtdte2221定理3德莫佛—拉普拉斯中心极限定理(DeMoivre-Laplace)设Yn~B(n,p),0p1,n=1,2,…则对任一实数x,有xtnndtexpnpnpYP2221)1(lim即对任意的ab,batnndtebpnpnpYaP2221)1(limYn~N(np,np(1-p))(近似)正态分布的概率密度的图形x二项分布的随机变量可看作许多相互独立的0-1分布的随机变量之和,下面是当x-B(20,0.5)时,x的概率分布图00.050.10.150.205101520P普阿松分布相当于二项分布中p很小n很大的分布,因此,参数l=np当很大时也相当于n特别大,这个时候普阿松分布也近似服从正态分布,下面是l=30时的普阿松概率分布图.00.010.020.030.040.050.060.070.0812141618202224262830323436384042444648P例1设有一大批种子,其中良种占1/6.试估计在任选的6000粒种子中,良种所占比例与1/6比较上下不超过1%的概率.解设X表示6000粒种子中的良种数,则X~B(6000,1/6)65000)(,1000)(XDXE6500010009406500010001060650006065000601650006029624.001.0616000XP601000XP65000,1000~NX近似比较几个近似计算的结果用中心极限定理9624.001.0616000XP用二项分布(精确结果)9590.001.0616000XP用Poisson分布9379.001.0616000XP用Chebyshev不等式7685.001.0616000XP例2某车间有200台车床,每台独立工作,开工率为0.6.开工时每台耗电量为r千瓦.问供电所至少要供给这个车间多少电力,才能以99.9%的概率保证这个车间不会因供电不足而影响生产?解设至少要供给这个车间a千瓦的电力设X为200台车床的开工数.X~B(200,0.6),问题转化为求a,使%9.99)0(arXPX~N(120,48)(近似)由于将X近似地看成正态分布,故48120048120)0(raarXP48120ra0)32.17(481200反查标准正态函数分布表,得%9.9909.3令09.348120ra解得rra141)1204809.3((千瓦)例3检查员逐个地检查某种产品,每检查一只产品需要用10秒钟.但有的产品需重复检查一次,再用去10秒钟.假设产品需要重复检查的概率为0.5,求检验员在8小时内检查的产品多于1900个的概率.解检验员在8小时内检查的产品多于1900个即检查1900个产品所用的时间小于8小时.设X为检查1900个产品所用的时间(单位:秒)设Xk为检查第k个产品所用的时间(单位:秒),k=1,2,…,1900XkP10200.50.525)(,15)(kkXDXE19001kkXX190021,,,XXX相互独立,且同分布,47500251900)(28500151900)(XDXE)47500,28500(~NX近似)2880019000()83600190010(XpXP589.43376.19162.0475002850019000475002850028800解法二1019000X—1900