1数理统计2第五章大数定律和中心极限定理关键词:契比雪夫不等式大数定律中心极限定理3§1大数定律背景本章的大数定律,对第一章中提出的“频率稳定性”,给出理论上的论证为了证明大数定理,先介绍一个重要不等式4222225.1,0,1XEXDXPXEXPXEX定理契比雪夫不等式:设随机变量具有数学期望方差则对于任意都有:定理的为:等价形式,fx证明:仅就X为连续型时证之设X的概率密度为xPXfxdx则22xxfxdx221xfxdx222DX()fx5例1:在n重贝努里试验中,若已知每次试验事件A出现的概率为0.75,试利用契比雪夫不等式估计n,使A出现的频率在0.74至0.76之间的概率不小于0.90。nA解:设在重贝努里试验中,事件出现的次数为X,,0.75bn则X,0.75,0.1875,EXnpnDXnpqnnXfAn又0.740.760.750.01XPPXnnn而20.187510.01nn187510.90n18750n6随机变量序列依概率收敛的定义1235.1,,,,0,0,nnnXXlimPXXpn。定义:设随机变量序列X若存在某常数,使得均有:则称随机变量序列依概率收敛于常数,记为:X7122115.2,,,,101limlim1nnnkknnknnkXXnYXnPYPXn定理契比雪夫不等式的特殊情形:设随机变量序列X相互独立,且具有相同的数学期望和相同的方差,作前个随机变量的算术平均:则,有:111,nnkkEYEXnnn证明:由于11nnkkDYDXn211nkkDXn2221nnn22111nkknPXn由契比雪夫不等式得:111nknklimPXn8大数定律的重要意义:贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。5.3,0,1AAnApnnnAlimPpn定理贝努里大数定理设事件在每次试验中发生的概率为,记为次独立重复试验中发生的次数则有:,,Anbnp证明:利用契比雪夫不等式,因故:11,AAnEEnnppnnn20,1AnpqPpnn于是,有2211AAnpqDDnnpqnnnn1AnnlimPpn即得:9§2中心极限定理背景:有许多随机变量,它们是由大量的相互独立的随机变量的综合影响所形成的,而其中每个个别的因素作用都很小,这种随机变量往往服从或近似服从正态分布,或者说它的极限分布是正态分布,中心极限定理正是从数学上论证了这一现象,它在长达两个世纪的时期内曾是概率论研究的中心课题。105.4定理独立同分布的中心极限定理2110,1.(,),()()().nniinYNNnnbnanPaXbnnnii=此定理表明,当充分大时,近似服从即:X(近似)~从而,1Xnii=1思考题:X的近似n分布是什么?2(,)Nn答案:2122112,,,,,,1,2,1,2niiniinnitxinnnXXEXDXiXnnYnXnxRlimPYxlimPxedtn设随机变量X相互独立同分布,则前个变量的和的标准化变量为:有:证明略。115.5定理德莫佛--拉普拉斯定理2215.4,(1)2tbAnannplimPabedtnpp由定理10iiAiA第次试验时发生证明:令X第次试验时未发生2201,1,lim,(1)2AtbAnannAPAppnnpabPabedtnpp设为次贝努里试验中发生的次数,则对任何区间,有:12,,,,~(1,).nXXbpi则X相互独立同分布,X12,AnnXXX由于()~(,(1)).NnpnppA即:n近似()(1)()(1)APanbbnpnppanpnpp12例2:设某种电器元件的寿命服从均值为100小时的指数分布,现随机取得16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1920小时的概率。121616,,,,XX解:记只电器元件的寿命分别为X16116iiX则只电器元件的寿命总和为X,2100,100iiEXDX由题设1611610016000,14100400iiXXN根据独立同分布的中心极限定理:Y近似服从192011920PXPX19201600140010.80.211913例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元,若老人在该年内死亡,公司付给受益人1万元。设老年人死亡率为0.017,试求保险公司在一年内这项保险亏本的概率。200PX,,10000,0.017bnpnp解:设X为一年中投保老人的死亡数,则X由德莫佛--拉普拉斯中心极限定理,保险公司亏本的概率为:1000010000200PX20011npnpp12.3210.0110思考题:求保险公司至少盈利万元的概率。答案:0.93714例4:设某工厂有400台同类机器,各台机器发生故障的概率都是0.02,各台机器工作是相互独立的,试求机器出故障的台数不小于2的概率。4000.020.982.8121(1)170.99382.8npqnpPXPXnpq,400,0.02b解:设机器出故障的台数为X则X,分别用三种方法计算:1.用二项分布计算400399210110.984000.020.980.9972PXPXPX2.用泊松分布近似计算4000.028210110.0003350.0026840.9969npPXPXPX查表得3.用正态分布近似计算15第六章数理统计的基本概念关键词:总体个体样本统计量2分布t分布F分布16引言:数理统计学是一门关于数据收集、整理、分析和推断的科学。在概率论中已经知道,由于大量的随机试验中各种结果的出现必然呈现它的规律性,因而从理论上讲只要对随机现象进行足够多次观察,各种结果的规律性一定能清楚地呈现,但是实际上所允许的观察永远是有限的,甚至是少量的。例如:若规定灯泡寿命低于1000小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一。17§1总体和样本总体:研究对象的全体。如一批灯泡。个体:组成总体的每个元素。如某个灯泡。抽样:从总体X中抽取有限个个体对总体进行观察的取值过程。随机样本:随机抽取的n个个体的集合(X1,X2,…,Xn),n为样本容量简单随机样本:满足以下两个条件的随机样本(X1,X2,…,Xn)称为简单随机样本。1.每个Xi与X同分布2.X1,X2,…,Xn是相互独立的随机变量[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体X具有概率密度f(x),则样本(X1,X2,…,Xn)具有联合密度函数:121,,nnniifxxxfx18统计量:样本的不含任何未知参数的函数。常用统计量:设(X1,X2,…,Xn)为取自总体X的样本221231232123323121,,,,1X2X23max,,145iiNXXXXXXXXXXX思考题:(一)设在总体中抽取样本其中已知,未知指出在中哪些是统计量,哪些不是统计量,为什么?111.XniiXn样本均值1113.1,2,1()1,2,nkkiinkkiikAXknkBXXkn样本矩阶矩:阶中心矩:22112.(),1niiSXXSn样本方差为样本标准差222,,...,(),()()__,()___,()__.nXXXEXDXEXDXES1(二)设X是总体的样本,若,则答:只有(4)不是统计量。2n219随机变量独立性的两个定理1121111211122111126.,,,,,,,,,,,1,2,,,,,,,,1,iiiknninnknnnkknnnYgXXYgXXXXnygxxxxRikknnngXnkYX设X是相互独立的个随机变量,定又设是个连续函数,且有则个随机变量:是相互理:独立的。11111111111,,,,1,2,,,,,,,,6,2,.titntntnntinititXXXXitnXXXX设个随机变量是相互独立的,又设对每一个个随机变量X是相互独立的,定理:随机变量X是相互则独立的。20§2常用的分布•12222221,,0,11,2,,11nnniiiXXXNinnn设随机变量X相互独立,X则称服从自由度为的,定指式右端包含分布记为自的独立变度义:由量的个数22121010222060.3nynxyeynfynyxedx分布的概率密度为:其理中定:2分布x()fx010n1n4n2分布的概率密度函数212分布的一些重要性质:22221.,,2nEnDn设则有22211221212122.,,,YnYnYYYYnn设且相互独立,则有22分布的可加性性质称为,可推广到有限个的情形:221211,,,,mmiimiiiiYnYYYYn设且相互独立,则22222,01,,nnfdynynn为分布的上分对给定的概率称满足条件的点上分位数的值可查位数分布表2n02分布的分位数x()fx222212222122223451,,,,,,1())(2)~(),nniiNXXXXXbXXXk1例:设总体X已知。是取自总体X的样本求(1)统计量的分布;(2)设n=5,若a(X则a,b,k各为多少?1,2,,iiXYin解:(1)作变换12,,,0,11,2,,niYYYYNin显然相互独立,且22211()nniiiiXYn2于是22212122()(2)~(0,2),~(1)2XXXXN2223453452(2)2~(0,6),~(1)6XXXXXXN123452223451222(2)()~(2)26XXXXXXXXXX与2相互独立,故+221,21,62.