第一章统计推断准备0.预备知识0.1大数定律与中心极限定理阐明大量随机现象平均结果的稳定性的一系列定理统称大数定律,而研究独立随机变量的和的极限分布在什么条件下为正态分布的一类定理叫中心极限定理。0.1.1车贝雪夫不等式设随机变量有期望和方差,则对任意,有2DPEED00.1.2大数定律定义:若随机变量序列,如果存在常数列使得对任意的有成立,则称随机变量序列服从大数定律.定理1(贝努里大数定律)设是n重贝努里试验中事件A出现的次数,又A在每次试验中出现的概率为p(0p1),则对任意的,有:12,,...,,...n12,,...,,...naaa011lim1ninniPannn0lim1nnPpn定理2(车贝雪夫大数定律)设是一列两两不相关的随机变量,又设他们的方差有界,既存在常数C0,使有则对任意的,有例1.:设为独立同分布的随机变量序列,均服从参数为的泊松分布则定理3(辛钦大数定律)设是一列独立同分布的随机变量,且数学期望存在,则对任意的有12,,...,,...n,1,2,...iDCi01111lim1nniiniiPEnn12,,...,,...n,,1,2,...iiEDi11lim1niniPn12,,...,,...n011lim1niniPan,2,1,,iCDaEii0.1.3.中心极限定理定理1(林德贝格-勒维定理)若是独立同分布的随机变量序列,且则随机变量,其中的分布函数对一切x,有:即随机变量渐近地服从标准正态分布。定理2(德莫佛-拉普拉斯定理)设是n重贝努里试验中事件A出现的次数,而0p1是事件A在每次试验中出现的概率,则渐近的服从正态分布,其中q=1-p或2nnSnan12,,...,,...n2,0,1,2,...kkEaDk1nniiSnFx2221limlimlim2txnnnnnnSnaFxPxPxedtnnn,Nnpnpq221lim2txnnnpPxedtnpqn例2:有一批建筑房屋用的木柱,其中80%的长度不小于3米,现从这批木柱中随机地取出100根,问其中至少有30根短于3米的概率是多少?例3:某车间有200台车床,独立工作,开工率为0.6,开工时耗电各为1000瓦,问供电部门至少要供给这个车间多少电力才能使99.9%的概率保证这个车间不会因为供电不足而影响生产。例4:一加法器,同时收到20个噪声电压设他们是相互独立的,且在区间(0,10)上服从均匀分布的随机变量,记,求,1,2,...,20kUk201kkUU105PU§1基本概念1.1总体与样本总体:研究对象的全体,记为X或,是指一个随机变量。个体:组成总体的每个单元。样本:就是n个相互独立且与总体有相同概率分布的随机变量,i=1,2,…,n,所组成的n维随机变量样本值:每一次具体的抽样所得的数据就是n个随机变量的值(样本值)用小写字母表示。注:样本具有双重性,即它本身是随机变量,但一经抽取便是一组确定的具体值。定义:若随机变量相互独立且每个,i=1,2,…,n,与总体有相同的概率分布,则称随机变量为来自总体的容量为n的简单随机样本,称,i=1,2,…,n为样本的第i个分量。若有分布密度(或分布函数)则称是来自总体(或)的样本.i12,,...,n12,,..,nxxxiifxFx12,,...,nfxFxn,,,21n,,,211.2统计量定义:设为总体的一个样本,为一个实值函数,如果T中不包含任何未知参数,则称为一个统计量。统计量的分布称为抽样分布。例如:总体,a已知,未知,为的一个样本,则是统计量,但不是统计量。1.3顺序统计量及经验分布1.3.1顺序统计量设为总体,的一个样本,将其诸分量,i=1,2,…,n,按由小到大的次序重新排列为,即,称为总体的第k个顺序统计量(次序统计量),特别称为最小项统计量,为最大项统计量。12,,...,n12,,..,nTxxx12(,,...,)nT2~,Na212,,...,n21niia11niii(1)(2)()(,,...,)n,1,2,...,kkn(1)()n12,,...,n(1)(2)()...n例1.5:设有一个总体,它以等概率取0,1,2三个值,现从此总体中取容量为2的一个样本,列出样本所有可能取值情况和相应的次序统计量的情况。12,XX12,XX),()2()1(XX1.3.2经验分布由给定的样本定义一个函数,此函数的性质:(1)当样本固定时,作为x的函数是一个阶梯形的分布函数,恰为样本分量不大于x的频率。(2)当x固定时,它是一个统计量,其分布由总体的分布所确定。•即(二项分布)称为总体对应于样本的经验分布函数。)(),1()()1(,1)1,...,2,1(,,0)(nkknxnkxnkxxF12(,,...,)n*12,,...,~,nnnFbnFx12(,,...,)n)(xFn)(xFn1.4常用的一些统计量1.4.1样本的分位数设~为总体,为样本,为顺序统计量,定义称为样本的分位数。当=1/2时,称为样本的中位数。(也用表示)例1.6:若(1.5,2.0,4.0,0,8,3.5,9),则?1.4.2.样本的极差称为样本的极差Fx12(,,...,)n(1)(2)()(,,...,)n*11111,1nnnnnnnnn**1/2em),...,,(721),...,,()7()2()1(1nDn1.4.3样本分量的秩若,则称的秩为j,记作,它表示样本第个分量,处于顺序统计量中的位次。1.4.4.样本矩设为总体取出的容量为n的样本,统计量叫样本均值;统计量叫样本方差(而称叫修正的样本方差);统计量,(r=1,2,…)叫样本的r阶原点矩;统计量,(r=1,2,…)叫作样本的r阶中心矩。kjkkrjkk12,,...,n11niin2211nniiSn22111niiSnnirirnB1)(1nirirnA1)(11.4.5二元总体的样本矩设为二元随机变量,,,…,为其样本,称为的边际样本方差;为的边际样本方差;为样本的协方差;为样本的相关系数。,11,22,,nn22111niiSn22211niiSn21211niiiSn1212SRSS§2.常用统计量的抽样分布2.1顺序统计量的分布(次序统计量)2.1.1定义设()是来自总体的一个样本,()是该样本的一组观察值,将它按由小到大的次序排列成,如果规定的取值为,k=1,2,…,n,则称为()的一组次序统计量,而称为第k个次序统计量。(见1.3.1)2.1.2连续型总体次序统计量的分布(仅给出结论)定理2.1设总体,,为的一个样本,则第k个次序统计量的概率密度函数为:分布函数为:X12,,...,nXXX(1)(2)()...nxxxkx12,,...,nxxxkX12,,...,nXXXkX),()(,),2()1(nXXXXkX~XFxfx1!11!!knkknfyFyFyfyknk10!11!!FynkkknFyuuduknk12,,...,nXXX特别:当k=1时,得样本极小值的分布密度与分布函数为:当k=n时,得样本极大值的分布密度与分布函数为:(1)X111nfynFyfy111nFyFy()nX1nnfynFyfy[]nnFyFy定理2.2设总体X的分布函数为,概率密度函数为,为X的一个样本,则第k个次序统计量与第r个次序统计量的联合概率密度函数为(kr)定理2.3设总体X的分布函数为,概率密度函数为,为X的一个样本,则S个次序统计量的联合概率密度为Fxfx12,,...,nXXXFxfx12,,...,nXXX12,,...,snnnXXX)...1(21nnnnszyzFzfyFzFyfyFrnkrknzyfrnkrkkr,)](1)[()]()()[()]([)!()!1()!1(!),(11snnssnnnnnssnnnyyyyFyfyFyFyfyFyFyfyFnnnnnnyyyfss211232112`11112121,...,)](1)[()]()([)()]()()[()]([)!()!1()!1(!),...,,(2312`2,1定理2.4(定理2.3的特殊情形)设总体X的分布函数为,概率密度函数为,为X的一个样本,则前r个次序统计量的联合概率密度函数为()特别:当r=n时,得n个次序统计量的联合概率密度函数为注:n个次序统计量不是相互独立的,即次序化破坏了简单随机样本的独立性。Fxfx12,,...,nXXX12,,...,rXXX1rn1,2,...,1212312!,,...,...1,...!nrrrrrrnfyyyfyfyfyfyFyyyynr12,,...,nXXX1,2,...,12121,,...,!,...nnninifyyynfyyyy定理2.5(极差的分布)令,则的分布函数和密度函数分别为:*1nnDXX*nD0,)()(])([)1()(0,)()]()([)(21**ydvvfyvfdxxfnnyfydvvfvFyvFnyFnyvvDnDnn例2.1:设总体有分布密度为,为从取出的容量为4的样本的顺序统计量,求的分布函数,例2.2:设总体X服从区间(0,1)上的均匀分布,其分布函数与概率密度函数分别为:为X的一个样本,求第k个次序统计量的概率密度函数。33Fy1,1,010,0xFxxx1,010,xfx其他12,,...,nXXXkXkfy)2/1()3(P)4()3()2()1(其他,010,2)(xxxf例2.3:设总体X服从参数为的指数分布,其分布函数与概率密度函数分别为:为X的一个样本,求的密度函数,的密度函数,极差=-的密度函数,的联合密度函数。例2.4:设总体X服从指数分布,其概率密度函数为是容量为n的样本的前r个次序统计量,则都服从参数为的指数分布,且相互独立。例2.5:在上述条件下,则1,0xFxex,0,0xfxex12,,...,nXXX*nD12,,...,rfyyy1,00,0xexfxx(1)(2)(),,...,rXXX12,,...,nXXX