第六章样本及抽样分布第一节引言在概率论中,概率分布通常被假定为已知的,而一切问题的解决均基于已知的分布进行的。但在实际问题中,情况往往并非如此。例6-1第二节总体与样本一、总体与个体二、样本三、小结一、总体与个体1.总体研究对象的全体称为总体.在研究2000名学生的年龄时,这些学生的年龄的全体就构成一个总体,每个学生的年龄就是个体.2.个体构成总体的每个成员称为个体.实例1某工厂10月份生产的灯泡寿命所组成的总体中,个体的总数就是10月份生产的灯泡数,这是一个有限总体;而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体,它包括以往生产和今后生产的灯泡寿命.3.有限总体和无限总体实例2当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体.4.总体分布在2000名大学一年级学生的年龄中,年龄指标值为“15”,“16”,“17”,“18”,“19”,“20”的依次有9,21,132,1207,588,43名,它们在总体中所占比率依次为实例3,20009,200021,2000132,20001207,2000588,200043即学生年龄的取值有一定的分布.一般地,我们所研究的总体,即研究对象的某项数量指标X,其取值在客观上有一定的分布,是一个随机变量.总体分布的定义我们把数量指标取不同数值的比率叫做总体分布.如实例3中,总体就是数集{15,16,17,18,19,20}.总体分布为200043200058820001207200013220002120009201918171615比率年龄二、样本1.样本的定义12,.nnxxxn从总体中随机抽取个个体,记其指标值为,,称为总体的一个样本,称为样本容量或样本量,样本中的个体称为样品12,,,nxxx注;样本具有二重性:无论是样本还是观察值,本书中样本一般均用来表示.2.简单随机抽样的定义最常用的“简单随机抽样”有如下两个要求:(1)样本具有随机性(2)样本要有独立性即要求总体中每一个个体都有同等机会被选入样本,这便意味着每一个样品与总体有相同的分布.1xX即要求样本中每一样品的取值不影响其他样品的取值,这意味着相互独立.12,,,nxxx用简单随机抽样方法得到的样本称为简单随机样本,简称样本根据简单随机样本定义得:12,,,,nxxxFxX若为具有分布函数()总体的一个样本12,,,nxxx则的联合分布函数为121(,,,)()nniiFxxxFx,Xf又若具有概率密度12,,,nxxx则的联合概率密度为121(,,,)().nniifxxxfx12,,,nxxx则的联合概率函数为12121(,,,)(,,,)()nnniipxxxPXxXxXxPXx又若X为离散型随机变量,样本分布是指样本的联合分布1212(0),(,,,),(,,,).nnXxxxxxx设总体服从参数为的指数分布是来自总体的样本求样本的概率密度解的概率密度为总体X,0,0,0,e)(xxxfx12,,,,,nxxxX因为相互独立且与有相同的分布12(,,,)nxxx所以的概率密度如下)(),,,(121niinnxfxxxf.,0,0,e1其他ixnxnii例6-6解(){}!xpxPXxex例6-7考虑电话交换台1小时内的呼唤次数X,求来自这一总体的简单随机样本x1,x2,…,xn的样本分布。由概率论知识,X服从泊松分布P(),其概率函数为因此简单随机样本x1,x2,…,xn的样本分布为121(,,,)()nniipxxxPXx1!ixniiex11!niixnniiex.),,,(,),,,(,10),,1(2121的分布律求样本是来自总体的样本其中服从两点分布设总体nnXXXXXXppBX解的分布律为总体X,,,,21相互独立因为nXXX1{}(1)xxPXxpp(0,1)x,有相同的分布且与X的分布律为所以),,,(21nXXX练习},,,{2211nnxXxXxXP}{}{}{2211nnxXPxXPxXPniiniixnxpp11)1(.}1,0{,,,21中取值在集合其中nxxx三、小结个体总体有限总体无限总体基本概念:说明1一个总体对应一个随机变量X,我们将不区分总体和相应的随机变量,统称为总体X.说明2在实际中遇到的总体往往是有限总体,它对应一个离散型随机变量;当总体中包含的个体的个数很大时,在理论上可认为它是一个无限总体.样本第三节统计量及其分布一、基本概念二、常见分布三、小结一、基本概念1.统计量的定义1212,,,,(,,,),.nnxxxXTxxxT设是来自总体的一个样本若样本函数T=不含未知参数则称是一个统计量统计量的分布称为抽样分布.12,,,nxxx设是样本,则211,nniiiixx都是统计量.2211,niixx而当,未知时,()等都不是统计量.21232,,(,),,,,?xxxN设是来自总体的一个样本其中为已知为未知判断下列各式哪些是统计量哪些不是11,Tx3212,xTxxe31231(),3Txxx4123max(,,),Txxx5122,Txx222612321().Txxx是不是实例12.经验分布函数经验分布函数的做法如下:12,,,,nxxxF设是总体的一个样本若将样本观察值由小到大进行排列为(1)(2)(),,,nxxx(1)(2)(),,,nxxx则称为有序样本,与总体分布函数F(x)相应的统计量称为经验分布函数。(1)()(1)()0,,(),,1,2,...,11,,nkknxxkFxxxxknnxx()nFx用有序样本定义如下函数为()nFx则为一非减右连续函数,且满足()0,()1nnFF()()nnFxFx可见是一个分布函数,并称为经验分布函数.实例2,3,2,1具有一个样本值设总体F.3,1,32,32,21,31,1,0)(3xxxxxF则经验分布函数为实例3,2,1,1具有一个样本值设总体F.2,1,21,32,1,0)(3xxxxF则经验分布函数为例6-950,344,1,344347,52(),34735154,35135551,355.xxFxxxx则经验分布函数为样本为344347351351355说明:对每一固定的x,经验分布函数Fn(x)是样本中事件xix发生的频率。当n固定时,Fn(x)是样本的函数。由伯努利大数定律知,只要n充分大,则Fn(x)依概率收敛于总体分布函数F(x)。当n充分大时,经验分布函数Fn(x)是总体分布函数F(x)的一个良好的近似。(1)()(1)()0,,(),,1,2,...,11,,nkknxxkFxxxxknnxx3.几个常用统计量(1)样本均值(定义6-2)121...1nniixxxxxnn在分组样本场合,样本均值的近似公式为11221...()kkknixfxfxfxnfn12,,,,nxxx设是来自总体的一个样本其中k为组数,xi为第i组的组中值,fi为第i组的频数。例6-10样本均值的性质(1)若称样本中的数据与样本均值的差为偏差,则样本所有偏差之和为0,即10niixx()证明:1niixx()1niixnx111nniiiixnxn0样本均值的性质(2)数据观察值与均值的偏差平方和最小,即在形如的函数中,最小,其中c为任意给定的常数。ixx2()ixc2()证明:ixx2()ixc2()ixxxc2(+-)()()()()iixxnxcxxxc22+-+2-()()()()iixxnxcxcxx22+-+2-()()ixxnxc22+-对于样本均值的抽样分布,满足如下定理:定理6-112,,,,nxxxX设是来自某总体的一个样本221(,),(,).NxNn()若总体分布为则的精确分布为x样本均值,222(),(),(,)EXDXnxNnn()若总体分布未知或不是正态分布,且则当样本容量较大时,的渐进分布为,这里的渐进分布是指较大时的近似分布。(2)样本方差与样本标准差(定义6-3)niixxns122)(1112,,,,nxxx设是来自总体的一个样本样本方差样本标准差2ss21()niixx称为偏差平方和2222211111()()nnnniiiiiiiixxxnxxxn例6-1121()niixx221(2)niiixxxx221niixnx221112nnniiiiixxxx22112nniiiixxxnx221112()nniiiixxnxnxn对于样本均值的抽样分布,满足如下定理:定理6-22(),(),XEXDX设总体具有二阶矩,即212,,,,nxxxxs是从该总体得到的一个样本和分别是222(),(),()ExDxEsn样本均值和样本方差,则由定理6-1,显然有2(),()ExDxn下面证22()Es证明:niixxns122)(1122211()nniiiixxxnx由于又因此2211()()1niiEsExxn22111niiExnxn2211()()1niiExEnxn2211()()1niiExnExn22211()()()1niiEsExnExn22()()()iiiExExDx22()()()ExExDx2222211()()nniiiEx22()n22/n22222()(/)nExnnn222221()()()1Esnnn2.,(1))2(;99.0}{,,,,,400.,900,400)1(2221kYXkYXPkYXYX求均为正态变量和中总体设在使得估计试利用契比雪夫不等式记样本均值为分别设两样本独立的样本总体取容量均为分别从两个两总体的均值相等有方差具总体具有方差设总体例1解)()1(YXE()()EXEY,0)(YXD)()(YDXD400900400400.413由契比雪夫不等式}{kYXP211310.99,4k18.028.k得,)2(均为正态变量和因为总体YX,413,0~NYX所以}{kYXP4/134/13kYXP4/134/134/13kYXkP4/134/13kk4/134/134/13kYXkP,14/132k,0.9914/132k要使0.9954/13k即),57.2(,57.24/13k.633.4k得13~0,4XYN).(),(),()3(;)2(;,,,(1),,,,,)(π212121SEXDXEXXXXXXXXXXniinn求的分布律及求的联合分布律求的样本为来自总体服从设例2解的分布律为X}{xXP.,2,1,0,!exxxP},,,{2211nnxXxXxXPniixxi1!e11e!niixnniix1~P()niiXn故1的分布律为故niiX1n