第4章抽样与抽样分布一、总体1、总体中单位的个数称为总体容量,一般用N表示。2、总体指标(即总体参数)值是客观存在和惟一的,但又是未知的。第一节与抽样有关的基本概念二、样本1、样本中所包含的单位个数称为样本容量,一般用n表示,称为大样本,n30称为小样本。2、对于一个总体而言,样本是不确定的,可能有多个。3、抽取不同的样本,样本指标(样本统计量或估计量)的取值就不同,故样本指标是一个随机变量。30n!1!!14!!!32!!11NnnNCD:、nNnNC:、NB:、nNNA:、:,nNnnNnNnNnnNnN数目不考虑顺序的重复抽样样数目不考虑顺序的不重复抽目考虑顺序的重复抽样数数目考虑顺序的不重复抽样样本的个数为个单位时中抽取从总体单位数三、抽样误差指由于抽样的随机性而产生的样本指标值与总体指标值之间的误差。1、实际抽样误差:指某一具体样本的估计值与总体参数的真实值之间的离差(-)。ˆˆ2、抽样平均误差:所有样本的指标值与总体指标值之间的平均差异程度。是样本值相对于总体值的方差。)ˆ(ˆˆ2V可能的样本数ˆ)ˆ(V3、抽样极限误差(允许误差)指一定概率下抽样误差的可能(或允许)范围。一定概率下:抽样误差率抽样估计精度%100ˆ-ˆˆ或EEE%100ˆE抽样误差率第二节常用的抽样方法一、简单随机抽样简单随机抽样是指按照随机原则直接从总体中抽取总体单位组成样本的一种抽样方法。二、分层抽样(类型抽样)是指对总体所有单位(N)先按某种标志加以分类后,再从各类中按随机原则抽选一定数量的单位(ni)构成样本(n)的抽样组织形式。三、系统抽样(等距抽样)(一)等距抽样的概念将所有总体单位(N)按某个标志排序后,分成单位数相等的n段,每段按固定顺序或间隔抽取一个总体单位组成样本的抽样方式。(二)等距抽样的方法1、随机等距方法:第一段中这个单位按随机原则抽取,其他段中按相等的间隔抽取。2、对称等距方法:第一段中这个单位按随机原则抽取,其他段中按对称间隔抽取。3、中点等距方法:抽取每段中间位置上的单位。四、整群抽样整群抽样是将所有总体单位(N)划分成R个群,然后以群为单位从中随机抽取r个群,对抽中的群中所有的单位都进行调查的抽样方式。第三节抽样分布抽样分布:指样本指标的概率分布。一、样本平均数的抽样分布1、总体方差已知时,样本平均数的抽样分布。定理1设总体X~N(,),(x1,x2,x3,…,xn)是一个样本,则样本平均数服从N(,/n)。定理2当样本容量n充分大时,无论总体分布形式如何,样本平均数近似服从N(,/n)xx注意:1、样本平均数的抽样平均误差为:2、,将标准化后为x~N(,/n)xnnxVx2)(~nxxVxxxZ)(N(0,1)2、总体方差未知,需要用样本方差s2来代替时,样本平均数的抽样分布。定理3若是大样本(n≥30)时,结论同定理1或定理2。nsxZ~)1,0(N定理4设总体X~N(,),(x1,x2,x3,…,xn)是一个样本(n30),样本方差为s2,则:注意:当样本容量n30时,s应该采用以下计算。nsxt)1(nt~1)(2nxxs二、样本比率的抽样分布比率是具有某种属性的单位数在全部单位数中所占的比重。总体中具有某种属性的单位数在全部单位数中所占的比重称为总体比率,记为;样本中具有此种属性的单位占样本容量的比重称为样本比率,记为p。在大样本的情况下,样本比率近似服从正态分布:标准化后样本比率的抽样平均误差为:npVp)1()(nN1,~p~npppZ)1(N(0,1)三、样本方差的抽样分布设总体是正态分布,即X~N(,),则22)1(2Sn)1(2n~四、不重复抽样的抽样平均误差结论:1、不重复抽样的抽样平均误差比重复抽样的小;2、当n/N很小(小于5%)时,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相差不大。NnnNnNnpNnnNnNnx1111)(11)(22N很大N很大自学:“两个样本统计量的抽样分布”(见教材第109-111页)结束