《统计学原理》刘鑫春1统计学原理第四章抽样推断(融合教材第三、第四章)《统计学原理》刘鑫春2第四章第一节第一节抽样调查的意义一、抽样调查的概念广义抽样调查:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。狭义的抽样调查:仅指根据大数定律和概率论的要求,随机抽样,保证总体中各个单位都有同样的机会被抽中。概念:按照随机抽样的原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。《统计学原理》刘鑫春3第四章第一节二、抽样调查的特点按随机原则抽取调查单位;要抽取足够多的调查单位;可从数量上推断总体要运用概率估计的方法抽样调查中所产生的抽样误差可以事先计算并加以控制。基本原则基本目的及任务科学性体现《统计学原理》刘鑫春4第四章第一节三、抽样调查的使用范围有些事情在测量或实验时有破坏性,不可能进行全面调查有些总体从理论上讲可以进行全面调查,但是实际上办不到和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活在有些情况下,抽样调查的结果比全面调查要准确用抽样调查的资料修正和补充全面调查资料抽样调查方法可以用于工业生产过程中的质量控制利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍《统计学原理》刘鑫春5第四章第一节四、抽样估计的一般步骤1、设计抽样方案2、抽取样本单位3、搜集样本资料4、整理样本资料5、推断总体指标《统计学原理》刘鑫春6第四章第二节第二节调样调查的基本概念及理论依据一、全及总体和抽样总体(教材没有)全及总体-简称总体(N):研究对象的全体(唯一确定)变量总体:各单位可用数量标志计量A有限总体:变量值有限B无限总体:变量值无限,分为可列或连续属性总体:各单位用品质标志描述《统计学原理》刘鑫春7第四章第二节抽样总体,简称样本(n):将从总体中抽取的部分单位称为样本大样本:样本数达到或超过30小样本:样本数在30以下注意:对于全及总体单位数N来说,样本n是一个很小的数,它可以是N的几十分之一,几百分之一、几千分之一、几万分之一。《统计学原理》刘鑫春8第四章第二节二、全及指标和抽样指标全及指标(总体指标)定义:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指标,称为全及指标(总体指标)。《统计学原理》刘鑫春9第四章第二节全及指标的运用及计算•变量总体的平均数:•属性总体:计算结构相对指标,即总体成数,用P表示,表明总体中具有某一属性的单位数占总体单位数的比重。设总体中有N个单位,有N1个单位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q为不具有某种属性的单位数所占的比重,则总体成数为:XXFXXNF或1NPN011NNNQPNN《统计学原理》刘鑫春10第四章第二节•属性总体的平均数——成数•属性总体的平均数变量值X频数F频率F/∑F具有某一属性不具有某一属性10N1N0P=N1/N1-P=N0/N合计——N110(1)FXXPPPF《统计学原理》刘鑫春11第四章第二节•变量总体标准差和总体方差,它们都是测量总体标志值分散程度的指标注意:总体的统计量是一个确定的值2222()()XXXXFNF或22()()XXXXfNf或《统计学原理》刘鑫春12第四章第二节•属性总体的方差和标准差注意:总体的统计量是一个确定的值2222()()(1)(0)(1)(1)XXFFXXFFPPPPPP(1)PP《统计学原理》刘鑫春13第四章第二节抽样指标——样本统计量定义:由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标抽样指标的运用及计算•变量总体:•属性总体:设样本中有n个单位,有n1个单位具有某种属性,n0个单位不具有某种属性,n1+n0=n,p为总体中具有某种属性的单位数所占的比重,q为不具有某种属性的单位数所占的比重,则抽样成数为:xxfxxnf或1npn011nnnqpnn《统计学原理》刘鑫春14第四章第二节•属性样本的平均数——成数•属性样本的平均数变量值x频数f频率f/∑f具有某一属性不具有某一属性10n1n0p=n1/n1-p=n0/n合计——n110(1)fxxpppf《统计学原理》刘鑫春15第四章第二节•样本标准差和样本方差,它们都是测量样本标志值分散程度的指标•注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量(见教材34页)S2S2222()()11xxxxfSSnf或2()xxfSf《统计学原理》刘鑫春16第四章第二节•属性样本的方差和标准差•注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量2222()()(1)(0)(1)(1)XXffSXXffpppppp(1)Spp《统计学原理》刘鑫春17第四章第二节统计抽样过程根据样本的平均数、成数(也称比率)来推断总体的平均数,成数或所在的范围,只要总体的平均数或成数掌握了,那么总体的标志总量也就可以推断出来。总体N样本n,xp,XP(抽取方式方法)计算抽样指标推断总量指标(抽样估计)(计算抽样误差)《统计学原理》刘鑫春18第四章第二节三、抽样方法和样本的可能数目样本的容量(n)样本的可能数目抽样的方法取样方式:重复、不重复抽样的方法对样本的要求:考虑顺序、不考虑顺序《统计学原理》刘鑫春19第四章第二节考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目!(1)(2)...(1)()!nNNANNNNnNnnnNBN(1)(2)...(1)!!!()!nNNNNNnNCnnNn1nnNNnDC《统计学原理》刘鑫春20第四章第二节四、抽样调查的理论依据大数法则:随着抽样单位数n的增加,抽样平均数有接近总体平均数的趋势,几乎具有实际的必然性。中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。《统计学原理》刘鑫春21五、抽样分布(教材98页)概念——由样本n个观察值计算的统计量的概率分布。抽样分布的形式样本比率的抽样分布样本方差的抽样分布x《统计学原理》刘鑫春22样本统计量样本均值x样本比率p样本方差s2正态总体或非正态总体大样本非正态总体(小样本)正态分布t分布大样本正态分布分布2《统计学原理》刘鑫春23第四章第三节第三节抽样平均误差(样本平均数的方差与标准差)一、抽样误差的概念是指样本指标和总体指标之间数量上的差别。统计调查误差登记性误差代表性误差系统误差(偏差)随机性误差《统计学原理》刘鑫春24第四章第三节1xX2xX1pP2pP随机误差实际误差平均误差21()MiixxXuM21()niippPuM(指一个样本指标与总体指标之间的差别)(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)《统计学原理》刘鑫春25第四章第三节二、抽样平均误差的意义抽样误差是一个随机变量;抽样误差是反映抽样指标对全及指标代表性程度;不能用一次抽样得到的抽样误差来衡量抽样指标对于全及指标的代表性大小;抽样平均误差概括地反映了所有可能抽样指标与全及指标之间的误差的一般水平。因此:抽样平均误差是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根据。《统计学原理》刘鑫春26第四章第三节三、抽样平均误差的计算(p103)1、原理公式:2、运用公式A平均数的抽样平均误差B成数的抽样平均误差21()MiixxXuM)(重复nuxσ或)1(2NnNnuxσ)()1(2不重复Nnnuxσ)()1(重复nPPup)()1()1()1()1(不重复或NnnPPuNnNnpPupp21()MiippPuM《统计学原理》刘鑫春27第四章第三节注意:在上述公式中,或总体标准差,但是实际中这两个数据却是未知的。计算抽样平均误差时通常采用以下替代方法。1、用样本标准差替代总体标准差。大样本情况下,可以直接用样本标准差S代表代表总体标准差;在小样本的情况下,则采用样本修正标准差来代替。2、用以前(近期)的总体标准差或同类地区的总体标准差来代表所研究的标准差。若同时有多个可供参考的数值时,应选择其中最大者。对于成数P,应选最接近0.5的比率。(1)PP*S*2()11SxixnSnn《统计学原理》刘鑫春28第四章第三节四、影响抽样平均误差的因素1、全及总体标志的变动程度全及总体标志变动程度越大,抽样平均误差就越大;反之,全及总体标志变动程度越小,则抽样平均误差越小。两者成正比关系的变化。2、抽样单位数的多少在其他条件不变的情况下,抽取的单位数越多,抽样平均误差越小;样本单位数越少,抽样平均误差越大。抽样平均误差的大小和样本单位数成相反关系的变化。4、抽样方法(重复或者不重复)3、抽样的组织方式《统计学原理》刘鑫春29第四章第三节例题:①某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。②该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。)(710070克nuxxσ)95420070(克xu%71100%)971%(971(nPPup)%21200%)971%(97pu《统计学原理》刘鑫春30第五章第三节例题:某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表:按照质量规定,电灯泡使用寿命在1000小时以上的为合格品,计算灯泡使用时间抽样平均误差和灯泡合格率的抽样平均误差?使用时间(小时)抽样检查电灯泡数(个)使用时间(小时)抽样检查电灯泡数(个)900以下900~950950~10001000~10502411711050~11001100~11501150~12001200以上841873合计200《统计学原理》刘鑫春31第四章第四节第四节参数估计(全及指标的推断P123)一、估计量与估计值参数估计:用样本统计量去估计总体参数,即用样本均值去估计总体均值,用样本方差去估计总体方差,用样本比率去估计总体比率。用概括表示所有总体参数,参数估计就是考虑如何用样本统计量估计总体参数。在参数估计中,用来估计总体参数的统计量,称为估计量用来表示,估计量的具体数值称为估价值。x《统计学原理》刘鑫春32第四章第四节二、评价估计量的标准(教材126页)1、无偏性2、一致性3、有效性《统计学原理》刘鑫春33第四章第四节三、参数估计的方法(P123)(一)点估计也叫定值估计(或直接估计),就是把样本平均数或样本成数直接作为总体平均数或总体成数的估计值。(二)区间估计1、区间估计的意义在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。《统计学原理》刘鑫春34第四章第四节2、抽样极限误差概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。(1)抽样平均数的抽样极限误差(2)抽样成数的抽样极限误差xxXppP《统计学原理》刘鑫春35第四章第四节总体范围的估计若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:(1)抽样平均数的范围(2)抽样成数的极限误差xxxXxpppPp《统计学原理》刘鑫春36第四章第四节例:要估计一批产品的合格率,从1000件产