第七章抽样调查基础知识第一节抽样调查的概念、特点及分类一、抽样调查的概念与特点抽样调查的概念抽样调查(概率抽样随机抽样)从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。如:平均工资、1%人口调查随机原则:在抽取调查单位时,完全排除人为的主观因素影响,保证每一个调查单位都有相等的中选可能的原则。就概率意义而言,又称为(等可能性原则)。抽样调查的特点按照随机原则抽取样本这个原则要求总体中每个单位都有同等被抽中的机会,使样本结构近似于总体结构,具有代表性根据样本的资料推断总体的数值这种推断存在一定的抽样误差,但误差范围是可以计算和控制的,有一定可信度费用低时效性强比如:电视节目收视率调查抽样调查有时是唯一的选择如:产品破坏实验、检验一批灯泡的平均寿命、水质调查二、抽样调查的种类(一)非概率抽样用主观(非随机)方法从总体中抽选单元进行调查,它是一种快速、简便且省钱的抽选样本的方法。风险大,代表性差随意抽样假定总体是同质,总体单元都相似,那么可抽选任何单元入样。例如:街道拦截访问法是最常见的随意抽样,弊端就是调查员倾向有差别,所遇到的人差别较大志愿者抽样例如:研究非典疫苗,需要人体试验,需要志愿者判断抽样专家或者熟悉行业的人事,对抽样对象有所了解,采用判断抽样配额抽样例如:按男女比例抽样。(二)概率抽样(抽样调查、随机抽样)在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具有代表性概率抽样的两条基本准则:第一,样本单位是随意抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。1.概率抽样按(抽样过程中总体单位数是否相同)重复抽样是把已经抽出的样本单位再放回到总体中,继续参加下一次抽选,使总体单位数始终是相同的,每个总体单位有多次重复抽中的可能。不重复抽样是把已经抽出来的样本单位不再放回总体,每抽一次,总体会相应减少,每个总体单位只能被抽中一次。2、概率抽样按(组织方式不同),分为:简单随机抽样-----一步抽样法,不分组,随机原则进行抽样系统随机抽样又称(机械随机抽样)或(等距随即抽样)等距抽样,按照一定的距离抽取样本例如:4000户居民中抽40人,平均每100户抽取1户;1-100号中随机抽取1个号码在第一组中抽取了5号,则5、105、205、以+100为单位抽取分层抽样又称(类型随机抽样)或(分类随机抽样)先分组,后抽组内比如每个组抽5人;某地区三种地形:平原、丘陵、山区的粮食产量,先分地区,然后按每个组内按简单随机抽样抽取调查地块,构成样本整群抽样先分群,抽群比如:全市居委会为不同群,抽不同的群,整群进行研究;了解某地区职工家庭生活状况,按居民委员会分群,一个居委会为一群,对抽中的居民委员会所辖每户职工家庭一一调查。多阶抽样分两个或更多个连续阶段抽,都是随机抽样与大小成比例的抽样例如:对农场进行某方面的调查,因为农场很多,规模大小差异,因此在调查中要使规模大的农场入样概率要大一些,而规模较小的农场其入样概率要小一些。第二节抽样推断的几个基本概念一、总体和样本总体是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。N样本从总体中按随机原则抽取出来的部分单位所组成的集合体就称为样本。n二、总体指标和样本指标总体指标又称总体参数是根据总体各单位标志值计算的综合指标。常用的总体指标有:总体平均数X、总体成数P、总体方差和标准差样本指标是根据样本各单位标志值计算的综合指标。常用的样本指标有:样本平均数x、样本成数p、样本方差、样本标准差第三节抽样误差一、抽样误差的概念(一)代表性误差:在抽样调查中,用部分样本推断总体时,由于样本各单位的结构不足以代表总体的状况而产生的误差。系统误差:破坏了抽样的随机原则而产生的误差,带有主观性的抽样随机误差:是遵守了随机原则,但可能抽到不同的样本而产生的误差。是不可避免的(二)抽样平均误差抽样估计中所说的抽样误差一般就是指抽样平均误差,用表示抽样平均误差利用数理统计方法是可能计算并控制在所允许的范围之内的(三)影响抽样误差的因素样本单位数目-------在其他条件不变的情况下,抽样数目越多,抽样误差越少。当n=N(样本=总体)时,就是全面总体标志变动程度抽样方法抽样组织方式---分层抽样的抽样误差较小,而整群抽样的抽样误差较大。二、抽样平均误差的计算(一)样本平均数的抽样平均误差的计算(用表示)(二)样本成数的抽样平均误差的计算(三)总体方差未知时的解决办法例:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件中发现10件不合格。试求:在重复抽样情况下,该产品重量的抽样平均误差和不合格率的抽样平均误差。解:由于不掌握总体标准差,需用样本资料代替。三、抽样误差的允许范围(一)抽样极限误差(二)抽样误差范围估计的可靠程度扩大极限误差的范围,可以提高抽样推断的可靠程度。这个可靠程度在统计中称为概率,它对应的数值就是概率度,用t表示。概率度越大,可靠程度欲高;反之,概率度越小,可靠程度也越低。=t(三)极限误差的计算例如:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件中发现10件不合格。如果概率度是t=2解:由于不掌握总体标准差,需用样本资料代替。第四节参数估计一、点估计是直接用一个样本指标估计总体指标的推断方法。适用于对推断的准确程度与可靠程度要求不高的情况下采用。二、区间估计是在一定的概率保证下,根据点估计值,联系一定的误差范围估计总体指标值的一种推断方法。x-x≦X≦x+xp-p≦P≦p+p例如:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件中发现10件不合格。如果我们认为总体均值与样本均值一样的可能程度是95%,那么我们的误差是多少。P=95%则t=1.96x=3.58我们如果要推断极限误差=t=tns=3.58*1.96因此我们可以利用公式:x-x≦X≦x+x1192.98≦X≦1207.02第五节样本单位数的确定(重复抽样的情况,不重复抽样的情况推导一样)样本数多少合适?有一个合理的范围。一、影响样本单位数的几个主要因素=t=tnn=222t抽样推断的可靠程度t-----要求抽样推断的可靠程度越高,概率度t则越大,抽样单位数也要多些;相反,则可少一些。总体标志的变异程度,即:2----总体方差大,抽样平均误差自然大,需要多抽一些,方差小,可少抽一些。极限误差的大小,即数值的大小-----允许极限误差大,可以少抽些,小则应多抽些。抽样方法与组织方式的不同:在相同条件下,重复抽样需要多一些,不重复抽样可少抽一些。人力、物力、财力的可能条件二、必要抽样单位数目的计算(一)推断总体平均数时,必要抽样单位数目的计算n=222t(二)推断总体成数时,必要抽样单位数目的计算例:某企业生产一批产品共10000件,随机抽取件作重量检验。检验结果,平均重量误差范围不能超过10克,样本标准差为80克,如果我们认为总体均值与样本均值一样的可能程度是95%,那么我们的抽取多少产品合适?2=802t=1.96=10克n=222t=222108096.1=245.8=246注意:抽样单位数必须是整数,不能四舍五入,只要除不尽,就进一位单选题1.将居民小区共4000户居民按1——4000编号,在1——100号中随机抽取1个号码为3,则3、103、203……3903构成抽样调查样本,这种获取样本的方法为(B)。A.简单随机抽样B.系统随机抽样C.分层随机抽样D.整群抽样2.某商品的100件样品中,测得的优质品为98件,则样本优质成数为(B)A100%B98%C2%D无法计算多选题1.影响抽样误差的因素有(ABDE)。A.样本单位数B.总体标志变异程度C.投入的经费大小D.抽样方法E.抽样组织方式07年考题2.下列属于抽样调查特点的有(ABCDE)。A.按照随机原则抽取样本B.根据样本的资料推断总体C.费用低D.时效性强E.存在抽样误差3.统计分析的特点有(ADE)A数据性B完整性C精确性D目的性E时效性4.统计分析报告写作的原则(ABCDE)A主题要突出B结构要严谨C观点和材料要统一D语言要力求准确、简洁、通俗易懂E写作态度要严肃认真判断题1.随机原则又称为等可能性原则。(正确)07年考题2.统计分析是建立在丰富资料基础上的,它是要用数字来“说话”的(正确)