2021/11/2《统计学》第8章抽样调查理论与方法8-1统计学主编:费宇,石磊2021/11/2《统计学》第8章抽样调查理论与方法8-2第8章抽样调查理论与方法8.1抽样调查的意义8.2抽样调查的基本概念8.3抽样误差8.4抽样方案设计8.5样本容量的确定2021/11/2《统计学》第8章抽样调查理论与方法8-38.1抽样调查的意义8.1.1抽样调查的概念8.1.2抽样调查的作用8.1.3抽样调查的应用领域2021/11/2《统计学》第8章抽样调查理论与方法8-48.1.1抽样调查的概念统计调查:是获取数据资料的一种重要手段,它又分为全面调查与非全面调查两类。●全面调查:普查●非全面调查:又称为抽样调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本进行观察,并根据观察结果来推断全体,以此达到对全体目标量的了解。这是广义的抽样调查的概念。例:调查北京市民对出租车行业的满意度调查2021/11/2《统计学》第8章抽样调查理论与方法8-5抽样调查的分类依据样本抽取的同,抽样可以分为非概率抽样和概率抽样两类。简单随机抽样分层抽样整群抽样系统抽样多阶段抽样概率抽样方便抽样判断抽样自愿样本滚雪球抽样配额抽样非概率抽样抽样方式2021/11/2《统计学》第8章抽样调查理论与方法8-6非概率抽样(non-probabilitysampling)与概率抽样相对的一种抽样。又称非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。问题:(1)其效果好坏依赖于抽样者的主观判断能力和经验(2)无法计算和控制抽样误差。无法用样本的量化数据来推断总体。2021/11/2《统计学》第8章抽样调查理论与方法8-7便利抽样是根据调查者的方便与否来抽取样本的一种非概率抽样方法。典型的形式是“拦截式”调查。调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺点:样本单位的确定带有偶然性,样本无法代表有明确定义的总体,调查结果无法根据样本信息对总体进行数量特征的推断,样本不适合描述性研究和因果关系研究2021/11/2《统计学》第8章抽样调查理论与方法8-8判断抽样是一种凭研究人员的主观意愿、经验和知识,从总体中选择具有典型意义和代表性的样本点构成样本作为调查客体的一种非概率抽样方法。一般选择“平均型”、“众数型”、“特殊型”单元作为样本样本量小及样本不易分门别类挑选时有其较大的优越性由于其估计精度严重依赖于研究者对调查对象的了解程度、判断水平和对结果的解释情况,所以,一般不轻易地用于对总体进行数量方面的判断2021/11/2《统计学》第8章抽样调查理论与方法8-9配额抽样先将总体中的所有单元按一定的标志分为若干(组),然后在每个类(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方法选取样本点分类依据通常就是总体单元的某些属性、特征,如受调查者的年龄、性别、社会阶层等方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,使得样本的结构和总体的结构类似2021/11/2《统计学》第8章抽样调查理论与方法8-10配额抽样独立控制配额抽样:根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额●优点:方法简单易行,调查人员选择余地较大●缺点:调查人员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性交叉控制配额抽样:是根据调查对象的各个特性的样本数额交叉分配●由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。2021/11/2《统计学》第8章抽样调查理论与方法8-11滚雪球抽样是以“滚雪球”的方式抽取样本,即通过一些“种子”样本点以获取更多样本点的信息,样本量逐渐扩大优点:便于有针对性找到被调查者,调查的成本也比较低缺点:要求样本单元之间必须有一定的联系并且愿意保持和提供这种关系2021/11/2《统计学》第8章抽样调查理论与方法8-12概率抽样(probabilitysampling)又称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方法特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会(概率)被抽中“随机”不等于“随便”“随机”不等于“等概率”用样本指标数值去推断总体的指标数值抽样调查会产生抽样误差,这个误差可以计算,并且可以加以控制2021/11/2《统计学》第8章抽样调查理论与方法8-13概率抽样(probabilitysampling)概率抽样被视为狭义的抽样调查,在实践中被广泛加以采用,通常所谓的抽样调查,均指概率抽样调查。概率抽样有多种形式:简单随机抽样、分层抽样、系统抽样、整群抽样等,这些方法将在8.4节逐一介绍。2021/11/2《统计学》第8章抽样调查理论与方法8-148.1.2抽样调查的作用实际工作不可能进行全面调查,而又需要了解其全面情况的现象对虽然可以进行全面调查,但调查时范围大、单位数目多,又缺乏原始记录作依据的现象对普查资料的质量进行检查和修正抽样调查方法可以用于工业生产过程中的质量控制2021/11/2《统计学》第8章抽样调查理论与方法8-158.1.3抽样调查的应用领域社会经济现象的调查如:人口变动、农产量、城市居民家计、农村经济、小型工业企业生产情况、小型商业企业交易情况调查社会性的民意调查市场调查卫生调查资源环境调查2021/11/2《统计学》第8章抽样调查理论与方法8-168.2抽样调查的基本概念8.2.1总体与样本8.2.2总体参数与统计量8.2.3抽样单元与抽样框8.2.4抽样方法与样本可能数目8.2.5精度与费用2021/11/2《统计学》第8章抽样调查理论与方法8-178.2.1总体与样本总体:研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体(individual)所组成1)总体的限定是人为的2)在一项调查中,总体是唯一的,样本不是唯一的3)总体中包含的单元数称为总体容量,记为个体:构成总体的基本单元N2021/11/2《统计学》第8章抽样调查理论与方法8-18统计总体的种类指总体中所包含的单位数目是有限的总体指总体中所包含的单位数目是无限的总体有限总体无限总体对有限总体可以进行全面调查,也可以进行非全面调查;对无限总体只能采取非全面调查2021/11/2《统计学》第8章抽样调查理论与方法8-19样本:是总体的一部分,从总体中按一定程序抽取的那部分抽样单元或个体组成。1)样本也是一个集合,每个被抽中的进入样本的单元称为入样单元,2)样本包含的单元数称为样样本容量,记为n3)样本量对总体容量之比称为抽样比,记为f=n/N(一般是一个很小的数)4)大样本;小样本30n30n2021/11/2《统计学》第8章抽样调查理论与方法8-208.2.2总体参数与统计量总体参数:是根据总体中各单位的变量值计算出来的用于反映总体的数量特征的指标调查的目标量都是由总体的某些指标来表示的总体参数表现为一系列唯一的常数,但往往却是未知的,需要去推断和估计2021/11/2《统计学》第8章抽样调查理论与方法8-21统计量:是根据样本的n个单元的变量值计算出来一个量,也叫估计量(estimator),1)样本指标是随机变量2)往往构成了用于估计总体参数的估计量。2021/11/2《统计学》第8章抽样调查理论与方法8-22#常见的总体参数包括:总体均值(平均数)(populationmean)总体总值(总和)(populationtotal)总体比例(proportion)总体方差(populationvariance)标准差(populationstandarddeviation)11NiiXXN1NiiXXNX011,1NNNNPQPNNN2211()NiiXXN211()NiiXXN2021/11/2《统计学》第8章抽样调查理论与方法8-238.2.3抽样单元与抽样框总体是由个体组成的,可以是有限的,也可以是无限的,当从抽样角度而言,总将总体看成是有限的。将总体划分为互不重迭而又穷尽的有限多个部分,将这样的每个部分称为抽样单元(samplingunit)。1)每个抽样单元都由或多或少的个体组成,当然也可以是一个个体。2021/11/2《统计学》第8章抽样调查理论与方法8-242)抽样单元可大可小,可以分级。分别称为一级抽样单元(psu)、二级抽样单元(ssu),…,基本抽样单元(最小一级抽样单元)。3)抽样单元可以是人为划分的,也可以是自然形成的。2021/11/2《统计学》第8章抽样调查理论与方法8-25包含所有抽样单元的名单或者清册,称为抽样框。1)抽样框的形式是多样的2)抽样框中的单元原则上既不应有重复,也不应有遗漏抽样框的种类:名录框、区域框、自然框2021/11/2《统计学》第8章抽样调查理论与方法8-268.2.4抽样方法与样本可能数目从总体中抽取样本方式的不同,构成了不同的抽样方法1)放回抽样/回置抽样、不放回抽样2)等概率抽样、不等概率抽样对样本开展调查,获得样本数据,形成样本指标,构造适当的统计量作为总体指标的估计是抽样调查的必要工作2021/11/2《统计学》第8章抽样调查理论与方法8-27重复抽样:指每次从总体中抽取一个单元进行观察后,再把这个单元重新放回总体,使之继续参加下次抽选(回置抽样或重置抽样)。不重复抽样:指每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回总体,这个总体单元不再继续参加下次抽选(不回置抽样或不重置抽样)。2021/11/2《统计学》第8章抽样调查理论与方法8-28考虑顺序的重复抽样不考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样1(1)!!(1)!nNnNnCnN!(1)(1)()!nNNANNNnNn(1)(1)!12!()!nNNNNnNCnnNnnnnNBNNNN2021/11/2《统计学》第8章抽样调查理论与方法8-298.2.5精度与费用•抽样调查的精度→误差的大小→抽样误差的大小→(可用估计量,大样本)方差或标准差大小•抽样调查中,精度的估计主要就是估计量的方差估计•影响方差的最重要的因素是样本量,样本量又与费用有关•影响精度和费用的另一因素是抽样方法和估计方法•对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精度最高,或在要求达到的精度的约束下使调查费用最省,称这样的设计为最优设计2021/11/2《统计学》第8章抽样调查理论与方法8-30#对精度的讨论基于两个方向:对于某类抽样方案,构造合适的估计量并讨论这一估计量的方差估计对于既定的抽样方案,依据给定的精度要求(误差限要求)讨论方案的细节(如样本量的确定问题)2021/11/2《统计学》第8章抽样调查理论与方法8-318.3抽样误差8.3.1抽样调查中误差的来源8.3.2抽样平均误差、方差与偏差8.3.3抽样平均误差的计算8.3.4抽样极限误差与置信度2021/11/2《统计学》第8章抽样调查理论与方法8-328.3.1抽样调查中的误差来源凡调查就一定有误差,不可能完全避免。抽样调查中误差可分为非抽样误差及抽样误差两大类。#非抽样误差(non-samplingerror):指不是由于抽样引起的,在全面普查中也存在。包括:1)调查误差:调查所得数据与样本单元的真值不一致所造成的误差。原因包括测量误差、失真回答等。2)不完整的抽样框误差:抽样框的重复和遗漏。3)不回答误差(无相应误差):抽中的样本单元找不到或者拒绝回答问题或缺失所需要的信息4)填写录入误