第11章抽样设计SAMPLINGDESIGN内容提要1)抽样的基本步骤2)非概率样本设计3)概率样本设计4)样本量的的确定5)回答率问题一、抽样的基本概念抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。样本设计过程1、定义总体2、确定抽样框3、确定抽样方法与技术4、确定样本量5、实施抽样过程总体与总体单位目标总体(targetpopulation)或总体按照内容、范围(extent)和时间三重标准定义的全部个体的集合。总体单位(element)构成目标总体的每一个单元。抽样单位进行抽样调查的单位,与总体单位可能相同或不同。例1:百货商场顾客惠顾调查的总体、总体单位与调查单位(P237)例2:古龙香水的目标总体是什么?抽样框架抽样框架(samplingframe)是目标总体的可操作的定义。总体单位的名单或名录。抽样框误差:由抽样框与目标总体的差异造成遗漏-遗漏部分样本单位;聚堆-缺乏个体样本单位信息;重复-同一样本单位重复出现;混杂-抽样框架中包括部分非样本总体成员。例:调查广州市所有的西饼店,用黄页的工商业名单作抽样框过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。除了某项研究的特殊要求以外,营销研究通常要求研究对象:过去3个月内没有接受任何产品或广告调查;本人及家庭成员不在有关的公司工作。样本样本(asample)是从总体中抽取的、加以研究和度量的部分个体的集合。样本单位(asamplingunit)为抽样总体中的基本成员单位。统计指标(statistics)是总体参数的样本估计值。例:当代商城顾客满意度研究SamplingTechniquesClassificationofSamplingTechniquesFig.11.2NonprobabilitySamplingTechniquesConvenienceSamplingProbabilitySamplingTechniquesJudgmentalSamplingQuotaSamplingSnowballSamplingSystematicSamplingStratifiedSamplingClusterSamplingOthersamplingTechniquesSimplerandomSampling二、非概率样本设计非概率样本设计(nonprobabilitysampledesign)事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法估算样本估计值的抽样误差。讨论:网上消费者调查的样本设计非概率样本的应用该方法通常用于下列情况:样本量规模很小时;探索性研究或研究的初始阶段;目标总体成员很少或很难寻找;无法采用概率样本时。例:百事可乐的免费品尝促销非概率样本的种类方便样本(conveniencesample)-选择容易接触的个体作为调查研究对象;判断样本(judgmentalsample)-根据研究者的判断,选择有代表性或典型性的样本单位;定额样本(quotasample)-将总体分层并确定每层应抽取的样本量,让调查员根据定额抽样;滚雪球样本(snowballsample)-先抽取少量的样本,然后通过滚雪球的方式扩大。方便抽样(任意抽样)例在入户调查中,调查员选择家中有人的住户;没有认定被调查者身份的拦截式访问;利用客户的名单进行调查;将问卷登在宣传媒体上,被调查者自填后寄回。特点方便选样样本的信息不适用于总体参数的推断。判断抽样调研者(通常是该领域的专家)根据主观经验和判断,从总体中选择“平均”的或认为有代表性的同时又容易取得的个体作为样本。当总体变差较大,而样本容量又不可能大时,判断抽样有可能比概率抽样提供更为准确的估计。判断抽样的精度主要取决于抽样者的经验,与样本量关系不大。缺点是不能获得估计值的精度。定额抽样第一阶段,给调查员指定不同类型的定额例按性别、年龄、职业、收入等指标确定每类中的被调查者定额。第二阶段,调查员按方便抽样或判断抽样选取样本单位。优点:不用抽样框,以费用较低费用获得与总体特征分布相似的样本。缺点:不能获得估计的精度。滚雪球抽样先选择一些调查对象,访问这些调查者之后,再请他们提供另外一些属于所研究的目标总体的调查对象,对这些调查对象调查后,再由他们按相同的要求提供新的调查对象,将这种过程不断继续下去,直到完成规定的样本容量为止。适用于对稀少群体的调查(如私人汽车拥有者)优点:能有效地找到符合要求的被调查者。例:某市的市民评议某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查表,然后根据寄回的调查表对各部门的工作进行排名。请问这种做法可能带来哪些问题?三、概率样本设计概率样本设计(probabilitysampledesign)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。简单随机抽样系统抽样分层抽样整群抽样简单随机抽样简单随机抽样(simplerandomsampling)是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率:p=n/N系统抽样系统抽样(systematicsampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。讨论:什么时候应避免采用系统抽样?分层抽样分层抽样(stratifiedsampling)时将总体按某些重要特征分为数个层,各层之间既不能有重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。比例分层抽样非比例分层抽样讨论如果某校有1000名本科生,200名普通硕士生和300名MBA学生,若要比较不同学生之间的平均可支配收入,应采用哪种抽样方法?其总的平均收入应如何计算?整群抽样整群抽样(clustersampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:一级整群抽样-在抽中群组中抽取所有个体;二级整群抽样-在抽中群组中抽取部分个体。多级抽样-将总体分为多级群组,逐级抽样。样本设计的选择影响样本设计的因素主要有:研究所处的阶段和数据的用途;总体内部的同质性;时间、经费和人力;数据收集的方法;其它实际考虑。四、确定样本量的经验方法最简单的方法是根据研究的类型和经验,以及以下因素确定样本量:决策的重要性;研究的性质;单位成本;发生率和完成率;其它。可支配预算法根据进行某项研究可支配的预算,在扣除其他支出后,按单位样本的成本决定样本量。例:进行某项研究的总预算是50,000元,研究设计、人员培训、问卷测试和数据分析等其它费用共需10,000元,完成每份调查问卷(含数据录入)的平均费用是50元,请问可以抽取多大的样本?SampleSizesUsedinMarketingResearchStudiesTable11.2TypeofStudyMinimumSizeTypicalRangeProblemidentificationresearch(e.g.marketpotential)5001,000-2,500Problem-solvingresearch(e.g.pricing)200300-500Producttests200300-500Testmarketingstudies200300-500TV,radio,orprintadvertising(percommercialoradtested)150200-300Test-marketaudits10stores10-20storesFocusgroups2groups4-12groups确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关:样本设计类型;要求的精度;总体内部的同质性;分组的详细程度。估计均值时样本量的确定对于简单随机抽样:1.确定允许误差D,d=±$5.002.确定置信水平CL,CL=95%3.确定与置信水平相应的z值,z=1.964.确定总体的标准差s,s=555.计算所需样本量n,n=s2z2/d2=4656.当样本量超过总体的5%时,nc=nN/(N+n-1)估计比例时样本量的确定对于简单随机抽样:1.确定允许误差D,d=±.052.确定置信水平CL,CL=95%3.确定与置信水平相应的z值,z=1.964.估计总体的发生率P,P=0.64?5.计算所需样本量n,n=P(1-P)z2/d2=3556.当样本量超过总体的5%时,nc=nN/(N+n-1)估计比例时的样本量与抽样误差样本量抽样误差2206%4005%6004%11003%23002%88001%市场研究多数预测比例,很少预测均值。五、不回答问题非抽样误差由于拒答、度量误差、数据处理误差等因素,常常产生非抽样误差。在研究中除了抽样误差以外,还应注意尽量减少非抽样误差。P104不回答误差由于回答者与不回答者在人口特征、心理、个性、动机、态度与行为方面的差异而产生的误差。不回答误差的检验对不回答误差增加回答率对调查结果进行修正MethodsofImprovingResponseRatesImprovingResponseRatesFig.12.2ReducingRefusalsReducingNot-at-HomesPriorNotificationMotivatingRespondentsIncentivesQuestionnaireDesignandAdministrationFollow-UpOtherFacilitatorsCallbacksPercentageResponseAverageDollarExpenditurePercentageofPreviousWave’sResponseFirstMailing12412__SecondMailing1832579ThirdMailing1327785Nonresponse(57)(230)91Total100275UseofTrendAnalysisinAdjustingforNon-responseTable12.4课堂讨论1.如果联想电脑公司委托你开展一项笔记本电脑顾客满意度调查,请确定:a.目标总体和总体单位?b.抽样单位和抽样框架?d.抽样方法及注意事项?2.假如估计满意的顾客比率可能为70%,回答率大约为70%,要求有95%的把握保证满意率的误差不超过5个百分点,请计算需要抽取的样本量。小结抽样的基本步骤总体?抽样框架?抽样方法?样本量?抽样非概率样本设计偶遇样本;主观样本;定额样本;滚雪球样本概率样本设计简单随机;系统;分层;整群样本量的的确定经验法;统计法回答率问题趋势分析Sampling(review)Twomajorconcerns1.Cost•Samplesize•Methodofdatacollection(phone,mail,personalinterview)2.Informationaccuracy•Samplerepresentativeness•Respondenterror•AdministrativeerrorBasicquestionsWhatkindofsample?Howlargeshoulditbe?Whichismoreimportant?SamplingProblemChinaLightconsideredofferingcustomerconsultingserviceinwhichthecompanywouldhelptomakehomesmoreenergyefficient.Todecidehowmuchcustomerswouldlikethisservice,theymailedquestionnairestoalloftheir500,000homecustomerstoget