第四章 抽样()

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章抽样第一节抽样的概念与程序第二节概率抽样第三节非概率抽样第四节样本规模Chapter4Sampling4.1IntroductiontoSampling1.Thehistoryofsampling2.Samplingconceptsandterminology4.2ProbabilitySampling(随机抽样)1.Simplerandomsampling(SRS)简单随机抽样2.Systematicsampling系统抽样3.Stratifiedsampling分层抽样4.Clustersampling整群抽样5.Multi-stagesampling多段抽样4.3Non-ProbabilitySampling(非随机抽样)1.Purposiveorjudgmentsampling判断抽样2.Quotasampling配额抽样3.Snowballsampling雪球抽样4.Accidentalorconveniencesampling偶遇抽样一.IntroductiontoSampling1.ThehistoryofsamplingPoliticalpollingbyLiteracyDigestIn1920,Digesteditorsmailedpostcardstopeopleinsixstates,askingthemwhotheywereplanningtovoteforinthepresidentialcampaignbetweenWarrenHardingandJamesCox.Nameswereselectedforthepollfromtelephonedirectoriesandautomobileregistrationlists.Basedonthepostcardssentback,theDigestcorrectlypredictedthatHardingwouldbeelected.Inelectionsthatfollowed,themagazineexpandedthesizeofitspoll,andmadecorrectpredictionsin1924,1928,and1932.In1936,basedontwomillionrespondents’answers,theDigestpredictedthatRepublicancandidateAlfLandonwouldget57%ballotsandincumbentPresidentFranklinRooseveltwouldgetonly43%.Twoweekslater,votersgaveRooseveltathirdterminofficebythelargestlandslideinhistory,with61percentofthevote.Theproblemlayinthesamplingframeused:telephonesubscribersandautomobileowners.Suchasamplingdesignselectedadisproportionatelywealthypeople,especiallycomingonthetailendoftheworsteconomicdepressioninthenation’history.一.IntroductiontoSampling(continued)IncontrasttotheLiteracyDigest,GeorgeGallupcorrectlypredictedthatRooseveltwouldbeatLandon.Gallup’ssuccessin1936hingedonhisuseofquotasampling.Quotasamplingisbasedonaknowledgeofthecharacteristicsofthepopulationbeingsampled:whatproportionaremen,whatproportionwomen,whatproportionsareofvariousincomes,ages,etc.Peopleareselectedtomatchthepopulationcharacteristics.第一节抽样的概念与程序一、抽样的概念二、抽样的类型三、抽样的程序一、抽样的概念抽样指的是从调查对象的总体中,按一定方式选择或抽取一部分调查对象的过程。基本术语总体Population总体是指所有研究对象的总合。Apopulationisthetheoreticallyspecifiedaggregationofstudyelements.总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语样本Sample样本就是从总体中按一定方式抽取出的那一部分研究对象的集合。ASampleistheaggregationofelementswhichisselectedfromthepopulation.抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语抽样单位SamplingUnit抽样单位就是一次直接的抽样所使用的基本单位。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语抽样框SamplingFrame抽样框又称抽样范围,是抽取样本时所有抽样单位的名单。如学生花名册。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语参数值Parameter参数值是关于总体中某一变量的综合描述,或者说是从总体中计算出来的指标值。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语统计值Statistic统计值是关于样本中某一变量的综合描述,或者说是从样本中计算出来的指标值。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节基本术语抽样误差SamplingError抽样误差就是用样本统计值去估计总体参数值时所存在的偏差。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节置信度基本术语置信度ConfidenceLevels又称置信水平,指总体参数值落在样本统计值某一区间内的概率。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节置信度基本术语置信区间一定的置信度下,样本统计值与总体参数值之间的误差范围。抽样元素总体抽样单位抽样框参数值抽样误差样本统计值第一节置信区间二、抽样的类型:随机抽样系统抽样概率抽样分层抽样整群抽样抽样方法多段抽样偶遇抽样非概率抽样定额抽样判断抽样雪球抽样抽样的作用:由部分认识总体概率抽样的原理:等概率抽样三、抽样的程序1.界定总体2.制定抽样框3.决定抽样方法4.实际抽取样本5.评估样本质量第一节第二节概率抽样概率抽样概念常用方法相关解释概率抽样是依据概率论原理,使总体内所有个体都具有同等的被抽入样本之机会的抽样方法。第二节相关解释用各种概率抽样的方法进行抽样调查,从这些样本身上所得出的结果均可推论到总体。正因为概率抽样具有这特点,所以抽样调查往往都采用概率抽样的方法来抽取样本的。概率抽样的常用方法一、随机抽样二、系统抽样三、分层抽样四、整群抽样五、多段抽样第二节一、随机抽样Simplerandomsampling1.简单随机抽样:抽签、随机数表抽样单位:单个元素制定抽样框编号选择数码位数确定数码找出对应元素概率抽样的常用方法【简单随机抽样练习】假设隔壁工厂噪音很大,散发出难闻的气味,班级决定在班上随机选4人反映情况。拿一份班上同学名单,用随机数表法选大小为4的样本。二、系统抽样(Systematicsampling)系统抽样又称等距抽样。其核心是从抽样框中每隔一定的距离抽取一个个体。具体做法:首先把总体中的全部调查单位按一定顺序排列起来编号,制定抽样框;然后计算抽样距离,确定抽样起点;再从抽样起点开始按一定的抽样距离抽取样本单位。前提:总体中元素的排列随机注意:元素排列次序先后、等级高低元素排列的周期性等距抽样的样本在总体中的分布较均匀,故而抽样误差小于或至多等于简单随机抽样。它一般适用于同质性强、类别之间所含单位的数目不很悬殊的总体。三、分层抽样(Stratifiedsampling)先按某一特征分层再随机、系统抽取抽样单位:单个元素主要用于异质性高的总体目的:降低抽样误差了解不同层次状况照顾比例小的层次,提高样本代表性分层的标准研究的主要变量内部同质、层级异质已有明显层次区分的变量分层的比例按比例:样本是总体的缩影、推断总体情况不按比例:要了解各层次情况、而有些层次数量少时但推断总体需对各层资料加权分层抽样适用于总体内个体数目较多,结构较复杂、内部差异大,通过分层可减少层内差异的研究四、整群抽样(ClusterSampling)从总体中随机抽取一些小群体,然后由抽取出的若干个小群体的所有元素构成调查的样本的方法。抽样单位:整群元素优点:用于大规模调查,降低费用扩大抽样应用范围-抽样框难得时缺点:样本分布不广,代表性差整群抽样与分层抽样的比较分层:总体异质,层级间同质,适用于界定分明的总体整群:子群间同质、子群内异质,适用于界定不清的总体五、多段抽样所谓多段抽样就是按抽样元素间的关系,先随机抽取大群,再从大群中抽取小群,将抽样过程分为几个阶段总体规模特大,分布范围特广适用于子群数和子群内部个体数目较多,而彼此间的差异不太大时举例说明多段抽样举例第一阶段第二阶段第三阶段方案1抽10区抽4所学校每校抽30名教师方案2抽2区抽20所学校每校抽30名教师方案3抽10区抽20所学校每校抽6名教师方案4抽8区抽15所学校每校抽10名教师方案5抽5区抽12所学校每校抽20名教师方案6抽4区抽10所学校每校抽30名教师方案7抽3区抽10所学校每校抽40名教师方案8抽2区抽10所学校每校抽60名教师方案9抽1区抽12所学校每校抽100名教师注意:类别与个体间的比例根据各抽样阶段的子总体同质性程度各层子总体人数经费人力优点:适用于范围大、总体对象多的调查。缺点:每级抽样都有误差,误差大类别多、同类元素相对少,代表性好6.PPS抽样(概率与元素的规模成比例)不等概率抽样,排除群规模的影响以阶段性的不等概率,达到保证每个元素最终有相同被抽中概率的目的1)每群按规模赋予不同的抽取概率2)每个群中抽取同样多的元素6.PPS抽样(概率与元素的规模成比例)不等概率抽样,排除群规模的影响以阶段性的不等概率,达到保证每个元素最终有相同被抽中概率的目的1)每群按规模赋予不同的抽取概率2)每个群中抽取同样多的元素6.PPS抽样排列元素,写出规模,计算规模所占比例及累计比例,得出号码选择范围(抽样框)——计算群的规模用随机抽样或系统抽样的方法选择号码,找到号码对应的元素——按群的规模抽样再从抽中的群中选元素应用条件:知道每个群的规模6.PPS抽样如:20万名职工分布在100家规模不同的企业,从中抽取1000人进行有关企业改革的调查以择号范围作为抽样框,1000个号码中选出20个号码,从每个号码对应的元素中选择50人序号规模所占比例累计比例择号范围所选号码元素数量1300015‰15‰000-014000502200010‰25‰015-02431600080‰105‰025-104053.10310042001‰106‰105512006‰112‰106-1116600030‰142‰112-14178004‰146‰142-14586003‰149‰146-148914007‰156‰149-15510420021‰177‰156-176927.934984002‰988‰978-9879918009‰997‰988-996991501006003‰1000‰997-9997.户内抽样以家庭为分析单位时,不仅要抽出家庭户,而且每户要抽取一个人进行调查保证每户家庭的所有人都有同等被抽中的概率7.户内抽样按

1 / 63
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功