社会调查方法——抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

浙江工业大学社会调查方法第四章抽样抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以得到关于整个总体的有效结论。———[英]托尼·普罗科特浙江工业大学社会调查方法开篇案例我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得•里根将以59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。浙江工业大学社会调查方法案例——2004年美国大选主要民调样本数调查机构样本量福克斯新闻1200盖洛普1573全国广播公司/《华尔街日报》1014哥伦比亚广播公司/纽约时报939美国广播公司/华盛顿邮报939《新闻周刊》882浙江工业大学社会调查方法当选的相对机会值日期布什克里纳德尔差额福克斯新闻(1200LV)10/30-10/3146%48%1%克里+2盖洛普(1573LV)10/29-10/3149%49%1%持平全国广播公司/《华尔街日报》(1014LV*)10/29-10/3148%47%1%布什+1哥伦比亚广播公司/纽约时报(939LV)10/28-10/3049%46%1%布什+3美国广播公司/华盛顿邮报(939LV**)10/27-10/3048%48%0%持平《新闻周刊》(882LV)10/27-10/2950%44%1%布什+6最后结果11月2日51.34%48.31%0.35%布什+3.0351.34%48.31%2004年美国总统大选一周前民调结果浙江工业大学社会调查方法抽样与我们的生活生活中充满了抽样冬泳之前,用脚尖试探一下水温;做菜时,用勺子舀起一些试试味道浓了还是淡了;在书店挑选一本营销调研的书籍,随手拿起一本,翻看其中几页以决定是否购买;体检时抽一试管的血看看身体血液情况;……浙江工业大学社会调查方法为什么需要抽样?一些实验本质上是破坏性的物理上不具备考察总体所有项目的可能性对总体每一项目逐一考察费用过高对总体每一项目逐一考察相当耗时样本结论充分性浙江工业大学社会调查方法抽样方法论抽样过程就是使用少量项目或者总体的一部分得出关于整个总体的结论样本(sample)是一个更大的总体的子集或一部分抽样的目的在于帮助我们对总体的一些未知特征进行估计浙江工业大学社会调查方法抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234浙江工业大学社会调查方法一、抽样的有关术语1、总体(Population)(此指调查总体)(在社会调查中用N表示)通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。(1)研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的总体)(2)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者关系:调查总体应当无限趋近直至等于研究总体。如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研究总体,每个在校大学生就是构成总体的元素。该省所有在册大学生则构成调查总体。2、样本(Sample)(社会调查中用n表示)是从调查总体中按一定方式抽取出来的那一部分代表的集合体。浙江工业大学社会调查方法3.抽样(Sampling)是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按一定方式选择或抽取样本的过程。如:从某省总数为10万人的大学生总体中按照一定方式抽取出1000名大学生进行调查,这1000名大学生就是构成总体的一个样本。(从一个总体中可以抽取出若干个不同的样本)4.抽样单位(SamplingUnit)一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,有时不同。5.抽样框(SamplingFrame)也称抽样范围,指抽取样本的所有抽样单位的名单。如:从某所大学全体学生中直接抽取200名学生作为样本—该校全体学生的名单从某一所大学所有班级中抽取3个班级作为样本—该校所有班级的名单浙江工业大学社会调查方法6.参数值(Parameter)也称总体值,是关于总体中某一变量的综合描述。如:某厂职工的平均收入、平均年龄……7.统计值(Statistic)也称样本值,是关于样本中某一变量的综合描述。如:某厂职工中抽取出一部分,得到的平均收入、平均年龄……﹠参数值与统计值之间的区别与联系:(1)参数值是确定不变的、唯一的,并且通常是未知的。(2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;对于某一个特定的样本来说,统计值是已知的,是可以通过计算得到的。(3)联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就是抽样调查的作用所在。浙江工业大学社会调查方法8.抽样误差(SamplingError)是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小是控制的。﹠抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说明样本的代表性越好,反之,则越不好。浙江工业大学社会调查方法9.置信水平与置信区间(1)置信水平(ConfidenceLevel)也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。(2)置信区间(ConfidenceInterval)是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围(3)置信水平与置信区间的关系﹠置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。﹠在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将越高。浙江工业大学社会调查方法抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234浙江工业大学社会调查方法二、抽样的基本程序(一)界定总体即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。﹠为什么要对总体进行界定?原因之一:是由抽样调查的目的决定的,其目的是调查部分以反映总体。原因之二:界定总体是达到良好的抽样效果的前提条件。例如:1936年美国总统大选前《文学文摘》杂志的抽样浙江工业大学社会调查方法思考美国的《文学文摘》是一本1890年—1938年间在美国发行颇为流行的新闻杂志。1920年、1924、1928、1932年的美国总统大选前都作出了准确的预测。1936,《文学文摘》进行了一次最具雄心的民意测验活动:选票寄给了从电话簿与车牌登记单中挑选出来的1000万人。收到了200万人以上的回应;结果显示,有57%人支持共产党候选人阿尔夫·兰登,而当时在任的美国总统富兰克林·罗斯福的支持率为43%。两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势61%的得票率获得第二届任期。思考:为什么《文学文摘》的预测会失败?浙江工业大学社会调查方法(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模﹠如何确定抽样的精确性和样本规模(待)(三)制作抽样框(回顾什么是抽样框)当采用一次性抽样时,应依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并对名单按随机原则进行统一编号,建立起供抽样使用的抽样框。﹠例如:我们要在浙江工业大学进行一项该校学生职业观的抽样调查。﹠注意:当采取多级抽样时,则需制作多个抽样框。﹠例如:为了了解某市小学生的学习情况,需要从全市500所小学中抽取500名小学生调查。浙江工业大学社会调查方法﹠准确的抽样框原则:1、完整性2、不重复性例如:在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样很容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,相反,许多城市居民居住条件比较差,很多居民同住在一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等概率原则。浙江工业大学社会调查方法(四)实际抽取样本即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。(五)评估样本质量所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。﹠评估样本的基本方法:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。浙江工业大学社会调查方法﹠例如:从我校3000名学生中抽取300名学生作为样本。同时,我们从学校教务处或学生处得到下列统计资料:全校男生占学生总数的53%,女生占47%;本市学生占40%,外省学生占60%。那么,我们可以对抽出的300名学生进行这两方面分布情况的统计。假定样本统计得到的结果是:男生占52%,女生占48%;本市学生占41%,外省学生占59%。两相对比,可以发现二者之间的差距很小,这就在一定程度上说明,样本的质量较高,代表性较好,从这样的样本中得到的结果往往能较好地反映和体现总体的情况。浙江工业大学社会调查方法抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234浙江工业大学社会调查方法三、抽样类型﹠根据调查总体中每一个个体有无同等的机会入选样本,可以将抽样分为概率抽样与非概率抽样两大类。﹠概率抽样─是依据概率论的原理,按照等概率原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。此法在社会调查最常用。﹠非概率抽样─主要是依据研究者的主观意愿、主观判断或是否方便等因素来抽取调查对象,它不考虑抽样中是否等概率,因而往往产生较大的误差,难以保证样本的代表性。此法在社会调查中用得较少。浙江工业大学社会调查方法﹠根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若干小类,具体分类如下图所示。简单随机系统抽样概率抽样分层抽样整群抽样抽样方法多段抽样偶遇抽样非概率抽样判断抽样定额抽样雪球抽样probabilitysampleNon-probabilitysamplesample浙江工业大学社会调查方法(一)概率抽样1、简单随机抽样(SimpleRandomSampling)★概念:它是按等概率原则直接从含有N个个体的总体中抽取n个个体组成样本(Nn)。其典型就是抽签。★方法:一是抽签;二是利用随机数表来抽样。★利用随机数表进行抽样的具体步骤是:(1)先取得一份调查总体所有个体的名单(即抽样框);(2)将总体中所有个体一一按顺序编号;(3)根据总体规模是几位数来确定从随机数表中选几位数码;(4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据样本规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的个体。这些个案的集合就构成样本。★适用范围:总体单位数目和所需样本数目都比较少。例:某总体共6000人,现需要从中抽取300名作为样本进行调查,运用随机数表法。浙江工业大学社会调查方法2、系统抽样(SystematicSampling)★概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。★具体步骤:(1)给总体中的每一个个体随机编上号码并按号码排序,即制作抽样框;(2)计算出抽样间距,公式为:K=N/n(K—抽样间隔,N—总体规模,n—样本规模);(3)在最前面的K个个体中,随机抽取一个个体,并记号其编号(假定为A),作为随机起点;(4)在抽样框中,自

1 / 77
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功