社会科学研究方法-定量与定性的抽样

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中山大学资讯管理学院周旖博士2012-11-15社会科学研究方法05.定量与定性的抽样非概率抽样提纲概率抽样:逻辑与理论概率抽样的设计类型如何确定样本的数量——引言:为什么要抽样社会科学研究:寻求关于社会的答案研究对象测量抽样对抽样样本的研究真的能够代表真实的、总体的情况吗——引言:为什么要抽样案例–北京社会抽样调查结果显示:十五岁为危险年龄–当前最受市民关注的社会热点问题仍聚焦物价–第二期中国妇女社会地位抽样调查主要数据报告(5)–当前社会十大问题抽样调查——引言:为什么要抽样2004年美国总统大选前夕所预测的民意调查结果——引言:为什么要抽样2001年美国“9·11”事件前后布什的支持率比较——引言:为什么要抽样结论:对研究对象进行抽样,进而只针对样本的测量,其测量数据在某种程度上是与普遍事实相符的,可以代表总体的情况。社会科学既是一门艺术也是一门科学,而抽样则偏向于科学,并且更具备技术化的特点。非概率抽样概率抽样概率抽样的逻辑和技巧:本章的主要内容;严谨和精确的主题5.1非概率抽样非概率抽样(nonprobabilitysampling)–抽取样本的方式并不依据概率理论。–作为一种定性的抽样方法,表现为选取个案。–适用情况:•(1)对从中抽取样本的大群体或总体情况知之甚少;•(2)大群体或总体数量庞大。–类型:•就近法•目标式或判断式抽样•滚雪球抽样•配额抽样•选择线人5.1非概率抽样非概率抽样(nonprobabilitysampling)–就近法•案例演示:•随意选择很方便就可取得的个案,并且会很轻易地得到一组相当不代表总体的样本。在可行性上具有合理性可以作为前测可以提供有益的见解切不可过度推论极冒险的方法5.1非概率抽样非概率抽样(nonprobabilitysampling)–目标式或判断式抽样(purposiveorjudgmentalsampling)•选择观察对象的方式是以个人的判断为基础:•研究者对研究对象总体构成的要素或研究目标有所认识。•适用情况:(1)选择特别能提供信息的独特个案;如:针对某本权威学术刊物的内容,研究某学科的研究趋势的变化。(2)选取很难接近、特殊总体中的成员;如:研究农民工信息获取权利保障的情况。(3)需要确认特殊个案类型,以便深入研究。如:深入访谈学生的消费行为。是否最有效或者为最佳代表5.1非概率抽样非概率抽样(nonprobabilitysampling)–滚雪球抽样(snowballsampling)•一种经常用于实地研究的非概率抽样方法,每个被访问者都可能被要求介绍其他人参与访谈:•适用情况:(1)研究社会关系网络,如岭南大学图书馆的赠书来源。(2)特定总体的成员难以寻找时,如研究吸毒。5.1非概率抽样非概率抽样(nonprobabilitysampling)–配额抽样(quotasampling)•一种根据预先了解的总体特征来选择样本的方法,能够保证样本的特征分布和所要研究的总体一样;•抽样实施示例——建立全国性的配额样本第一步:获得有关全国人口中,城市人口的比例、居住在东部地区人口的比例、男性人口的比例、各年龄阶层人口的比例、不同教育水平的比例等……构成类型矩阵第二步:根据研究目的,固定抽取的类别,按照各个类别相对于总体的比例,决定每一个类别要抽取的样本数目;强调样本的代表性体现出对所抽取的样本加权的思想,使抽取的样本能够合理地代表整个总体。抽取方法为随机抽取缺陷1:配额的框架必须十分精确,掌握最新的资料。缺陷2:随机抽取会存在误差5.1非概率抽样非概率抽样(nonprobabilitysampling)–配额抽样(quotasampling)•练习:假设全国人口的年龄分布为:30岁以下人口占25%,30-60岁人口占50%,60岁以上人口占25%;此外,各年龄阶段的性别比例为:30岁以下人口中的男性占60%,女性占40%;30-60岁人口中的男性占65%,女性占35%;60岁人口中的男性、女性比例各位50%。问题:如果要形成一个40人的样本,那么各年龄阶层各应该抽取男性和女性样本分别为多少?5.1非概率抽样非概率抽样(nonprobabilitysampling)–选择线人(snowballsampling)•线人(informants):对你所希望研究的社会现象相当熟悉的人,而且愿意告诉你他所知道的。受访者:只提供关于自身的情况;线人:提供关于研究对象的一切信息•Eg.通过访问社工研究自闭症患儿与“受访者”区分5.2概率抽样:逻辑与理论概率抽样(probabilitysampling)–根据概率理论来选择样本的方法的总称。通过保证总体中的每个要素都有一个已知的(非零)、被抽中的概率,概率抽样能够计算出有意识和无意识的抽样误差。–用途:从大的、已知总体中抽取有代表性的样本精确地、统计性地描述大型总体逻辑在同质性极高的特例群体里,一个个案就足以成为整个总体的样本。基本观念对总体进行有用的描述从总体中抽样出来的样本必须包含总体的各种差异特征核心:随机抽样5.2概率抽样:逻辑与理论概率抽样(probabilitysampling)–随机抽样:•任何要素都具有同等的、独立于任何其他事件被抽到的概率。Eg.掷硬币•方法:随机数表或电脑程序(P524,P204)•随机数表使用方法举例:某社区图书馆计划调查社区用户的信息需求,计划从社区的95户家庭中随机抽取10户调查。•即使最仔细的抽样也不可能提供对总体的完全代表性,一定程度的抽样误差总是存在的。避免偏见可通过预测相关参数的抽样分布估测——衡量标准:置信水平与置信区间。5.2概率抽样:逻辑与理论总体与抽样框(samplingframe)–总体所有要素的名单或是准名单表–样本的选择来源–一个样本的代表性直接依赖于抽样框代表总体要素的程度•举例:针对一个街区的调研总体样本的初级抽样单位是街区内的所有街道街区的名册可以成为一个抽样框常见抽样框:街道户口登记名册、电信公司的电话簿、各机构的名册、产品目录、销售目录等等。。。根据样本所得的研究成果,只能代表组成抽样框的各个要素的集合。5.3概率抽样设计的类型简单随机抽样系统抽样分层抽样多级整群抽样5.3概率抽样设计的类型简单随机抽样–最基本的抽样技术–方法:每一个代表着总体的单元都用一个数字来代替,然后在随机数字表中进行抽样选择–练习:•档案馆计划从馆藏的800盒民国档案中抽取60盒,调查档案载体的破损情况。请利用随机数表进行抽样。单纯的简单随机抽样在实践中几乎不用!5.3概率抽样设计的类型系统抽样–选择完整名单上每第K个要素组成样本的概率抽样方法–举例:抽查课堂考勤,在全班同学的名单中选择每5个人抽点一次–与简单随机抽样的方法相同,但是更为实用。–两个常用术语:•抽样间距(samplinginterval):两个被选择要素间的标准距离。抽样间距=总体大小/样本大小•抽样比率(sampleratio):被选择要素与所有总体要素数量的比率。抽样比率=样本大小/总体大小—注意的问题:名单中要素的排列方式很关键。第一个要素是随机产生的。5.3概率抽样设计的类型分层抽样–在抽样之前先将总体要素分成相对同质性群体的过程。–降低抽样误差的程度,增进样本的代表性。–分层的功能:将总体分成几个同质的次级集合。为什么有这样的效果?降低误差的方法:(1)大样本(2)同质群次级集合的分层标准以及精确描述程度根据研究的需要而确定。5.3概率抽样设计的类型分层抽样–分层抽样案例:调查某大学在校本科生课外活动内容,假设该大学有在校本科生15225人,计划抽样人数为1100人。•研究总体与抽样框架:总体为某大学全体在校本科生,抽样框架可来自学校教务处的学生名册。•分层:课外活动情况与年纪和性别有关,所以分层为:大一男生、大一女生、大二男生、大二女生、大三男生、大三女生、大四男生、大四女生。•样本选择:–方法1:按照各个次级群体的相对比例,简单随机或系统抽样;–方法2:将所有学生按照次级群体排列,然后系统抽样。•样本修订:因为经费原因,只能发放1000份问卷——再次使用系统抽样切不可简单随机抽样5.3概率抽样设计的类型分层抽样–分层抽样练习案例:调查某大型医院医职人员的工作压力,已知该院共有医职人员520人,需抽样100人进行调研,医院人事部门可以提供一份按照入院工作时间排列的名单。•研究的总体和抽样框架是什么?•分层的标准是什么?职位人数百分比(%)行政人员152.88院内医师254.81院际医师254.81登记护士10019.23助理护士10019.23药剂师7514.42值班人员509.62出纳人员7514.42维修人员305.77清洁人员254.81总计520100如何进行样本选择,,每个职位各能选出多少人?5.3概率抽样设计的类型概率比例抽样、非比例抽样和加权法可以消除误差,但是不要求掌握。第一次分层抽样第二次分层抽样第三次分层抽样多级整群抽样–一种比较复杂的抽样技巧,需要一种重复两个基本的步骤:列表名册和抽样。–使用情况:无法获得总体要素名单。–必须考虑的两个问题:群的数量&群的规模–案例:对广东省大学生的就业情况进行调研•第一步:获得广东省所有高校的名录•第二步:根据主管部门和办学性质分层•第三步:对学校进行抽样•第四步:对被抽到学校的各个院系进行分层•第五步:对各院系进行抽样•第六步:对被抽到的各院系的学生进行分层•第七步:对学生进行抽样多级整群抽样–课后练习•目标:从枫树镇抽取一组240人的随机样本•已知条件:枫树镇有55个区,每个区各有20条街区(提示:可以任选6个区,每个区任选4个街区),并假设你所抽取的第X区第Y街区有45户人家。•要求:写出每次抽样的步骤、抽样依据和抽得的区与街区的编号,并假设你所抽取的某个街区符合上述所说得“第X区第Y街区有45户人家”的要求,请详述在这一街区内抽样的方法和步骤,并写出所抽取的编号。•下次课上,抽取两个小组报告做作业的情况(需要做PPT详细叙述)5.3概率抽样设计的类型决定样本数量的因素:–计划进行的资料分析的类型–根据研究的目标,样本必须达到的精确程度–总体的特征决定样本数量的方法:–方法1:有关总体所做的假设和针对随机抽样过程采用统计方法–方法2:经验法则:习惯上或通常接受的数量,基于过去抽取满足统计方法要求的样本所积累的经验。基本原则:总体越小,抽样比就要越大;总体越大,抽样比可以越小。–对于小总体(小于1000),一般要抽样30%左右;–对于中等总体(10000左右),一般要抽样10%左右;–对于大总体(超过150000),一般要抽样1%左右;–对于特大总体(超过1000万),一般要抽样0.025%左右。5.4如何确定样本的数量属于统计学讨论范畴谢谢!周旖zhouyi37@mail.sysu.edu.cn2012-11-15

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功