传播研究方法第七讲:抽样的逻辑中国青年政治学院赵菁2015年10月29日一、指标/指数(Index)和量表(Scale)相同点:都是对变量的序列测量(ordinalmeasures)都是对变量的复合测量(compositemeasures)不同点——按赋值的不同加以区分:指标:简单对各题项(items)得分加总(各题项的权重都是1);量表:对不同的题项赋予不同的权重(反映概念的重要性或程度的差别)二、指标(Index)的建构选择可能的项目——表面效度、单一维度【聚合效度】考察其经验关系——项目间经验相关将多个选项结合成指标并赋值——相同权重处理缺损资料(missingdata)——5种方法鉴定指标——内在鉴定、外在鉴定三、量表的建构李克特量表(Likertscaling)1930s,byRensisLikert使用标准化的回答分类【非常同意、同意、不同意、非常不同意】,并以此决定不同项目的相对强度。对某人的态度进行定序测量总加量表的一种:一个人在量表中的得分由加总而成。例:一个人际关系量表提问问题选择回答(限选一项)非常同意同意不一定不同意非常不同意+1我在本系有很多朋友54321+2只要我需要,我相信本系的大部分同学会助我一臂之力的54321-3对周围的同学我很少关心54321-4我很难和本系的人交朋友54321+5我经常向本系的同学请教54321-6只有少数同学是开朗的,多数人是有偏见的54321+7大部分同学会为了集体的利益牺牲个人利益54321-8我相信大部分同学会背后中伤我,如果这样做可以使他们得到好处的话。54321-9我很少关心别人说什么,我只相信我自己54321-10本系大部分同学思想保守,他们怎么也不肯改变54321+11我跟所有的同学都是朋友54321-12我在本系没有一个好朋友54321三、量表的建构李克特量表(Likertscaling)赋予各类别的分值是随意的,并不表示该测量为定距或定比测量。该量表优势:简便性该量表劣势:1)量表项目的不同组合却可能带来相同的总分;2)“反应定势”也是潜在威胁。三、量表的建构瑟斯通量表(Thurstonescales)1920s,byLouisThurstone,methodofequal-appearingintervals,斯通等距量表量表逻辑:比较判断。我们可以辨认每一个被评价的概念是否有“最常见的反应”。如果很多人都认为这两个事物不同,那么对于这两者“最常见的反应”也将彼此远离。应用很少三、量表的建构鲍嘎德社会距离量表(Bogardussocialdistancescale)判断种族、群体之间的社会距离。要求一个群体的成员确定她/他愿意与目标群体保持多远的距离。1920s,byEmoryBogardus量表逻辑:如果某人愿意接受某种强度的项目,那么他/她就应该愿意接受该项目之前的所有项目;受访者一旦反对某个项目,则对比该项目更困难的项目也会持反对态度。着眼于社会多数团体间的社会距离。假设有来自德国的交换生,对于如下情境请给出你的第一反应,选择是或不是:1.他/她作为访客在你的学校住一个星期;2.作为全职学生在你的学校读书;3.和你选了相同的几门课,一同上课;4.在班级里和你同桌,与你一起学习、考试;5.和你住在同一楼层的寝室;6.作为同性室友一起居住;7.作为异性和你约会。研究者希望研究大一新生对于从德国和尼日利亚来的交换生的社会距离,希望发现学生会认为从非洲来的交换生心里距离更远,还是从欧洲来的交换生心理距离更远。询问大一新生如下问题:鲍嘎德社会距离量表举例新生报告感觉舒适度百分比尼日利亚德国访客100%100%成为全职学生98%100%同一个班级95%98%在一起学习82%88%同一个公寓楼层71%83%同一间寝室50%76%约会42%64%你愿意让黑人:1.生活在你的国家吗?2.生活在你的社区吗?3.住在你们那条街吗?4.做你的邻居吗?5.同你的子女结婚吗?请在你愿意的问题的方框那里打一个√号。鲍嘎德社会距离量表举例局限性:我们对一组陈述具有单维性的假设是有局限性的。单维的领域往往很难找到。三、量表的建构语意差异量表(Semanticdifferential)1950s,间接手段测量某人对于某概念、物体或他人的感觉。受访者被要求根据两个相反意义的形容词来评判某事。三个主要的意义类别:评价(好-坏);能力(强-弱);行为(积极-消极)例:评估新开设的音乐欣赏课的效果请阅读如下成对的形容词,将最接近你第一印象的描述标记在空白空间内。答案没有正确与否之分。你对于离婚感受如何?不好的×好的安静的×吵闹的简单的×复杂的现代的×传统的快速的×缓慢的公平的×不公平的语义差异量表举例三、量表的建构哥特曼量表(Guttmanscaling)在数据收集之后评估数据;1940s,byLouisGuttman测量一系列【3-20个】指标或项目【yes/no;present/absent】,认为其中存在分等级的逻辑关系;将结果放入哥特曼量表中,考察项目之间是否形成某种模式与其逻辑关系相对应。注意:要考察所有可能的项目结合方式【例:小女孩是否知道她的年龄、她家的电话号码;三个当地政府官员;一共8种可能性】哥特曼量表图示分析(scalogramanalysis):检验项目间是否存在等级关系。【例:小女孩知道自己的年龄比知道电话号码简单;知道电话号码比说出三个当地政府官员名字简单。三个变量间存在等级关系】存在等级关系称作:scaled;不存在等级关系称作:nonscalable/errors哥特曼量表举例Crozat(1998)研究公众对多种政治抗议形式的反应。他检查了1974-1990年间在英国、德国、意大利、荷兰和美国所做的公众对于政治抗议形式的接受度调查数据,发现公众接受形成了一个哥特曼量表。那些接受最激烈政治抗议形式(如罢工、静坐)的人几乎也会接受更加温和的抗议形式(如请愿、示威等)。请愿示威游行抵制罢工静坐哥特曼模式NNNNNYNNNNYYNNNYYYNNYYYYNYYYYY其他模式(仅举例)NYNYNYNYYNYNYNNNYYNNYNNYY本讲概要引言非概率抽样概率抽样的逻辑和理论一、引言——几个例子宿舍突击卫生检查期中教学检查电视台路边采访天安门警卫查身份证国家人口普查/社会经济普查……一、引言——为什么抽样?研究项目的资源有限,不可能对总体进行调查(特例:10年一次的人口普查);抽样可以使研究的质量有所改进【集中使用资源,聘用训练有素的工作人员,降低非抽样偏倚(如,无回答偏倚、测量误差、录入误差等)】。一、引言——政治民意调查2004年美国总统大选,各个民意测验机构尽管存在差异,但均一致认为双方势均力敌,以致难以预料输赢。猜想:这些民意调查专家访问了多少受访者,使其对大约1.15亿选民的行为预测的误差不超过两个百分点?2004总统大选前夕所预测的民意调查结果日期主办机构布什克里10/28Fox/OpinDynamics505010/28TIPP534710/28CBS/NYT524810/28ARG505010/28ABC514910/29Fox/OpinDynamics49512004总统大选前夕所预测的民意调查结果日期主办机构布什克里10/29Gallup/CNN/USA495110/29NBC/WSJ514910/29TIPP514910/29Harris524810/29DemocracyCrops495110/29CBS51492004总统大选前夕所预测的民意调查结果日期主办机构布什克里10/30Fox/OpinDynamics495210/30TIPP514910/31Marist505010/31GWUBattleground2004524811/2选举结果5248“911”前后布什支持率一、引言——观察与抽样政治民意测验,以及社会研究的其他形式,都以观察为基础。社会研究的首要问题是决定观察什么、不观察什么。抽样,就是选择观察对象的过程。如果想从样本推论到更大的总体,就需要概率抽样(ProbabilitySampling),它涉及到随机抽样(RandomSelection)的概念。一、引言——抽样简史阿尔夫·兰登(AlfLandon)OR罗斯福(FranklinRooselvelt)?从1920年到1932年的大选,LiteraryDigest依托从电话簿及车牌登记名单中所选出的访问对象,询问其在即将到来的总统大选中会投票给谁,均准确地预测了大选结果。1936年,LD进行了最具雄心的民意测验:以同样的方式将选票寄给全美1000万选民,最后收到200万人的反馈:结果显示有57%的人支持共和党候选人阿尔夫·兰登。但是,两周后的投票结果显示,罗斯福以历史上最大的优势,61%的得票率,连任美国总统。问题1:回收率低;问题2:抽样方式排除了穷人一、引言——抽样简史托马斯·杜威(ThomasDewey)OR哈利·杜鲁门(HarryTruman)?与LD相反,1936年,乔治·盖洛普(GeorgeGallup)以配额抽样(Quotasampling)的方法,准确地预测了罗斯福将击败兰登;之后准确地预测了1940、1944年的总统当选人。但以同样的方法,1948年,盖洛普错误地预测纽约市长杜威能击败当时在位的杜鲁门而当选总统。问题1:样本不具代表性。配额抽样要求研究者必须对总体情况有所了解,但二战促成了大量农村人口涌入城市,很大程度上改变了1940年人口普查资料显示的人口特征。问题2:取样偏倚【无回答问题的处理】一、引言——两种抽样方法非概率抽样(NonprobabilitySampling)多为质化研究采用概率抽样(ProbabilitySampling)从一份名单中选出“随机样本”,样本代表总体;是社会科学研究中选取大型和具代表性样本的主要方式,为量化研究所采用。二、非概率抽样(NonprobabilitySampling)无法选择概率样本时(如无法获得总体名单),可以进行非概率抽样。基于研究者的主观判断,以手头进行的研究所要达到的特定目标为判断的依据。样本不具有代表性,不可推论总体二、非概率抽样(NonprobabilitySampling)7种非概率抽样:偶遇样本/方便样本/就近法(Haphazard,Accidental,orConvenienceSampling)目的/判断抽样(PurposiveorJudgmentalSampling)配额抽样(QuotaSampling)滚雪球抽样(SnowballSampling)反常案例研究/极端案例抽样(DeviantCaseSampling)序贯抽样(SequentialSampling)理论抽样(TheoreticalSampling)二、非概率样本1.偶遇样本/方便样本/就近法(Haphazard,Accidental,orConvenienceSampling)1)电视台拦下路人做访问、碰到谁就访问谁;2)报社要求读者从报纸上剪下问卷填好寄回;3)寻找志愿者访问是一种极其冒险的抽样方法。只有在研究目的是要了解在某特定时间内通过抽样地点的路人的一些特征,或采取更少冒险性的抽样方法不可能时,才具合理性。要非常谨慎做推论,且应提醒读者注意这种方法的危险性。例:马杰伟:《酒吧工厂:南中国城市文化研究》,江苏人民出版社2006年版。“第二部分酒吧工厂现场日志”便利样本:田野选择寻找落脚点第十章:工厂的劳动人生便利样本:访谈对象来自某一成员的介绍是民族志学者进入一个群体的最佳门票。社区成员也许对民族志学者个人或者他的工作不感兴趣。一个中间人或者“媒人”——帮助者(facilitator)能够为其打开门户。这个帮助者应该在该群体中有着相当的信用度。该中间人与社区的关系越密切越好。在研究的初始阶段,该群体对于中间人的信任会延伸至民族志