第九章统计调查资料的整理教学目标和要求:1.了解定性资料的类型、整理方法和应注意的问题;2.掌握以定量调查资料进行接收、检查和校订的基本程序和方法;3.掌握对调查资料进行事前编码和事后编码的方法;4.理解如何录入数据以及如何对录入的数据进行净化;5.掌握对数据进行统计预处理的常用方法。第九章统计调查资料的整理第一节定性资料的整理第二节定量资料的接收与编辑第三节定量资料的编码和录入第四节定量资料的统计预处理第一节定性资料的整理一、定性资料的类型三、定性资料整理的原则二、定性资料整理的方法四、主要思考的问题一、定性资料的类型访谈记录。(1)录音或录像;(2)录音或录像的文字稿;(3)对录音或录像进行内容分析后的提纲;(4)主持人或研究人员等在现场做的访谈笔记。被访者产生的资料。请被访者完成的一些任务或练习时产生的资料,包括图画、名录、故事、拼贴等。1.有关被访者的资料2.反映研究者在研究过程中思考的资料田野记录或观察记录。3.反映客户视角的有关资料客户的知识、观念、定义和意图等。硬信息和软信息二、定性资料整理的方法作用:(1)唤起研究者对现场情景的记忆。(2)唤起研究者当时对现场的感觉和经验。(3)使研究者不至于一开始就陷入到具体的细节之中而迷失方向。1.回顾资料方式:听录音、观看录像、阅读录音文字稿、阅读笔记、查看相关视觉材料等。基本原则:同时具有目的性和开放性。记录下相关要点;对资料进行分类等。二、定性资料整理的方法筛选的范围:(1)与客户直接需要相关的信息;(2)与研究主题相关的一些外围信息;(3)研究者感兴趣或困惑的信息。(4)隐含的意义。2.筛选相关资料筛选的方法:(1)做批注;(2)做笔记;(3)直接摘引。二、定性资料整理的方法编码:编码通常包含以下几个方面的信息:资料的类型(访谈、观察、实物等);资料提供者的姓名、性别、职业等;收集资料的时间、地点、情境;研究者的姓名、性别、职业等;资料的排列序号等(1)编码的标准要不断调整;(2)编码要突出与主题密切相关的信息。3.编码和归类归类:(1)直接将从资料中发现的主题或类别整理出来,单独列在一起;(2)将相同类别的资料剪贴在一起,便于做进一步的分析;三、定性资料整理的原则1.访谈中声音的表达,如叹气、啜泣或笑声都应记录、整理;2.受访者持续较久停顿也值得整理出来;3.访谈中的录音记录必须逐字逐句地整理出来,不管是多么粗劣的字眼;4.完全按照受访者的用词、不加修饰地将其故事真实呈现出来。5.对于观察笔记,事后必须进行处理,对遗漏的细节也要进行补漏,对简化的内容进行扩展;6.对于实物资料,如果有不全或错误记录的地方,应该及时补充或纠正。定性资料的整理要求比较严格,通常需要将资料一字不漏地记录下来,一些基本原则可供参考。四、主要思考的问题确定有意义的分析单元:(1)明显的语言信息类别;(2)非语言信息类别。1.注意--那里有什么信息?关注以下三类问题:(1)运用内容来形成关于研究假设和观点的问题;(2)运用互动过程的因素来解释和评估被访者回答的问题;(3)通过考察研究情境和研究者对研究对象的影响来评估研究效度的问题。2.评论--这些信息意味着什么?第二节定量调查资料的接收和编辑一、定量调查资料的接收三、定量调查资料的校订二、定量调查资料的检查一、定量调查资料的接收第一,认真仔细地管理好数据收集和问卷回收工作,掌握每天完成和接收的问卷数;第二,在问卷后面记录下问卷完成的日期和接收日期;第三,在完成的问卷后面记录下访问员的编号或姓名;第四,多个项目同时实施时,应记录每个项目的进展情况;第五,每一份问卷都要记录唯一、有顺序的识别号码;第六,准确地记录是谁拿着哪些问卷;第七,让每个资料整理人员都清楚相应的责任。1.接收调查资料的工作要点2.注意:按顺序记录所有接收的问卷,形成调查登记表二、定量调查资料的检查第一,规定若干规则。使检查人员明确问卷完整到什么程度才可以接受;第二,对每一份问卷的每一部分都要进行检查。1.检查问卷的完整性和访问质量,要点是:2.注意:对难以判断的问卷应由研究人员来决定取舍以下情况的问卷不能接收:问卷明显不完整;回答不完全;回答模式有问题;答案没有什么变化;在截止日期后回收;被访者不符合要求。三、定量调查资料的校订字迹模糊的;不完全的;不一致的;模棱两可的;分叉错误的;1.检查不满意的答案,包括:退回实施现场去获取较好数据;按缺失值处理;整个问卷作废:不满意问卷比例小;样本量大;不满意问卷与满意问卷没有明显差别;不满意答案比例大;关键答案缺失。2.处理不满意的答案,包括:第三节定量调查资料的编码和录入一、事前编码三、数据录入二、事后编码四、数据净化一、事前编码在问卷设计时,将每一个问答题的每一个可能答案分配一个代号。1.概念2.格式通常将每个答案的对应值印在问卷上,放在最右边或括号内。3.优缺点应答者在回答问题时即提供了数字编码,编码者不必阅读全部问卷内容并为每一个答案编码,可以节省时间。调查表本身就可作为定义编码意义的编码册,不必另外再做编码册。缺点是不适用于不可预测答案类型和数目的问题。二、事后编码给某个没有事先编码的答案分配一个代码。1.概念及类型2.事后编码的要点给编码员提供一份空白的“参照问卷”;对每一个需要事后编码的项目提供一份编码表;对每一个项目做一份编码本;让所有的编码员都在同一地点、使用同样的编码本工作;提供编码指南,说明何时及怎样设立一个新代码;设立较多较窄的类别要优于设立较少较宽的类别;保持编码本的整洁和清晰。(1)封闭式问题答案的“其他”项;(2)开放式问题的答案3.编码本事前、事后的编码合并为一,包括:所在列的位置、变量的顺序编号、变量名称和变量说明、问题编号、编码说明。后编码的优缺点主要优点在于让编码者在编码前确知应答者作出了哪些回答,这可使资料处理简单化。后编码允许研究者用单个变量代表复合答案,因为可以用不同数字表示各种答案的组合。后编码的缺点是阅读所有调查表内容,再给答案编码,耗费大量时间和经费。三、数据录入将问卷或编码表中的每一个项目对应的代码直接输入到计算机中。1.概念2.注意事项给每个录入员提供一份清楚的记录格式;开始录入前几个个案时,研究人员必须在场;绝不能假定录入员是懂得如何做数据录入的;如有可能,就录入的数据进行全面的检查;如果全面检查不可行,则应抽查;对录入员进行培训。问卷录入过程中的多选题处理例子:Q1你经常使用的搜索引擎是哪几个?A百度BGoogleC雅虎D其他假设有5个被访者,分别选择了1.A;2.A、B;3.A、B、C;4.B、C;5.A、D(一)数据录入有两种录入法,分别是二分法和分类法。1二分法,数据结构如下二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。选项选中为1,不选中为0(也可以自己定义)。2分类法,数据结构如下分类法的话,就是把选项序号依次输入到SPSS里面就可以了。变量个数等于同时选中的选项个数的最大值。(二)多选题定义SPSS中处理多选题,其实有两个模块。一个是在菜单Analyze--MultipleResponse中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。另一个就是在Data--DefineMultipleResponesSets中(也可以在Analyze--Tables--MultipleResponesSets中打开,其实是一样的。1二分法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到“VariablesinSet”这个框中2)在VariableCoding里选中Dichotomies,即二分法3)在CategoryLabelSource里选“VariableLabels”4)SetName:填入多选题编号,SetLabel:填入多选题的题干(或其他你觉得合适的标签)5)点击Add2分类法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到“VariablesinSet”这个框中2)在VariableCoding里选中Categories,即分类法3)SetName:填入多选题编号,SetLabel:填入多选题的题干(或其他你觉得合适的标签)4)点击Add定义完以后,就会生成以$号开头的多选变量集了。这些多选变量集可以在CustomTables里面使用。(三)多选题统计二分法和分类法在统计的时候用法是一样的。打开菜单Analyze--MultipleResponse-Frequencies可以看到在窗口左侧,出现了我们刚才定义的多选变量集$Q1,把它拖到右侧的表格里。然后点击确定,即可输出频次表。打开菜单Analyze--MultipleResponse-Crosstabs可以看到在窗口左侧,出现了我们刚才定义的多选变量集$Q1,把它拖到右侧的表格里。然后点击确定,即可输出列联表。(四)多选题数据的事后处理例子:Q1你经常使用的搜索引擎是哪几个?A百度BGoogleC雅虎D其他假设有5个被访者,分别选择了1.A;2.A、B;3.A、B、C;4.B、C;5.A、D处理方法:(1)Transform—Compute目标变量q1.1=1,ifIndex(string(q1,f4),”1”)0重复得到q1.2,q1.3,q1.4最后再开展频数统计。例:零售商数据。四、数据净化导致无法执行下一步的数据分析;数据分析结果包含很多错误。1.重要性2.具体做法做一张所有非连续变量的频数表;计算连续变量的基本统计量,找出极端值;做交叉表检查逻辑上的一致性SPSS案例第四节定量调查资料的统计预处理一、缺失值的处理三、数据或变量转换二、加权处理1.用一个样本统计量的值去代替缺失值一、缺失值的处理2.从统计模型中计算出来的值去代替缺失值3.将有缺失值的个案整个删除4.将有缺失值的个案保留,仅在相应的分析中作必要的排除5.对缺失数据进行加权调整。缺失值可以分为单元无回答和项目无回答两种情况1.概念:给每个个案或被访者一个权重二、加权处理2.目的:为了使样本更具代表性为了强调某些被访者群体的重要性把缺失单元(个案)权数分解到非缺失单元身上3.注意事项:应有文件描述,向客户报告1.概念:将原始数据重新分类、重新编码或重新定义变量、修改变量。三、数据或变量转换2.类型:重新分类--改变类别数量重新编码--定距、定比定类、定序重新定义--合成或分解转换修改--标准化、极值变换等。3.案例:SPSS示例敬请期待下一章(第十章统计调查资料的分析)