市场调查 第8章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八章调查资料的整理本章结构调查问卷的回收及审查1.调查资料的编码与录入2.调查数据的清洁和预处理3.一、调查资料整理的意义数据整理是提高调查数据质量的必要步骤数据的整理是分析的重要基础数据的整理便于今后对数据的长期保存和研究二、原始调查数据的类型第一手数据和第二手数据定性数据和定量数据市场调查问卷、专家访谈记录、政府机关的档案资料、录音带或其他多媒体资料等三、调查资料整理的步骤对原始资料进行审核、修正。编码。数据的录入。数据的清洁。进行统计预处理。五、调查问卷的审核1.审核的内容:完整性的审核:单位无回答或项目无回答正确性的审核:口径、计算方法、计量单位一致性的审核:逻辑错误及时性的审核清楚易懂五、调查问卷的审核2.审核的主要方法经验判断。如年龄,营业面积逻辑检查。如婚姻状况计算审核。如收支五、调查问卷的审核3.审核的阶段(何时进行审核)实地审核,又称初步审核、现场审核中心办公室审核五、调查问卷的审核4.审核的基本步骤接收核查问卷(一审):将无效的或不能接受的问卷剔除。无效问卷:1)缺损的问卷;2)回答不完全,3)被调查者没有理解问卷的内容而错答问题,或没有按照指导语的要求回答问题;4)回答没有什么变化的问卷;5)在截止日期之后回收的问卷;6)由不属于调查对象的人填写的问卷;7)前后矛盾或有明显错误的问卷。编辑检查(二审):退回实地重新调查视为缺失数据放弃不用第二节调查资料的编码与录入编码的概念编码的基本原则编码设计的内容与分类前设计编码后设计编码编码表的设计原则实践中的编码技巧调查资料的录入一、编码的概念编码:就是将问卷信息(包括调查问题和答案)转化为统一设计的计算机可识别的代码,以便于对其进行数据整理与分析。编码的作用减少数据录入和分析的工作量,节省费用和时间,提高工作效率将定性数据转化为定量数据,进行定量分析减少误差二、编码的基本原则准确性完整性有效率便于数据的整理与分析标准化原则三、编码设计的内容与分类编码的设计即确定各问卷、问卷各项目和答案对应代码的名称、形式、范围以及与原数据的对应关系。1.编码设计的内容包括:(1)问卷的代码(2)变量的定义(3)取值的定义编码示例序号变量名含义答案赋值缺损1ID个案号根据问卷上的号码填写02性别性别1=男2=女03专业类型文史还是理工1=文史类2=理工类04年级被试年级1=大一2=大二3=大三05满意度对自身现状的满意程度5=非常满意4=比较满意3=一般2=比较不满意1=非常不满意06改变现状的意愿是否想改变现状5=一点都不想4=不是很想3=无所谓2=比较想1=非常想07性格影响如何看待性格给自身带来的影响5=全部是积极的4=大部分是积极的3=没什么影响2=大部分是消极的1=全部是消极的0某项调查的编码表格式变量序号变量名变量类型变量所占字节取值范围取值对应含义备注对应题号对应问题1…38code…V28数值型…数值型7…10—4或91051202…0—3表示台数;4表示4台或4台以上;9表示缺失问卷编号…28家中拥有电视机数三、编码设计的内容与分类2.编码设计的分类结构式问卷编码设计和非结构式问卷编码设计封闭题、半封闭题和开放题编码设计前设计编码和后设计编码四、前设计编码前设计编码要求事先已知问题的答案类别,主要应用于结构式问卷中的封闭题和数字型开放题。問卷編號:1□□2先生(小姐)您好:我是××公司的訪員,目前正進行一項有關信用卡服務的意見調查,耽誤您幾分鐘時間,請教您幾個問題。謝謝!1.請問您是否有使用信用卡?□(1)有……………………………………請繼續回答下題..3□□(2)沒有…………………………………請跳答第8題2.請問您使用的是哪一家銀行的信用卡?(可複選)□(1)中國信託商業銀行……………………………………………………4□□(2)花旗銀行………………………………………………………………5□□(3)慶豐銀行□(4)美國銀行□(5)匯豐銀行:::□(10)其他______________(請註明)2封闭题的编码设计1.对单选题只需规定一个变量,取值为选项号。例如:Q18请问您最近一年内买过VCD光盘吗?【】1买过2没买过设计编码时:变量名为V18,属于数字型变量,变量所占字节数为1,变量取值范围为1,2或9,其中1表示买过,2表示没买过,9表示该题无回答。封闭题的编码设计2.对多选题的变量(1)将各个可能回答的答案选项都设为一个0—1指示变量,如被调查者选择了该答案,此变量的值为1,否则为0。优点:便于分析,编码的结果不用经过转换,可直接分析;缺点是不便于录入,变量随选项增多而增多.例如Q17请问您观看的DVD光盘的主要来源是?【】【】【】1自己购买2租借3向朋友/同事/亲戚借4别人送的5单位的6其他变量序号变量名变量类型变量所占字节取值范围取值对应含义备注对应题号对应问题方法一改进法484950515253V171V172V173V174V175V176数值型数值型数值型数值型数值型数值型1111110或10或10或10或10或10或10或10或20或30或40或50或6取值为1表明该选项为主要来源,为0则不是。全为0表示该题无回答17观看的VCD盘的主要来源封闭题的编码设计(2)将变量定义为所选题号,变量值为选项号,变量排列顺序即为选择答案的顺序优点:便于录入和检查,但分析前要用程序把它们转化为各选择答案的0-1变量例如:Q17请问您观看的DVD光盘的主要来源是?(至多只选择3项)【】【】【】1自己购买2租借3向朋友/同事/亲戚借4别人送的5单位的6其他变量序号变量名变量类型变量所占字节取值范围取值对应含义(i=1,2,3,4,5,6)备注对应题号对应问题484950V171V172V173数值型数值型数值型1110—60—60—6取值为i表明第i选项为主要来源,为0则说明其余选项都不是主要来源全为0表示该题无回答17观看的VCD盘的主要来源具有k个答案的复选题编码成为k个变量,即:Q8.1-1、Q8.1-2、Q8.1-3、Q8.1-4、Q8.1-5、Q8.1-6、Q8.1-7如果该答案被选中,则复选变量取值为1,反之为0。IGQ8.1-1Q8.1-2Q8.1-3Q8.1-4Q8.1-5Q8.1-6Q8.1-7110001101220110010311001000就业信息的渠道封闭题的编码设计3.排序题的编码设计Q12请您根据信任程度由大到小对下列广告排序(信任程度最高的广告前填1,其次信任的广告前填2,依次类推,最不信任的广告前填5):【】1电视广告【】2报纸广告【】3广播广告【】4杂志广告【】5路牌广告Q12问题的编码(方法一)变量序号变量名变量类型变量所占字节取值范围取值对应含义(i=1,2,3,4,5)备注对应题号对应问题3031323334V121V122V123V124V125数值型数值型数值型数值型数值型111110—50—50—50—50—5取值为i表明该广告的信任程度排名为i,为0则表明对该广告的排名缺失全为0表示该题无回答12对各类广告的排序变量个数即选项个数,按照选项排列顺序,分别定义各变量为对应选项所排次序号,取值即为次序号。Q12问题的编码(方法二)变量个数即要求排序项数,依照次序号排列顺序,分别定义各变量为各次序号对应的选项项数,取值即为选项号。Q12请问下列广告中,您最信任哪个广告?【】其次呢?【】再次呢?【】1电视广告2报纸广告3广播广告4杂志广告5路牌广告Q12问题的编码(方法二)变量序号变量名变量类型变量所占字节取值范围取值对应含义(i=1,2,3,4,5)备注对应题号对应问题303132V121V122V123数值型数值型数值型1110—50—50—5i为对应信任度的广告对应的选项号。0则表明对应信任度的广告缺失全为0表示该题无回答12对各类广告的排序各变量为各次序号对应的选项项数,取值即为选项号。请在下列各种提供就业信息的选项中,选出三种您最常使用的,并依重要性顺序排列。1.就业广告2.职业介绍所3.招工单位4.政府劳动部门5.招聘会6.各类社会关系7.其他(请说明)(1)第一步,生成顺序变量(2)第二步,0、1、2、3分别代表四种可能。即没有被选中,被选为第一位、第二位、第三位IGQ8.1-1Q8.1-2Q8.1-3Q8.1-4Q8.1-5Q8.1-6Q8.1-7120010203220010203310020031420020130510030012就业信息渠道的排序数字型开放题的编码设计对直接回答数字的问题,变量取值即为该数字。变量所占字节数可以根据事先预计的数字最大值的位数确定。例如,直接询问被调查者的年龄,设计编码时取变量名为NL,所占字节为2(因为调查对象要求在20~60岁之间),小数点位为0,变量取值即为年龄,单位为“岁”,取值范围为20~60或99(99表示该题缺失)。五、后设计编码数据收集完成后再进行编码设计实践中主要的应用对象是无结构问卷和结构式问卷中的文字开放题五、后设计编码开放题编码:将问题转化为一个或几个变量,将所有可能的答案类别赋予相应代码。根据问题的回答确定各答案类别。选取问卷有两种方式:阅读所有问卷对该问题的回答,这种方法适用于样本量较小的情况;抽取部分问卷,抽取方法可以随机选取,也可以分层系统选取,还可以主观选取,此方法适用于样本量较大的情况。开放题编码选定问卷后,仔细阅读每个被调查者对该特定问题的回答,每遇到一个新的答案类别就记录下来,同时记录各答案类别出现的频数,依次类推。这里要注意的是答案除表面含义以外,可能还有引申、隐含的含义,应注意区分。最后结合调查分析目的对分类的要求,对各答案类别进行整理归纳,突出分析重点,尽量包含所有信息且互不交叉,将不能编码或个数较少、可不予考虑的答案归入“其他”项。此外,注意留出位置准备修改,如果后期发现较多或较重要、有新意的类别,可以增加或细化类别。开放题编码您为什么不考虑未来两年不买该产品?太大,厨房进不去买不起外观丑陋不喜欢其颜色,太贵听说不可靠我们家只有两个人,不需要我预期会降价,到时候再买使用起来太复杂不知道产品设计成本因素不可靠不需要不知道五、后设计编码无结构问卷:首先看有无必要编码无结构问卷编码步骤:(1)确定变量,定义问卷变量(2)针对各变量,分别确定答案类别,定义代码六、编码表的设计原则准确性便利性完整性唯一性有效率标准化维护性七、实践中的编码技巧设计问卷时,答题说明尽量详细一些便利性针对模棱两可的问题时,制定统一标准尽量保证编码表的质量,避免由编码表引起的编码误差在编码表中编入“其他”项,如果该答案比较重要或出现频率较多,可以通过增加、细分答案类别,修改编码表,做好编码人员的选择、培训、监督、审核工作。八、调查资料的录入KEY-IN键盘录入,扫描、光标阅读器数据录入软件:文本软件:文件小,操作简单试算表软件:分栏,审核,简单分析数据库软件:专业储存,录入界面统计软件:统计分析。第三节调查数据的清洁和预处理一、调查数据的清洁1.一致性检查和逻辑检查:变量的取值是否超出合理范围有无逻辑错误有无极端值。一、调查数据的清洁2.缺失数据的处理将有缺失值的个案整个删除:数在样本量很大、有缺失数据的个案比例较小,而且有缺失数据的个案与无缺失据的个案在分布上无显著差异时使用。将有缺失值的个案保留,仅在计算时删除相应变量的缺失值:当样本量较大、缺失数据较少且变量间不是高度相关的情况下使用。插补法:均值替代、回归估计、随机抽取、最近距离确定等方法用一个样本统计量的值去代替缺失值用一个统计模型计算出来的值去代替缺失值加权组调整法:就是通过对调查中的回答数据使用加权因子,从而对数据进行调整,减少缺失值的影响二、加权处理加权就是给每个被调查者(个案)赋予一个权重,该权重可以反映该被调查者(个案)相对于其它被调查者(个案)的重要性。权重越大,相

1 / 61
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功