本部分主要内容第一节市场调查资料的整理第二节市场调查资料的分析第三节市场调查报告的撰写本节内容及教学要求市场调查资料整理的意义市场调查资料整理的程序及步骤调查问卷的回收调查问卷的编码调查资料的录入调查数据的净化统计预处理市场调查资料整理的意义一项完整的市场调查的工作流程如下:调查资料的整理调查资料的搜集调查资料的分析调查报报告的撰写市场调查资料整理的意义市场调查资料整理是指根据研究目的,运用科学的方法,对调查资料进行审核、校订、编码、录入、净化、存储及一些简单的统计预处理,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的工作过程。此处所说的调查资料主要是指调查问卷资料。当然其它形式的资料也涉及到整理和分析工作。市场调查资料整理的意义如果说实地调查阶段是认识的感性阶段,分析阶段是认识的理性阶段的话,那么,资料整理就是从实地调查阶段过渡到分析,是由感性认识上升到理性认识的一个必经的中间环节。资料整理是提高调查数据质量的必要步骤。资料的整理是分析的重要基础。资料的整理便于今后对数据的长期保存和研究。市场调查资料整理的程序及步骤调查问卷的回收调查问卷的审核调查问卷的编码调查问卷的录入数据的净化统计预处理变量转换加权处理调查资料的分析分组汇总调查问卷的回收与资料收集工作相配合,随时掌握完成的问卷数和接收的问卷数。记录问卷完成的日期及接收的日期,以便前后比较。给每份问卷编一个有顺序的识别号码。在工作交接时,要注意原始文件在哪里,保证不丢失。多个调查项目同时进行时,要分清每个项目问卷的回收等情况。调查问卷的审核审核的内容审核的主要方法审核的阶段(何时进行审核)审核的基本步骤及问题的处理审核的内容完整性审核。缺页;回答不完整;调查单位遗漏等。正确性审核。主要审核调查资料的口径、计算办法、计量单位等是否符合要求。一致性审核。主要是审核被调查者的回答是否前后不一致,有无逻辑性错误。及时性审核。书写及意思表达方面的审核。审核的主要方法经验判断。依据个人的判断、经验选择逻辑检查。IF(完成情况)=(90%)then(合格)elsereturnfalse(不合格)计算审核。按照计算出来的合格率,规定数据检查审核的阶段(何时进行审核)实地审核:调查员审核与督导审核初步调查,访问员在访问结束后及时对问卷进行审查,检查问卷的完整性、正确性、一致性以及是否清楚易懂。如果有没回答的问题要说明为什么没填写;并且在旁边写明可信程度。中心办公室审核资料收集工作结束后立即开始比实地审查更加认真、仔细。审核工作最好有一个人进行检查,如要分工按结构分,不要按份数分。审核的的基本步骤及问题的处理以中心办公室审核为例。1.接收问卷时核查(又称一审)。核查人员最好能把原始问卷分为可以接受的、明显要作废的以及仍有疑问的。将无效的或不能接受的问卷剔除。无效的问卷的具体情况。做好登记表格,并把回收的情况具体记录好。审核的的基本步骤及问题的处理2.编辑检查(又称二审)对问卷进行更为精准和精确的检查。检查回答的安全性、准确性、一致性以及是否清楚易懂3.采取相应的处理措施对于无法令人满意的问卷,常用的处理方法为退回实地重新调查、视为缺失数据或者放弃不用。(放弃不用时要说明放弃的理由和数量)调查问卷的编码编码的概念编码的作用编码设计的内容编码设计的分类前设计编码后设计编码编码表的设计原则编码的概念所谓编码,就是对每一份问卷和问卷中的每一个问题、每一个答案编定一个惟一的代码,并以此为依据对问卷进行数据处理。或者,编码就是将问卷信息(包括调查问题和答案)转化为同一设计的计算机可以识别的代码,以便于对其进行数据整理与分析。根据设定的编码,将问卷答案转化为相应代码的过程。编码的作用减少数据录入和分析的工作量,节省费用和时间,提高工作效率;将定性数据转化为定量数据,是实现计算机处理的桥梁;减少误差。编码设计的内容编码的设计即确定各问卷、问卷各项目和答案对应代码的名称、形式、范围以及与原数据的对应关系。编码设计的具体内容包括:问卷的代码、变量的定义(名称、类型、位数、对应问题等)、取值的定义(范围、对应含义等)。将这些内容列成表格形式,称为编码表。编码设计与问卷设计的关系。变量序号变量名变量类型变量所占字节取值范围取值对应的含义备注对应题号对应问题38V28数值型10-4或90-3表示台数;4表示4台或4台以上;9表示缺失(没填)28家中拥有电视机数某项调查的编码表格式例:编码设计的分类1结构式问卷编码设计和非结构式问卷编码设计2封闭题、半封闭题和开放题编码设计3前设计编码和后设计编码前设计编码主要是针对答案类别事先已知的问题,如结构式问卷中的封闭题和数字型开放题,在问卷设计的同时设计编码表。后设计编码主要是针对答案类别事先无法确定的问题,如非结构问卷和结构式问卷中的文字型开放题,要在数据收集完成后,根据被调查的回答设计编码表。前设计编码前设计编码设计(封闭题)•单选题的编码设计(含两项选择题)•多选题的编码设计•排序题的编码设计后设计的编码设计(开放题)单选题的编码设计Q18请问您最近一年内买过DVD光盘吗?1、买过2、没买过[]对单选题只需规定一个变量,取值即为选项号。变量序号变量名变量类型变量所占字节取值范围取值对应的含义备注对应题号对应问题V18数值型11、2或91表示买过,2表示没买过;9表示缺失18最近一年买过DVD盘没有多选题的编码设计对多选题需规定多个变量,取值即为选项号。对变量与取值的定义一般有两种做法:一种做法是将各个可能回答的答案选项都设为一个0---1指示变量,如果被调查者选择了该答案,此变量的取值为1,否则为0。Q17请问您观看的DVD光盘的主要来源是?[][][]1.自己购买2.租借3.向朋友/同事/亲戚借的4.别人送的5.单位的6.其他多选题的编码设计变量序号变量名变量类型变量所占字节取值范围取值对应的含义备注对应题号对应问题方法1改进法V171数值型10或10或1取值为1(或1---6)表示该选项为主要来源,为0则不是全为0表示该题无回答17观看的DVD盘的主要来源V172数值型10或10或2V173数值型10或10或3V174数值型10或10或4V175数值型10或10或5V176数值型10或10或6多选题的编码设计另一种做法是将变量定义为所选题号,变量值为选项号,变两排列顺序即为选择答案的顺序。变量序号变量名变量类型变量所占字节取值范围取值对应的含义i=1.2.3.4.5.6备注对应题号对应问题V171数值型10---6取值为i表明第i选项为主要来源,为0则说明其余选项都不是主要来源全为0表示该题无回答17观看的DVD盘的主要来源V172数值型10---6V173数值型10---6排序题的编码设计对排序题同样需规定多个变量,与多选题类似,也有两种方法,这两种方法对应的问题形式略有差异。一种方法是,变量个数即选项个数,按照选项排列顺序,分别定义各变量为对应选项所排次序号,取之即为次序号。例如:Q12请您根据信任程度由大到小对下列广告排序(新人最高的广告前填1,其次信任的填2,依次类推,最不信任的填5):[]A.电视广告[]B.报纸广告[]C.广播广告[]D.杂志广告[]E.路牌广告排序题的编码设计变量序号变量名变量类型变量所占字节取值范围取值对应的含义i=1.2.3.4.5备注对应题号对应问题V121数值型10---5取值为i表明该广告的信任程度排名为i,为0则表明对该广告的排名缺失全为0表示该题无回答12对各类广告的排序V122数值型10---5V123数值型10---5V124数值型10---5V125数值型10---5排序题的编码设计另一种方法是,变量个数即要求排序项数,依照次序号排列顺序,分别定义各变量为各次序号对应的选项项数,取值即为选项号。Q12请问下列广告中,您最信任哪个广告?[]其次呢?[]再次呢?[]1.电视广告2.报纸广告3.广播广告4.杂志广告5.路牌广告排序题的编码设计另一种做法是将变量定义为所选题号,变量值为选项号,变两排列顺序即为选择答案的顺序。变量序号变量名变量类型变量所占字节取值范围取值对应的含义i=1.2.3.4.5备注对应题号对应问题V121数值型10---5i为对应信任度的广告对应的选项号,为0则表明对应信任度的广告缺失。全为0表示该题无回答12对各类广告的排序V122数值型10---5V123数值型10---5数字型开放题的编码设计对此类题也只需设一个变量即可,变两取值即为该数字。例如,直接询问被调查的年龄,可以做如下设计。变量序号变量名变量类型变量所占字节取值范围取值对应的含义备注对应题号对应问题NL数值型220--65变量取值即为年龄调查者的年龄后设计编码开放题无结构问卷这两种情况要想进行定量分析,都必须将问题转化为一个或几个变量,并将所有可能的答案类别赋予相应代码。–后编码步骤列出有效答案频数分布判断答案分布拟定适宜分组数选择和归并答案选择组别标志制定编码规则对全部问卷编码开放性问题编码步骤第一步录入答案第二步尝试用不同方法对录入的答案进行排序、归类第三步编码人员及问卷设计者根据调查的目的对抄出的答案进一步归纳,形成类别数量适当的“编码表”。第四步调查人员根据“编码表”中的编码对所有开放题的答案进行逐一归类,并在每个问题旁边写上实际答案在编码表中对应的号码。统计分组注意事项:•按照某一标志进行分组,不要遗漏任何资料。•组距尽可能取整数,不要小数•各组的组距尽可能相等,多用等距分组•如果问卷中本来就已经做好分类,后面做表格时就按照原来的分类进行排列•对非区间范围的某一个数字,应设计出分组,使其在分组的间隔中•分类间隔应是相互排斥的2、事后编码Q2.请问您不喜欢吃巧克力的原因有哪些?(需要追问)Q3.请问对于**产品,您愿意接受什么样的促销活动?[多选]免费试用………………………………1价格打折………………………………2赠送相关产品…………………………3礼品盒/礼品包………………………4抽奖……………………………………5会员式活动……………………………6集旧包装换取新产品、奖品等………7其他[请注明]______________________Q4.请问您不喜欢吃巧克力的原因有哪些?Q4.原因次数价格不合理5价格有点贵4糖多怕胖10因为体重增加8热量高,怕发胖8妈妈说上火4天气太热了,易上火15天气热想吃清淡的6价格原因1…………编码表Q4.合并原因编码价格不合理1担心发胖2易上火3…………Q4.请问您不喜欢吃巧克力的原因有哪些?(需要追问)Q4.原因对应编码热量高,吃了怕发胖2价格有点贵1…………调查问题对照表编码表制作1、编码的基本原则跑步实例演示调查资料的录入CATI-计算机辅助电话调查、CAPI-计算机辅助面访以及网络调查,无须再进行数据的录入。录入方式:键盘录入;扫描;光标阅读器等。最多的还是键盘录入。录入的文件形式有多种多样。(office,PTF)如何控制录入质量:认真挑选录入人员;加强监督;抽检;双机录入等。调查数据的净化一致性检查和逻辑检查(通过计算机进行);检查的内容主要包括变量的取值是否超出合理的范围、有无逻辑性错误以及极端值。缺失数据的处理(有合理缺失的)•删除个案•删除缺失值•插补法:利用其它数据替代或估算缺失值。均值替代;回归估计。