1第六章市场调查资料的整理与分析第一节调查资料的整理第二节调查资料的分析2第一节市场调查资料的整理一、调查资料整理的概念二、调查资料整理的内容三、调查资料整理的程序3一、调查资料整理的概念所谓市场调查资料的整理,就是指运用科学的方法,对调查所获得的各种原始资料进行审核、分类处理和加工综合,使之系统化和条理化,从而以集中、简明的方式反映调查对象总体情况的工作过程。4二、调查资料整理的内容1、调查资料的处理(整理):包括审核、分类、汇总和制图表。2、数据管理:包括资料的输入、传输、存贮、更新与输出。5制定整理方案对原始资料进行审核数据处理制作统计表或统计图三、调查资料整理的程序6问卷审核编码数据处理图表制作调查问卷整理程序录入7实地审核一般方式:复查和回访审核分为两个层面资料审核主要内容包括:•资料的时效性—准•资料的完整性—缺•资料的正确性—误1、审核8调查资料审核的主要内容(1)时效性指所填资料是否是最新资料。(2)完整性看是否有缺损问卷;是否都填写齐全;是否有答案模糊不清的问卷。(3)正确性指审核访谈是否按适当的方式进行,访问员有没有作假行为,调查口径、计算方法等是否符合要求等。9调查资料审核的主要方法经验判断法例如:如果被调查者年龄填写为132岁,根据经验判断,其填写肯定有误。逻辑检查法例如:某消费者在前面说“不知道”某调味品,后面却说“每天都在使用”,显然前后矛盾。计算审核法例如:在家庭收支结构中,家庭总收入远小于总支出和储蓄之和,那肯定有错。10对不合格答案的的处理办法第一,退回实施现场获取较好的数据。第二,按缺失值处理(前提是退回实施现场的做法无法实现)。第三,整个问卷作废(前提是不满意问卷的比例很小不足10%;样本量很大;不满意的问卷与满意的问卷间没有明显的判别每份不满意的问卷中,不满意答案的比例很大)。11注意:下列问卷一般是不能接受的第一,所回收的问卷是明显不完整,如缺一页或多页。第二,问卷从整体或部分看回答不完全。第三,调查员没有理解访问指南而误导被访问者回答,结果离题太远,如没有要求跳答。第四,同一项目的回答,答案几乎没有变化;第五,问卷回收超过规定的截止日期。第六,回答问题的被访问者不符合要求。第七,答案字迹模糊不清,无法辨认。第八,对开放性的问题回答模棱两可,难以清楚表达调查意图。122、编码编码就是给每一个问题及答案分配一个代号,通常是一个数字、字母或特殊的符号。将问卷信息转化为统一设计的计算机可识别的代码,以便于对其进行数据整理和分析。作用:(1)减少数据录入和分析的工作量(2)将定性数据转化为定量数据(3)减少误差13安·莫勒的编码与数据录入经验之谈安·莫勒是亚特兰大SDR公司的数据录入员。20年来,在管理项目数据录入方面积累了丰富的经验,他认为要在客户预算允许的范围内如期完成调研工作,重要的是避免问卷中出现过多的开放型问题,这些问题的答案不能直接输入数字代码,解决的办法是根据项目分类设计编码,或将反馈内容原样录入电脑。莫勒说:“编码是数据录入过程中耗资最大且最主要的部分”。“我们读同一文本,对它的编码可能不同。┅┅如果有太多的答案需要编码,分析过程就会令人厌烦,而且理解详尽答案的花费将是非常之高的”。14封闭式问题的编码步骤:第一,找出问题中的关键词。第二,用适当的符号代表关键词,通常用拼音或英文缩写作为编码,这样便于识别;对单选题,只用一个编码,如果是多选题,它的每一个选项都应该有一个编码,这时可在统一的符号后加上序号作为各个选项的编码。第三,确定编码的取值范围。单选题编码的取值就是各选项的序号;多选题编码的取值就是0或1(选中为1,未选中为0),确定编码的取值范围有利于检查编码值的输入是否正确。第四,检查编码是否雷同,一张调查问卷或调查表中的每一编码都应该是唯一的。第五,编出编码表,它可与调查问题进行对照,以免遗漏,也有利于统计汇总。1516编码的主要方法(1)顺序编码法(2)分组编码法(3)信息组码编码法(4)助忆编码法(5)缩写编码法17顺序编码法:又称系列编码法,用一个标准对信息资料分类,按一定顺序用连续数字或字母进行编码;简洁明了,易于管理。例如:您的性别:□男□女编码:XB(1、2)分组编码法:又称区间编码法,把一定位数的代码单元分成若干个组,每一组数字代表一定意义;使用相当广泛,容易记忆,处理较方便,有时位数过多,会造成系统维护困难。例如:1242表示?18信息组码编码法例如:百货组从1-20、食品组从20-40表意式文字编码法(又叫助忆编码法):指用数字、文字、符号等来表明编码对象的属性。例如:20TVC表示20英寸彩色电视机缩写编码法例如:KG表示千克193、录入录入就是由录入员将问卷按照确定好的编码输入到计算机,目前主要采用键盘输入法。控制录入质量的方法:(1)重复录入(2)预算控制(3)平衡检测204、数据处理处理方法:(1)自行直接人工处理(2)委托专业机构处理常用软件:(1)Excell(2)SPSS(StatisticsPackageforTheSocialScience“社会科学统计软件”)215、统计表与统计图统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。22统计表的结构1)从表式上看表格包括总标题、横行标题、纵栏标题和指标数值四个部分。如表1所示:2)从内容上看统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。此外,统计表还有补充资料、注解、资料来源、填表单位、填表人等。232010年某月某公司各企业劳动生产率分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计横行标题主词宾词数据资料(指标数值)纵栏标题总标题例如:24统计表的设计应注意事项:1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。2.合计栏的设置。3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。254.指标数值的填写。当缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“—”表示。5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。6.注解或资料来源。在统计表下,应注明资料来源。26常用的统计图(1)直方图用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。(2)折线图折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成(3)曲线图用平滑曲线连接各组次数坐标点即得分布曲线。27直方图直方图(向上累计)0510152025299.9399.9499.9599.9699.9组限频率0.00%20.00%40.00%60.00%80.00%100.00%120.00%频率向上累积%28折线图频数分布折线图115211030510152025299.9399.9499.9599.9699.9组限频数频率折线图是在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:直方图与折线图04812考分次数0102030比率(%)30曲线图频率分布曲线图299.9399.9499.9599.9699.90510152025299.9399.9499.9599.9699.9频率31(4)散点图、趋势图知名度、满意度分析图雅虎,63.30%搜狐,90.10%网易,75.00%新浪,85.10%01234560.00%70.00%80.00%90.00%100.00%知名度满意度网易雅虎新浪搜狐销售额的趋势图y=4.0883x-8135.9R2=0.9314-100102030401988199019921994199619982000年份销售额(万元)销售额Y线性(销售额Y)3211%17%14%14%11%18%7%4%4%体操举重乒乓球羽毛球射击跳水柔道田径跆拳道(5)圆形图(饼图Pie)33354435211体操举重乒乓球羽毛球射击跳水柔道田径跆拳道34354435211体操举重乒乓球羽毛球射击跳水柔道田径跆拳道35数据表示中的错误ErrorsinPresentingData1.使用花哨(Junk)图表2.数据比较时没有可靠的相对基准3.压缩纵轴CompressingtheVerticalAxis4.纵轴上无零点NoZeroPointontheVerticalAxis36花哨图表ChartJunk不准确的表示准确的表示1960:$1.001970:$1.601980:$3.101990:$3.80最低工资最低工资0241960197019801990$37压缩纵轴CompressingVerticalAxis季度销售季度销售不准确的表示025501季2季3季4季$01002001季2季3季4季$准确的表示38纵轴无零点NoZeroPointonVerticalAxis月销售量月销售量不准确的表示0204060一三五七九十一$36394245一三五七九十一$准确的表示39第二节市场调查资料的分析一、调查资料分析的概念二、调查资料分析的方法40一、调查资料分析的概念指对市场调查与预测过程中收集到的各种原始数据进行适当的处理,使其显示一定的含义,进而反映不同数据之间以及新数据与原数据之间的联系,并通过分析,得出某些结论。411、描述性统计分析法2、解析性统计分析法(1)相关(回归)分析法;(2)聚类分析法(3)主成份分析、因子分析二、调查资料分析的方法42交叉列表分析技术交叉列表分析是同时将两个或两个以上具有有限类目数和确定值的变量,按照一定顺序对应排列在一张表中,从中分析变量之间的相关关系,得出科学结论的技术。43例如:电脑的拥有情况和电脑拥有者收入之间的关系拥有情况收入水平行合计高收入水平中等收入低收入有25215696504没有156240300696列合计4083963961200表2电脑的拥有情况与收入之间的关系(人数)分析:从表中可以看出,在拥有电脑的504人中,高收入者有252人,低收入者仅有96人,这说明电脑的拥有情况似乎与收入水平有很大的关系。44三变量交叉列表分析技术讨论的三变量交叉列表分析就是在双变量分析的基础上,加入第三个变量做进一步分析,可以补充说明原有两变量分析的结果,使之更准确全面。45三变量交叉列表分析的作用其作用表现在:(1)更精确反映原有二变量之间的联系;(2)揭示原有的两个变量之间的不相关,也就是说三变量交叉列表分析结果显示了两者之间的相关性是虚假的;(3)加入第三个变量后,可能显示原有两变量之间被隐含的关系;(4)可能说明原有两变量之间的联系没有改变。46拥有情况受教育程度大专以上大专以下收入水平收入水平高收入中等收入低收入高收入中等收入低收入有65%63%60%40%34%20%没有35%37%40%60%66%80%列合计100%100%100%100%100%100%个案数200196196208200200表3按“收入水平”和“受教育程度”分类“拥有情况”的三维联表由表显示:大专以上的受访者中无论是高收入,中等收入还是低收入者他们的电脑拥有率都差不多,都在60%以上,而低于大专的受访者中没有拥有电脑的无论是高收入还是中低收入都在60%以上。这说明真正有相关性的变量是“受教育程度”和“拥有情况”,而不是“收入水平”与“拥有情况”,他们之间的相关性是虚假的。47结束