第七章市场调查的数据分析市场调查数据分析的基本方法假设检验法方差分析法聚类分析法判别分析法市场调查资料的分析方法分类定性分析定量分析方法定性分析的含义定性分析是与定量分析相对而言的,它是对不能量化的现象进行系统化理性认识的分析,其方法依据是科学的哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势及规律的性质方面的认识。定性分析有如下特点:分析的对象是调查资料;分析的直接目的是要证实或证伪研究假设,对市场现象得出理论认识、分析;强调纵式关系。常用的定性分析方法归纳分析法。归纳分析法是我们用得最广泛的一种方法,分为完全归纳法和不完全归纳法。演绎分析法。比较分析法。比较分析法是把两个或两类事物的调查资料相对比,从而确定它们之间相同点和不同点的逻辑方法。结构分析法。在市场调查的定性分析中,我们通过调查资料,分析某现象的结构及其各组成部分的功能,进而认识这一现象本质的方法,称为结构分析法。定量分析定量分析是指从事物的数量特征方面入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中所包含的事物本身的特性及规律性,从而挖掘出数量中所包含的事物本身的特性的分析方法。营销调研中常用的统计分析方法类型说明例子统计概念描述数据压缩描述典型的被访问者,描述回答类似程度均值、中值、众数、频率分布、标准差推理决定总体参数,检验假设估计总体值标准误差,零假设差别确定组与组之间是否存在差异估计一个样本中两组均值的差异的统计重要性差别的t检验,方差分析相关确定联系确定两个变量是否在系统状态下相关相关性,交叉表预测预测以统计模型为基础给出x的数量估计y的水平时间序列,回归分析(二)描述性统计分析方法描述性统计分析(DescriptiveAnalysis)的含义及内容描述性统计分析指对被调查总体所有单位的有关数据进行整理和计算综合指标等的加工处理,是用来描述总体特征的统计分析方法。市场调查分析中最常用的描述性统计分析,主要包括对调查数据的分组分析、集中趋势分析、离散程度分析和相对程度分析、指数分析。数据的集中趋势分析对调查数据公布的数量规律性中集中特征进行分析,是对被调查总体的特征进行准确描述的重要前提。数据集中趋势分析的对象,包括数据的均值(各类平均数)、中位数和众数。均值是数据偶然性和随机性的一个特征值,反映了一些数据必然性的特点。众数是总体中出现次数最多单位的标志值,也是测定数据集中趋势的一种方法,克服了平均数指标会受数据中极端值影响的缺陷。中位数的确定可以以未分组资料为基础,也可由分组资料得到。它同样不受到资料中少数极端值大小的影响。在某些情况下,用中位数反映现象的一般水平比算术平均数更具有代表性,尤其对于两极分化严重的数据,更是如此。数据的离散程度分析(一)反映数据差异程度的数值,有极差、平均差、方差和标准差离散系数等。极差(也称全距)是数据中两个极端值,不能反映数据变化的影响,受极端值的影响较大。一般说,极差越大,平均值的代表性越小。所以,极差可以一般性地检验平均值的代表性大小。平均差是总体各单位标志值与其算术平均数离差绝对值的算术平均数。平均差的计算由于涉及了总体中的全部数据,因而能更综合地反映总体数据的离散程度。数据的离散程度分析(二)方差与标准差是幂的关系,前者是后者的平方。标准差的计算公式,也视资料的分组情况而分为简单平均式和加权平均式。这两个指标均是反映总体中所有单位标志值对平均数的离差关系,是测定数据离散程度最重要的指标,其数值的大小与平均数代表性的大小呈反方向变化。离散系数是为两组数据间进行比较而设计的;是一组数据标准差与均值相比较而得的相对值。在不同情况的两组数据间,直接用标准差进行离散程度的比较是不科学的,甚至还会得出相反的结论。相对程度分析的含义相对程度分析是统计分析的重要方法,是反映现象之间数量关系的重要手段。它通过对比的方法反映现象之间的联系程度,表明现象的发展过程,还可以使那些利用总量指标不不能直接对比的现象找到可比的基础,因而在市场调查分析中经常使用。市场调查分析中常用的相对指标结构相对指标。结构相对指标是总体各组部分与总体数值对比求得的比重或比率,用来表明总体内部的构成情况。它从静态上反映总体内部构成,揭示事物的本质特征,其动态变化可以反映事物的结构发展变化趋势和规律性。比较相对指标。比较相对指标是指不同总体同类现象指标数值之比。它表明同类现象在不同空间的数量对比关系,可以说明同类现象在不同地区、单位之间发展的差异程度,通常用倍数(系数)或百分数表示。比例相对指标。社会经济现象总体内各组成部分之间存在着一定的联系,具有一定的比例关系。为了掌握各部分之间数量的联系程度,需要把不同部分进行对比。比例相对指标就是同一总体内不同部分的指标数值对比得到的相对数,它表明总体内各部分的比例关系,如家计调查中的收支比例,国民经济结构中的农、轻、重比例等,通常用百分数表示,也可以用一比几或几比几的形式表示。强度相对指标。在市场调查中,有时要研究不同事物间的联系,如流通费与商品销售额、产值与固定资产等,这就需要通过计算强度相对指标来分析。强度相对指标是两个性质不同而有联系的总量指标对比得到的相对数,它反映现象的强度、密度普通程度。(三)推理分析推理分析(InferentialAnalysis)的含义推理分析是在样本数据的基础上推导出关于总体特征的结论。也就是说,这样的统计允许研究者在样本提供的数据矩阵中包含的信息基础上得出关于总体的结论。推理分析包括假设检验(指将样本统计量与在做调查研究之前假设的总体值作比较)和参数估计(在样本信息基础上通过置信区间来估计的总体值)。参数估计样本统计量。由样本提供的信息计算出的值,被称为样本的统计量。统计量的标准误差期望的置信水平。典型的有90%、95%和99%。假设检验开始陈述你相信存在于总体中的事实,即总体均值或百分比抽取样本,然后测定样本统计量将统计量与假设的参数进行比较决定样本是否支持最初的假设如果样本不支持假设,修正假设使得它与样本统计量一致。(四)差别分析差别分析(DifferencesAnalysis)研究者运用差别分析来确定总体中真实存在的总的差异程度。差别分析包括组与组之间显著差别的t检验法(适用于两个组的差别分析中)与方差分析法(适用于两个以上组的差别分析)。t检验t检验是样本容量小于等于30的情况下的统计检验。均值方差分析方差分析的最终结果是给营销调研者一个启示:在至少两组均值之间,在选定的某一统计显著性水平上,是否存在明显差异。方差分析中三种类型的方差:–总差异:是所有被观察的个体值相对于总平均差的平方和,它是总平均值,是所有个体的平均。–组间差异:是每组样本平均值和总均值之差的平方之和。–组内差异:是每个个体值和其所在组的均值差的平方和(相对于单组平均)。(五)相关分析相关分析(AssociativeAnalysis)相关分析审查两个变量是否相关和如何相关。皮尔逊相关分析不仅显示了相关的度,而且显示了相关的方向。市场调查数据分析的基本方法频数、频率分析数据集中趋势分析算术平均数中位数众数数据分散趋势分析全距(极差)四分位差标准差频数、频率分析(1)例1:假设有样本数据ABCDEFGHIJ112214653322611223254334413314335413456424635352112114662634551322763662365118415336463495132522262103252341445频数、频率分析(2)VAR000016.005.004.003.002.001.00Count222018161412频数、频率分析(3)VAR000011717.017.017.02020.020.037.02121.021.058.01616.016.074.01313.013.087.01313.013.0100.0100100.0100.01.002.003.004.005.006.00TotalValidFrequencyPercentValidPercentCumulativePercent算术平均数未分组数据的平均数计算分组数据的平均数计算上例的计算结果270.31001001iixxfffxfxfxnxx为组频数中位数的计算(1)未分组数据的中位数计算对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。中位数的计算(2)分组数据的中位数计算下式中L为中位数所在组的下限值,fm为中位数所在组的组频数,Sm-1为至中位数组时累计总频数,h为组距。hfSfLMmme121中位数的计算(3)例2:假设有分组数据如下(销售额单位为万元)年销售额组中值商店数目累计频数80-90853390-10095710100-1101051323110-120115528120-130125230合计30中位数的计算(4)依据公式例2的中位数为万元85.103101310230100212111hfSfLMhfSfLMmmemme众数的计算未分组数据的众数为出现次数最多的数。分组数据的众数依据下式计算获得。表达式中△1表示众数所在组与前一组的频数差,△2表示众数所在组与后一组的频数差。依据公式,例2分组数据的众数为104.29万元。hLMo211全距(极差)的计算全距指的是样本数据中最大值与最小值之间的距离,因而也叫极差。例1中最小值为1,最大值为6,因而全距为6-1=5。四分位差的计算四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。例2的四分位差计算过程如下万元四分位差万元万元606243.9662.109262.109101310343010043.961073430901331.QQQQ标准差的计算(1)未分组数据的标准差计算nxxnxxs2)(标准差的计算(2)分组数据的标准差的计算fxfxffxxs2)(市场调查数据的假设检验参数假设检验U检验t检验非参数检验U检验当样本容量大于30时,可以采用U检验。均值检验百分比检验双样本平均数差异的检验双样本百分比差异的检验均值检验(U)假设有选取统计量设定显著性水平查表得到根据U的计算结果,比较U的绝对值与的大小。若有则接受H0,否则拒绝H0。0100::HHnsxU05.096.12U2U2UU百分比检验(U)假设有选取统计量设定显著性水平查表得到根据U的计算结果,比较U的绝对值与的大小。若有则接受H0,否则拒绝H0。0100::PPHPPHnPPPpU)1(05.096.12U2U2UU双样本平均数差异的检验(U)假设有选取统计量设定显著性水平查表得到根据U的计算结果,比较U的绝对值与的大小。若有则接受H0,否则拒绝H0。211210::HH22212121nsnsxxU05.096.12U2U2UU双样本百分比差异的检验(U)假设有选取统计量设定显著性水平查表得到根据U的计算结果,比较U的绝对值与的大小。若有则接受H0,否则拒绝H0。211210::PPHPPH22211121)1()1(nppnppppU05.096.12U2U2UU5.2.2t检验当样本容量小于30时,不可以使用U检验,而需要使用t检验。均值检验均值差异的检验百分比差异的检验均值检验(t)假设有选取统计量设定显著性水平查表得到根据t的计算结果,比较t的绝