基础数据分析:描述统计学第章本章学习目标了解数据压缩的概念及其四种功能理解营销调研中统计分析的五种基本类型使用惯常用于描述数据的中心趋势方法和发散法利用视窗SPSS学习掌握描述统计学一、数据压缩数据矩阵是调查中的原始数据经过编码后得到的。这种数据的列是调查伟大中对不同问题的应答,行表示每一种情况。当面对一个数据矩阵时,营销调研者将面临的任务是数据压缩,数据压缩是指通过计算教少的数据集合中的数量来描述数据的过程。(一)数据压缩的四种功能1、概括概括是将原始数据转变成一些有意义的计算结果的过程。2、概念化是将这些量所表达内容的想象。3、解释4、内推我们特指用来描述和刻画整体样本的数据矩阵模型或特征的度的估计数的内推。二、应用于营销调研的统计分析类型类型说明例子统计概念描述数据压缩描述典型的被访问者,描述回答类似程度均值,中值,众数,频率分布,标准差推理决定参数,检验假设估计总体值标准误差,零假设差别确定组与组之间是否存在差异估计一个样本中两组均值的差异的统计重要性差别的t检验,方差的分析联合确定联系确定两个变量是否存在系统状态相关相关性,交叉表预测预测以统计模型为基础给出x的数量估计,y的水平时间分析,分析回归三、通过描述分析理解数据(一)中心趋势量数据压缩包含所有的中心趋势量的基本目标是给出对一个问题的最典型的回答。有三个这样的中心趋势量通常用做数据压缩工具,它们是众数、中位数与均值。1、众数。众数是一种描述统计量,是一串数字中出现次数最多的值。2、中位数。中位数表示了一组有序值的列里居中的那个值。3、均值。均值是刻画一组数字的算术平均值。均值计算公式如下:值的累加。为为各个数值;为一组中的一个数;式中:)算术平均值(iiniixxnnxx1(二)变化性的量变化性的量是关于描述一组值中,值与值之间“典型”的差异。1、频率分布频率分布是一套特定的数值集合中的每一个不同的值出现的次数表。频率本身是原始计数,通常把这些频率转化为百分率以便于比较。这个转化就是用观察的样本个体总数去除每个值出现的频率,结果转化为百分数。这就是百分分布。2、极差极差表示出一个有序值的集合中最低值(最小值)与最高值(最大值)之间的距离。3、标准差标准差指出了变化的程度或者说是值的多样性,这些值在一定意义上可以转化成正态分布或钟形曲线分布。(三)、其他的描述量其他的描述量主要用于满足特殊的目的,因此,他们不常被使用。1、偏斜量揭示了分布中不对称的度与方向。2、峰度指出了一个分布显现出多尖或者怎样的峰。四、何时使用特定的描述量