第8章--市场调查数据统计分析(上)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第8章市场调查数据统计分析(上)授课教师:市场调查数据分析概述1单变量数据统计分析2目录Contents双变量统计分析3多变量统计分析4市场调查数据分析概述1第页4数据整理的程序数据整理方案的设计数据的审核与检查数据的排序数据分组数据的显示——统计图表数据的积累与保管定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其条理。统计整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图2021/7/295按照统计学的主要功能划分数据统计分析描述性统计分析推断性统计分析2021/7/297描述统计在统计方法中的地位指标、特征值图表展示统计方法推断统计描述统计根据分析变量的数目划分数据统计分析单变量分析双变量分析多变量分析第一,一次需要分析变量的数目是多少?统计分析方法选择的考虑第二,描述性统计分析还是推断性统计分析?第三,进行分析的变量都采用什么样性质的量表测量的?1、分析变量的数目一个变量单变量分析两个变量双变量分析两个以上变量多变量分析2、描述性统计分析与推断性统计分析描述性统计分析是指利用相关统计值对样本有关特性或变量之间的关系进行描述。通过计算样本数据的均值、标准差、频率、相关系数等,反映出变量的集中趋势、离散程度,以及变量之间的关系等。推断性统计分析是指在描述性统计分析的基础上,根据数理统计原理,利用样本统计值推断总体统计值,或对变量之间关系的显著性进行推断。常用于推断性分析的统计值或显著性检验的方法包括区间估计、Z检验、t检验、方差分析(F检验)、卡方检验等。3、量表的性质市场调查使用的量表有类别量表、顺序量表、等差量表、等比量表,对于不同类型的量表,在进行统计分析时需要使用不同的统计分析工具。4、调查资料数据统计分析的特点方法与工具系统性分析数量化科学性客观性5、数据统计分析的步骤统计推论明确数据统计分析目的整理统计资料选用统计分析方法计算统计值单变量数据统计分析2根据分析变量的数目划分数据统计分析单变量分析双变量分析多变量分析单变量描述性分析的目的在于对样本所有元素在某一方面的观察值进行概括性的描述。一般情况下,对单变量进行描述统计分析时从样本数据的和两个方面进行。对于不同类型的变量数据,进行描述统计分析所使用的统计值会有所不同。1、单变量描述性分析变量类型描述性分析集中趋势离散程度等距或等比量表数据均值、众数、中位数标准差、极差、四分位点内距、频率顺序量表数据众数、中位数四分位点内距、频率类别量表数据众数频率单变量描述统计分析工具•分布的集中趋势,反映次数分布中各数据向其中心值靠拢或聚集的程度(揭示总体中众多个观察值所围绕与集中的中心,即总体数据的一般水平),可以用平均指标表示;集中趋势(水平)•分布的离中趋势,反映次数分布中各数据远离其中心值的程度(各个观察值的分散程度),可以用标志变异指标表示。离中趋势(分散差异程度)第页21数据分布的特征和测度峰度偏态数据的特征和测度分布的形状集中趋势离散程度众数中位数变异系数方差和标准差四分位差极差位置平均数数值平均数算术平均数调和平均数几何平均数集中趋势是指一组数据向某一点集中的情况。测定集中趋势也就是寻找数据一般水平的代表值,用平均指标(平均数)表示。简单算术平均数加权算术平均数切尾算术平均数(1)集中趋势•数值平均数的特点:统计数列中任何一项数据的变动,都将在一定程度上影响到平均数结果。•位置平均数的特点:某些数据的变动,不一定会影响到位置平均数的水平。它不是对数列中的所有各项数据进行计算的结果,而是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值。(1)集中趋势用以描述样本数据集中趋势的指标包括均值中位数众数①均值均值是描述样本数据集中趋势的一个统计量,它表示一系列数据或统计总体的平均特征的值。一组数据的均衡点所在易受极端值的影响用于数值型数据,不能用于定类数据和定序数据简单随机样本的均值计算公式:niixnx11——样本均值;n——样本容量——样本中第i个观测值xxi例1:东风中学需要调查学生日常支出的情况,采用随机抽样的方法抽取本校50名中学生,每一位学生的月支出调查情况如表所示,样本每个月支出的平均金额是多少?380500410400400450430480450500420450450400450550500480400380450350450480500420450500550520480400400450480520500380400380400500550450450480380350400450东风中学学生月支出情况4475022350x由此可知,样本每个月支出的平均金额是447元。如果等距或等比量表数据是以的形式出现,那么该样本单位均值的计算公式为:xfikiinx11——第i个组或群、层中的样本单位数——第i组、群或层内均值k——组、群或层xifi例2:某饮料公司采用分层随机抽样的方法对该地区居民月消费情况进行调查,样本由各年龄段的消费者构成。调查问卷中没有询问受访者每月花费在购买饮料的具体金额。但是根据相关统计资料,研究人员找到了对应与每一组消费者月消费饮料金额的组内平均值。调查的分组情况、分组单位数目和组内平均值如表所示。那么,样本每月花费在饮料的平均金额是多少?某地区消费者的饮料月消费情况年龄单位数目fi均值10岁以下1036.536511~20岁3546.51627.521~30岁3553.51872.531~40岁2539.5987.541~50岁2035.571051~60岁1531.5472.560岁以上1027.5275合计150—6310xixfii07.421502755.4727105.9875.18725.162736515011xfikiix由此可知,样本每个月饮料支出的平均金额是42.07元。②众数众数(mode)指的是在总体或样本中出现频率最高的数值。集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类数据,也可用于定序数据和数值型数据符号为众数分布情况数的不唯一性)•无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242②众数由于众数反映了数据中出现次数最多的数据的代表值,因此在实际工作中有利于抓住重点,有针对性的进行解决。但是,在有的情况下,样本数据中可能会出现多个众数,此时通过众数描述样本数据的集中趋势意义就不再合适。380500410400400430480500420400550500480400380350480500420500550520480400400480520500380400380400500550480380350400东风中学学生月支出情况第页35定类数据的众数某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例3】根据表中的数据,计算众数这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即众数的计算方法第页36定序数据的众数【例4】根据表中的数据,计算众数这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0众数的计算方法【例5】A企业研发部门有20位工作人员,根据他们的工作表现发放绩效奖金,发放的奖金金额如表所示:1000020000800010000800010000150003000080001500080001500010000300002000010000800020000800010000研发人员绩效奖金众数是8000和10000元。单位:元绩效奖金人数(人)150002000030000合计:6633220③中位数(median)中位数就指将总体或样本数据按由小到大或由大到小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。总体或样本的总数个数为奇数:按由小到大排列在中间位置的数即是中位数。总体或样本的总数个数为偶数:按由小到大即是中位数。因此,中位数不一定是总体或样本中的某一个数据。Me50%50%中位数(位置的确定)(位置的确定)未分组数据:组距分组数据:2f中位数位置=第页40未分组数据的中位数的确定若总体或样本的总数个数为奇数时,中位数即处于中间位置的变量值;若总体或样本的总数个数为偶数时,中位数则是中间的两个数值的平均值。第页41定序数据的中位数根据表中的数据,计算甲城市家庭对住房满意状况评价的中位数分析:中位数的位置为:300/2=150从累计频数看,中位数的在“一般”这一组别中。因此Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—第页42数值型未分组数据的中位数据的算例)•原始数据:2422212620•排序:2021222426•位置:12345第页43•原始数据:10591268•排序:56891012•位置:123456位置N+126+123.5中位数8+928.5数值型未分组数据的中位数据的算例)第页44【例7】市场营销课程某小组有7个学生构成,他们期末考试的成绩分别为92,67,83,87,70,64,78,计算市场营销课程期末考试成绩的中位数。排序:64,67,70,78,83,87,92所以,市场营销课程期末考试成绩的中位数是78。第页45【例8】随机抽取某日化公司12名销售人员,他们在2019年8月的销售额(单位:万元)分别为23,19,30,26,23,20,24,28,25,26,19,28。计算该样本中销售额的中位数。排序:19,19,20,23,23,24,25,26,26,28,28,30中位数=(24+25)÷2=24.5第页46都是描述数据集中趋势常用的统计量,能够反映数据的一般水平,可以用来作为一组数据的代表。均值代表一般数据的平均水平众数代表一般数据多数水平中位数代表一般数据中等水平均值易受数据中极端值的影响。众数和中位数则不受极端值的影响。众数不具有唯一性。中位数的可靠性比较差。对均值、众数和中位数的评价知识强化训练第页48(单项选择题)1、以下属于描述样本数据集中趋势的指标是()。A、变异系数B、标准差C、频率D、中位数答案:D第页49(单项选择题)2、以下关于均值、众数和中位数的说法中,哪一项是错误的?()。A、均值代表样本数据的多数水平B、均值容易受到样本数据中极端值的影响C、众数不具有唯一性D、中位数不受样本数据中极端值的影响答案:A第页50(单项选择题)3、在总体或样本中出现频率最高的数值叫做?()。A、中位数B、均值C、众数D、方差答案:C第页51•离散程度指数据远离其“中心值”的程度。(2)离散程度方差标准差变异系数极差四分位点内距频率第页52方差方差是利用所有数据对变异程度进行的度量,它是建立在每个观察值与均值之差的基础上,用于测量一组数据围绕算术平均值的偏差程度。其中,样本观测值与均值之差称之为均值的离差。xixi1122)(ninixxs方差的计算公式:xx)(xxis2——方差——样本观测值xi第页53【例9】以【例7】中7名学生市场营销课程成绩为例,计算方差为即市场

1 / 171
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功