多维尺度分析MDSMultidimensionalScaling北京广播学院新闻传播学院调查统计研究所二零零一年五月沈浩2020/4/26主要内容多维尺度分析MDS的基本概念多维尺度分析MDS的主要步骤如何揭示MDS感知图收集和准备数据MDS的应用实例MDS分析软件使用对维尺度分析-MultidimensionalScaling在市场研究领域主要研究消费者的态度,衡量消费者的知觉及偏好。涉及的研究对象非常广泛,例如:汽车、洗头水、饮料、快餐食品、香烟和国家、企业品牌、政党候选人等。通过MDS分析能够为市场研究提供有关消费者的知觉和偏好信息。主要借助计算机统计分析软件,输入有关消费者对事物的知觉或偏好数据,转换为一组对象或对象特征构成的多维空间知觉或偏好图——感知图。什么是多维尺度分析?分析研究对象的相似性或差异性的一种多元统计分析方法。可以创建多维空间感知图,图中的点(对象)的距离反应了它们的相似性或差异性(不相似性)。一般在两维空间,最多三维空间比较容易解释。可以揭示影响研究对象相似性或差异性的未知变量-因子-潜在维度。MDS的基本概念使用多维尺度可以分析什么类型的数据。如何获得测量相似性或差异性的技术。如何使用统计软件实现MDS分析的步骤。如何从MDS分析结果中,产生和解释感知图。研究对象主要指:产品的品牌、特征、不同组的消费者、地理位置等。检验邻近性-Examiningproximities应用MDS,收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种数据叫做邻近。所有研究对象的邻近数据可以用一个邻近矩阵表示。反映邻近的测量方式:相似性-数值越大对应着研究对象越相似。差异性-数值越大对应着研究对象越不相似。测量邻近性数据的类型两个地点(位置)之间的实际距离。(测量差异性)两个产品之间相似性或差异性的消费者心理测量。两个变量的相关性测量。(相关系数测量相似性)从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者对品牌或产品偏好的变化。(测量相似性)反映两种事物在一起的程度。例如:用早餐人们经常将两种食品搭配在一起。(测量相似性)邻近数据即可以直接测量(距离),也可以通过计算得到(变量间的相关系数)。多维尺度分析MDS的主要步骤定义研究目的和对象确定相似性或差异性测量方法收集数据方法构造数据格式-相似性矩阵软件分析解释和结论感知图一个典型的MDS分析实例美国大城市之间的距离,反映了城市之间地理位置的差异性。通过MDS可以产生一个感知图,显示了城市之间的相对位置。AtlantaChicagoDenverHoustonLosAngelesMiamiNewYorkSanFranciscoSeattleWanshingtonD.C.Atlanta0.........Chicago5870........Denver12129200.......Houston7019408790......LosAngeles1936174583113740.....Miami6041188172696823390....NewYork74871316311420245110920...SanFrancisco213918589491645347259425710..Seattle2182173710211891959273424086780.WanshingtonD.C.543597149412202300923205244223290邻近矩阵反应了城市之间的航空距离。因为距离是对称的,只要输入下对角线数据。DerivedStimulusConfigurationEuclideandistancemodelDimension12.01.51.0.50.0-.5-1.0-1.5-2.0Dimension2.8.6.4.20.0-.2-.4-.6-.8washdcsanfransnewyorkmiamilosanghoustondenverchicagoatlantaseattleSPSS结果SAS结果你是否学会了用MDS分析?试一试用MDS分析中国主要省会城市之间航空距离的分布。看是否能够从图中更好地解释省市之间的含义。收集数据和数据转换的方法语义差异比较法配对比较法二分法三分法主观分类法固定组数分类法变动组数分类法描点选配法固定选配组数变动选配组数描点排序法固定排序组数变动排序组数描点比较评分法语义差异法传统的、间接的收集数据的方法。事先找出该产品(品牌)的特征(属性),例如:品质、价格、服务等。将每一种特征的一对相反形容词。设计为两极评分量表语义差异量表Q:您认为康师傅绿茶饮料给您的感受时?主观印象是?什么样的产品?a购买方便的1234567购买不方便的b有价值的1234567没价值的c流行的1234567过时的d中国风味的1234567异国风味的e合口味的1234567不合口味的f夏天的1234567冬天的g有营养的1234567缺乏营养的h昂贵的1234567便宜的i有益健康的1234567有害身体的j解渴的1234567不解渴的k家庭饮用的1234567户外饮用的l新鲜的1234567陈旧的m高级的1234567粗劣的n男性喝的1234567女性喝的依次询问康师傅、统一、娃哈哈、健力宝等语义差异量表调查时,被访者在两个形容词之间选出最能代表该品牌特征的评分。根据评分,计算出所有品牌在被访者心目中的距离。所有品牌间的距离可以利用欧几里德距离(Euclidendistance)公式求出:2112)(rkjkikijxxd其中:dij=品牌i与品牌j的距离Xik=品牌i在特征k上的评分Xjk=品牌j在特征k上的评分语义差异量表转换为差异矩阵品牌间的距离dij越大,表明品牌i与j之间的差异程度越大。品牌间的距离dij越小,表明品牌i与j之间的差异程度越大。D=(dij)构成差异矩阵。将所有被访者的差异矩阵平均,可得到总的差异矩阵。(aggregatedbranddissimilaritymatrix)配对比较法:二分法——三分法两类配对比较法也是较常用的数据收集方法。(1)二分配对比较法研究人员事先将n个品牌组成两两组成一对分别写在卡片上。调查时,被访者根据自己对品牌的理解(印象)先分成两组一组是相似品牌,一组是差异品牌。然后将每组相似(差异)程度排序。得到某个被访者的配对比较矩阵。Stimulipaircomparisonmatrix2)1(C2nnn配对数:二分法配对比较矩阵A可口可乐——B百事可乐A可口可乐——C非常可乐B百事可乐——C非常可乐B百事可乐——D芬皇可乐C非常可乐——D芬皇可乐D芬皇可乐——A可口可乐A-BA-CB-CB-DC-DD-AA-B0A-C10B-C100B-D0110C-D10110D-A110110某个被访者配对相似性评分(2)三分配对比较法与二分配对法大致相同。研究人员事先分成每组三种品牌。然后每组在分成三对品牌。被访者只须在每组中将三对牌子依相似性或差异性程度排列。得到某个被访者的配对比较矩阵。Stimulipaircomparisonmatrix6)2-)(1(C3nnnn分组数:46)2-4)(14(4C34三分法配对比较矩阵A-BA-CB-CB-DC-DD-A列和A-B0001001A-C1000102B-C1000113B-D0110103C-D1011014D-A1101104A可口可乐——B百事可乐2A可口可乐——C非常可乐1B百事可乐——C非常可乐3B百事可乐——D芬皇可乐3C非常可乐——D芬皇可乐2D芬皇可乐——A可口可乐1B百事可乐——A可口可乐2C非常可乐——D芬皇可乐3D芬皇可乐——A可口可乐1B百事可乐——C非常可乐3C非常可乐——D芬皇可乐1D芬皇可乐——A可口可乐21234请考虑各组内的三对品牌:1-最相似——3-最不相似矩阵对角线为0,I列一对品牌较j行一对品牌更相似=1,而列j行I元素=0。三分法配对比较矩阵将所有被访者的品牌配对比较矩阵加起来。计算列的总和,总合数越大,相似程度越高。再将每对品牌依列总和的大小排序,编号。列总和最大者序号=1,其次=2,以此类推。得到总和次序相似/差异矩阵。ABCDA0B60C520D1340主观分类法当品牌数目太多时,语义差异法问卷太长,配对比较法则品牌组合太多,使被访者不耐烦。采用固定群数分类法或者变动群数分类法。固定群数分类法研究者事先决定分类数。将每个品牌写在卡片上。指定每类中需分配的品牌群数。被访者按自己意见或标准将所有品牌分成不同类的群。类内品牌均十分相似,类间品牌有差异。被访者回答品牌矩阵加总。构造品牌频率矩阵(aggregatedstimulifrequencymatrix)矩阵D=(dij)n行n列矩阵n=品牌数dij=1:品牌i与品牌j分在同一类。dij=0:品牌i与品牌j分在不同类。变动群数分类法研究者事先决定分类数。将每个品牌写在卡片上。随意分配每类中品牌的群数。若群数大于预定数目时,重新按预定数目分配。被访者按自己意见或标准将所有品牌分成不同类的群。类内品牌均十分相似,类间品牌有差异。被访者回答品牌矩阵加总。构造品牌频率矩阵(aggregatedstimulifrequencymatrix)矩阵D=(dij)n行n列矩阵n=品牌数dij=1:品牌i与品牌j分在同一类。dij=0:品牌i与品牌j分在不同类。描点选配法——(1)固定选配数目几个品牌轮流作为比较对象,称为描点或轴心点。针对某个描点,从其它n-1个品牌选出k个与描点相似(差异)的品牌。K由研究人员事先设定。得到每个被访者相似或差异矩阵。加总矩阵后得到总和品牌频率矩阵。矩阵D=(dij)n行n列矩阵n=品牌数dij=1:品牌i与品牌j相似时。dij=0:品牌i与品牌j有差异时。描点选配法——(2)变动选配数目几个品牌轮流作为比较对象,称为描点或轴心点。针对某个描点,随意从其它n-1个品牌选出小于k个与描点相似(差异)的品牌。K由研究人员事先设定。选出数目大于k时,要求减少,重新分配。得到每个被访者相似或差异矩阵。加总矩阵后得到总和品牌频率矩阵。矩阵D=(dij)n行n列矩阵n=品牌数dij=1:品牌i与品牌j相似时。dij=0:品牌i与品牌j有差异时。描点排序法——(1)固定描点排序法几个品牌轮流作为比较对象,称为描点或轴心点。针对某个描点,从其它n-1个品牌选出k个与描点相似(差异)的品牌。K由研究人员事先设定。将选出的k个相似品牌排序,最相似排第一,其次排第二、依此类推。得到每个被访者相似或差异矩阵。将矩阵平均后得到总和品牌频率矩阵。矩阵D=(dij)n行n列矩阵n=品牌数dii=1:描点自身最相似。dij=2到(k+1),k个选出品牌。dij=(n+k+2)/2,n-k+1个未选品牌。描点排序法——(2)变动描点排序法几个品牌轮流作为比较对象,称为描点或轴心点。针对某个描点,从其它n-1个品牌选出少于k个与描点相似(差异)的品牌。K由研究人员事先设定。将选出的k个相似品牌排序,最相似排第一,其次排第二、依此类推。得到每个被访者相似或差异矩阵。将矩阵平均后得到总和品牌频率矩阵。矩阵D=(dij)n行n列矩阵n=品牌数dii=1:描点自身最相似。dij=2到(k+1),k个选出品牌。dij=(n+k+2)/2,n-k+1个未选品牌。描点比较评分法研究人员事先设计好等级量表。要求被访者将所有的品牌(自身除外)分别与描点品牌比较。给出评分。将所有被访者评分加总,然后再按评分大小排列。一对品牌评分大的在前列,得到相似矩阵。一对品牌评分小的在前列,得到差异矩阵。描点:可口可乐1345672与描点品牌完全相似与描点品牌完全相异相似——+——相异其它品牌:百事可乐非常可乐芬皇可乐评分