不同等级数利克特量表的适用性研究来自网络,作者:佚名1.引言量表是市场调查等领域常用的工具,常用的三种量表分别是瑟斯顿量表(Thurstonscale),利克特量表(Likertscale)和格特曼量表(Guttmanscale)。相对于瑟斯顿量表的严格编制要求和格特曼量表在实际中难以满足的条件,利克特量表易于编制而有同样满意的信度(Kapes,Mastie&Whitfield,1994)。利克特量表以一系列陈述开始,每一个陈述表达一种或明确赞成或明确不赞成的态度,项目根据测验过程中施测对象的回答而进行选择,被试要求对每一个陈述进行等级回答。由于利克特量表容易设计、构造简单且易于操作,可以用来测量其他一些量表所不能够测量的某些多维度的复杂概念或态度。因此使得利克特量表成为应用最为广泛的一种量表形式,在市场研究中也得到大量应用。如测量消费者对产品或服务的重视程度与满意程度;对测量个人生活状态、消费心理;测量消费者对品牌、广告等的心理感觉等。常见的利克特量表包括4点式、5点式、6点式和7点式,有时候也可以见到10点式。在量表实际的编制过程中,等级数的确定往往带有较大的随意性,对各种量表优劣势的认识也更多地停留在感性经验的基础之上。如果对上述的五种等级利克特量表进行划分,按照其相似程度大体可以分为三种,即最为常见的5点和7点可以作为奇数等级的代表,4点和6点可作为偶数等级的代表,而10点在某种程度上与前两类都不相同,可以作为多等级的代表。在定性思考的基础之上,研究者普遍认为这三类量表各自具有以下优劣势。作为奇数等级代表的5点和7点量表的应用最为广泛,因而是被访者较为熟悉的形式,在实际实施时不需进行过多的解释即可进行,但其缺点也是比较明显的。由于中国传统文化倡导“中庸”思想,被访者在填答时可能会出现“趋中反应”,即倾向于选择“一般”等中间选项,这一方面没有真实反映被访者的倾向性,另一方面可能还包含着“不确定/不一定”等意义,而这也是研究者不希望看到的结果。正是为了克服这种“趋中反应”,强迫被访者在回答时产生一定的倾向性,部分研究者开始尝试使用偶数等级的4点和6点量表,由于国外在评分时习惯采用四分制(差,一般,好,优秀),因而使用4点恰好可以符合其文化,但由于其等级数较少,在反应态度倾向时并不细致,因而并不是特别适合在我国使用。6点量表在正向和负向态度上各分了三个等级,既避免了趋中反应,在态度的区分方面也较为细致,因而受到了部分研究者的青睐和偏爱,但其缺陷时被访者对这类量表的接触较少,在实施时需要更多的解释。多等级的10点量表也较为常见,由于我国学校教育在评分时习惯采用百分制,因而当采用十分制时被访者能够较为容易地给出一个得分,但其缺点在于受到了我国的评分体制将60分列为及格线,被访者较少给出5分及以下的评价,这就使得整体得分偏高,因而不能客观地反应其态度。作为利克特量表的不同形式,以上各种量表都具有便于编制和操作的优点,但也都具有一定的缺陷,主要表现在被访者较少进行极端的评价,进而在一定程度上降低了各种量表的效用。上述判断大多是基于研究者的经验而总结出的,缺少在数据方面的支持。为此,也有部分来自不同领域的研究者采用定量的分析方法来探讨利克特量表的理想等级数。在心理计量学领域,以量表内部一致性为例,Symonds(1924)的研究表明当等级数为7至9时,计算的结果最好。“7点量表”也同样得到了Cicchetti(1995),Nunnally(1967),Finn(1972)等研究结果的支持;而Bending(1953)比较了3/5/7/9/11点量表后则认为,应该使用9点量表。然而另外一些研究者则认为内部一致性与量表等级数无关(Peabody,1962;Boote,1981;Widing&Coulter,1991;etc.)。ChristianJensen&JohnTøndering(2005)则在语言学领域比较了2点、4点和30点量表的结果,发现4点量表可以得到最好的结果,同时还发现量表等级数越多,被访者在判断时所花费的时间就越长,这一结果在前一领域内也得到了证明(Matell&Jacoby,1972)。因此,等级数的确定不光要考虑到其实际效果的问题,同时还需要与访问效率进行权衡。以上的量表研究几乎都是基于纸笔测验或者计算机测验的结果,此时消费者能够对需要选择的尺度同时有一个全面的理解。在市场研究中,电话调查作为一种常用的访问方式,被访者仅能够逐一听到选项,而无法象纸笔测验或者计算机测验一样看到选项,从而使被访者无法形成对选择所需要量表选项的全面的评估和全面的理解。此种不能够看到选择的访问方式可能会产生如下两个方面的影响,首先过于复杂的量表选项等级将影响选项的读出与理解,严重影响访问效率;其次被访者会根据语言习惯来回答,而无法完全按照问卷设计的尺度进行评估。所以在进行电话访问时,不同等级的李克特量表可能与纸笔或者其他面访有不同的影响。而目前心理学界和市场研究届缺少这方面的研究成果。2.问题提出与研究目的前人研究已为量表等级数的探讨打下了很好的基础,但还存在以下几个方面的问题:首先,囿于研究方法以及所比较的量表等级数不同,研究结果并没有取得完全的一致;其次,以往研究大多是国外研究者的结晶,由于各国文化的不同,其结论能否直接套用到我国还值得商榷。第三,缺乏对不能够看到选项的电话访问时所用量表等级数的研究结果;最后,目前对不同等级优劣势的探讨还停留在理论层面,没有系统性的研究结论对市场研究领域以操作指导。为了解决上述问题,本研究以某产品(手机)满意度研究为例,选择在我国比较常用的5点、6点、7点和10点量表进行测量。也同时考虑两种不同的访问方式:在线调查(能够看到选项)与CATI——计算机辅助电话访问(不能够看到选项)。为了比较四种量表的测量结果,本研究拟从以下几个方面来对此进行判断,试图探讨不同量表等级数对于研究结果的影响,分析不同等级量表的优劣势以及在不同访问方式中的适用程度,并为量表的改进方向提供建议。(1)四种量表在测量消费者对产品满意度上的一致性程度;(2)量表的信度、效度水平;(3)量表的鉴别度,量表显著性区分不同属性或产品满意度的能力。(4)量表的选项分布特征。3.研究方法3.1调查量表及测量设计本研究以手机满意度为研究内容,比较了四个量表的评价效果,整体问卷由三部分组成:表1问卷的结构分布第一部分:背景资料第二部分:满意度评价使用的手机品牌总体满意度 性别 家庭月收入 年龄使用量表单选分别使用不同等级量表内容 对9个属性的满意度进行评价:外观、功能、待机时间、游戏、价格、品牌、通话质量、操作容易程度、重量。在第二部分的满意度评价中,量表共分四个版本,分别为:五点量表,六点量表,七点量表,十点量表。除计分方式不同之外,四个版本间的题目完全一致。为了与常见的量表表现形式相匹配,将五点量表、六点量表和七点量表以选择题形式出现,并有文字对应;十点量表以打分的形式出现,无文字对应。具体形式如下:五点量表:1.非常不满意2.比较不满意3.一般4.比较满意5.非常满意六点量表:1.非常不满意2.不满意3.有些不满意4.有些满意5.满意6.非常满意七点量表:1.非常不满意2.不满意3.有些不满意4.一般5.有些满意6.满意7.非常满意十点量表:请用1到10的任何一个数字来表达您的意见,10分为满分,表示非常满意。本研究采用单因素的被访者间的随机区组设计,调查过程中在四个版本的量表中随机选择某一被访者所回答的量表形式,计算机辅助的随机样本分配较好地保证了四组间样本的同质性以及不同组别间被访者数量的一致性。3.2调查方法与样本调查数据在2006年1月1-20日收集。Online调查通过在线Panel(QTICK.com题客调查网)发布问卷获得,数据通过标准筛选程序去掉答题明显逻辑错误以及与Panel信息不符合的数据,CATI调查通过电话访问中心对全国18-55岁居民进行随机访问获得。CATI和Online调查范围均覆盖了一级、二级和三级城市。两个调查的对象是拥有并正在使用手机的消费者,有效问卷共计2193份,其中Online调查共得到808份有效样本,CATI共得到1385份有效样本。所有样本被随机分为四组,各组样本的基本背景资料见表2。表2样本背景比较调查方式指标总体五点量表六点量表七点量表十点量表方差检验p值样本量808191203191223个人月收入(元)221919892566212321870.11年龄(岁)28.1928.7628.0427.7828.180.69样本量1385367324364330个人月收入(元)165014171873180715160.28年龄(岁)33.9634.2333.7233.9433.910.96在线调查CATI通过对年龄和个人平均月收入进行方差检验发现,四组样本无明显差异,因而可以作为同质样本组,在量表的回答上可以相互比较。Online和CATI相比,前者被访者的年龄偏低,收入偏高,这可能是由于访问的方式所决定的,但这种差异目前还不是本研究的重点。4.结果分析与讨论4.1四种量表测量各因素满意度排序无显著差异以各产品因素的满意度进行比较为例,来研究四种量表的测量结果,如下为CATI访问结果。表3各属性的平均满意度及排序(CATI)五点量表六点量表七点量表十点量表(n=367)(n=324)(n=364)(n=330)均值排序均值排序均值排序均值排序1.外观3.6844.5845.0257.4742.功能3.5854.5254.9467.2863.待机时间3.3674.0684.3886.6984.游戏3.1493.9594.1995.9795.价格3.3184.2974.4776.9776.品牌3.7134.7325.328.0717.通话质量3.7814.6535.3717.9928.操作容易程度3.7424.7615.2237.9139.重量3.4964.4765.0447.2953.53±0.224.46±0.294.89±0.427.32±0.68由于四组样本的同质性,不同样本组的结果具有一定的可比性。表2展现了不同量表所得到的结果及其排序结果,因为利克特量表等级的不同,各产品因素的满意度得分差异较大,等级数越高,平均满意度得分越高,而且标准差越大。为方便比较,将结果根据各因素满意度评分的平均值与标准差进行标准化,如图1所示。各因素满意度的评分在具体的排名上存在着差异,但是品牌、通话质量、操作容易程度在任何一种量表中都是满意度最高的三个。利用利用肯德尔和谐系数(Kendallcoefficientofconcordance,又称肯德尔W系数)对排序结果的一致性进行了检验。W值为15.5=,差异并不显著。?图1标准化各因素满意度(CATI)对在线数据进行分析,也有同样的结果,各因素满意度得分因为量表等级不同而差异较大,但是各因素满意度得分的排序无显著差异。即说明,虽然利克特量表的等级不同,但是它们测量到的消费者对产品的满意度也保持相对的一致。4.2量表的信度、效度分析信度表示一个量表对于所衡量测量特质特征的稳定性和可信度程度,是衡量量表质量的重要指标之一。由表4可以看出,无论是CATI还是在线调查,十点量表的内部一致性信度均优于其他量表,其次是五点量表,再次是七点量表,而六点量表的信度水平最低。表4不同量表的内部一致性系数а比较五点量表六点量表七点量表十点量表CATI0.770.70.770.88在线调查0.830.750.810.86除量表的信度之外,效度是衡量量表质量的另一个重要指标。通过比较了其与推荐率以及再购买可能性这两个题目之间的相关情况,得到绩效关联效度(详见表5)。结果表明,在CATI访问中,六点量表的绩效关联效度较低;在在线调查中,不同等级量表的绩效关联效度相差不大。表5总体满意程度的绩效关联效度五点量表六点量表七点量表十点量表CATI推荐率0.690.490.610.57再购买可能性0.570.560.580.53在线调查推荐率0.700