第7章多选项分析在前面第4章我们已经接触了问卷调查,在问卷调查的问题中,有这样一类特殊的问题,它允许被调查者选择不止一个选项,这种问题被称为多选项问题。多选项问题是问卷调查中一项比较特别的技术,甚至在许多问卷中是必不可少的组成部分,它对于了解被调查者的对某个问题的次要选择或者平行选择有非常重要的作用。例如:我们看下面的问题:例7-1您选择您现在最常去的超市的主要原因(可多选三个或三个以内)1距离近2价格便宜3味道好(主要是面包,烤肠和串串等)4质量好5齐全6新品上货速度快7服务态度好8收银速度快在这个问题中,被调查者去超市可能有一个主要原因,比如4.质量好,但是可能不止一个原因,比如除了4.质量好以外,2.价格便宜也是一个原因,此时调查次要原因对于调查来说也是重要的;甚至有时被调查者自己都不确定在这些原因中究竟哪个是最重要的原因,此时这些原因就成为平行原因,应该把这些原因尽可能多的调查到。允许消费者选填多个选项是一种不错的选择,此时就可以将问题设置成多选项问题,便于我们更全面了解被调查者的情况。多选项问题在调查时便于我们了解全面的信息,但是如何在分析时将这些信息挖掘出来呢?利用传统的频数分析和描述统计对信息的挖掘是不完全的。假如我们针对上面的问题,由于可以有三个选择,我们对应设置3个问题,对三个问题分别统计。此时问题来了,不是每个被访者都选择三个问题,这将导致第2、3问题出现一些缺省数据,影响分析;另外,如果一个问题一个问题分析,也缺乏从整体上了解这个问题全貌的角度,对信息的提取是不充分的。有没有一种能同时克服这两个缺点的方法呢?回答是肯定的,那就是SPSS多选项分析。仔细研究多选项分析的备选答案,我们发现有些题的备选答案是有顺序的,例如:对多个品牌的了解就需要按照熟悉程度进行排序;而有些题的备选答案是没有顺序的,例如,上面举例的问题备选答案就是无序的。对这两类多选项问题进行分析时要注意各自特点,采取不同的编码处理。对应多选项问题,通常采用的方法都是:第一步、将多选项问题分解;第二步、由于多选项问题多是分类变量,即名义尺度变量,因此利用前面讲过频数分析和列联表分析可以得到分析结果。在SPSS中,将第一步称为多选项集的定义,将第二步称为多选项的分析。下面我们就从这两方面来介绍多选项分析。7.1多选项集的定义为什么要对多选项集进行定义?或者说为什么要对多选项集进行分解呢?这是因为我们利用SPSS处理问卷问题时,对于单选问题的处理是将该问题设置成一个变量,同时将每个备选答案进行编码,被访者选择哪个备选答案即将该答案对应的编码填入该问卷对应案例的相应变量位置,一格填写一个数值,便于存储和分析;但是处理多选项问题时,如果仍然将一个问题设置成一个变量,由于一份问卷可能选择不止一个答案,这时一格可能就需要填写两个以上的数值,对于这些数值SPSS不能区分,例如:格中填写23,SPSS会认为是23而不是2和3;如果人为加上间隔号,例如:格子中若填写2、3,SPSS会将其确认为字符型变量,不能支持分析。因此,如果一个多选项问题也设置成一个变量,在录入和数第7章多选项分析『2』据处理时都会非常不便。在SPSS中,通常的做法是将一个多选项问题分解成若干个单选问题,对应每个单选问题设置一个变量,这样一个多选项问题就对应多个SPSS问题,这样就便于数据录入、存储和分析了。7.1.1多选项二分法和多选项分类法及应用条件上面已经提到,根据多选项问题在SPSS中的处理,一个多选项问题对应多个SPSS变量,这样对一个多选项问题就可以转化为对多个SPSS变量的分析。可见,多选项问题的分解是非常重要的问题。这里需要解决两个问题:第一、多选项问题如何分解;第二、如何让计算机明白到底是哪几个变量对应与同一多选项问题,以便于在分析时同时分析。这两点都是通过多选项集的定义来完成的。多选项问题的分解主要有两种方法:多选项二分法(MultipleDichotomiesMethod)和多选项分类法(MultipleCategoryMethod)。对应这两种方法有不同的应用条件,SPSS变量也有不同的定义,下面我们分别对两种方法进行解释。1.多选项二分法(MultipleDichotomiesMethod)多选项二分法的是将多选项问题的每一个备选答案设置成一个0-1取值变量,如果被访者选择了该备选答案,则该变量取值为1,如果没有选择,则取值为0。由于每个变量都是等同的,因此每个备选答案之间是等同的,不存在答案之间的优先选择问题。例如:在上面的例题7-1,我们可以设置8个取值0-1的变量,例如第一个变量就是“超市距离近”,如果被访者选择了该备选答案,则此变量选1,否则取0,依此类推。从上面的定义中可以看出多选项二分法的特点:第一、它不需要事先确定被访者究竟会对问题有几个答案,从1个答案到8个答案全选它都能处理;第二、SPSS问题之间是平行关系,说明选项之间没有顺序。综上所述,多选项二分法主要的适合条件是不定项的选择,并且多选项问题选项之间不能有主次顺序。2.多选项分类法(MultipleCategoryMethod)多选项分类法中,首先估计多选项问题可能会出现的选项的个数;然后为每一个选择设置一个SPSS问题,被访者最多的选项数就是SPSS问题的个数,而每个问题的取值是所有的备选答案。例如:在上面的例题7-1中,由于要求被访者最多只能选3项,因此用多选项分类法只需设置3个SPSS变量,分别代表被访者的第1、2、3选项。从上面的定义也可以看出多选项分类法的特点:第一、在定项时它设置的SPSS变量较少;第二、它的变量设置可以体现出选项的顺序;第三、如果是不定项,它需要最多设置8个变量,变量个数和多选项二分法一样多,但是变量取值更复杂。综上所述,多选项分类法主要的适合条件是定项选择,或者多选项问题选项之间有主次顺序的。我们将两种分类方法的特点和适宜条件整理成表7-1,供读者参考。表7-1多选项二分法和分类法特点对比表特点多选项二分法多选项分类法需设置变量数等于备选答案的个数等于最多选项的个数变量的取值0-1取值取值为备选答案是否有序无序可以是有序,也可以是无序第二篇SPSS与统计基础统计分析适宜条件不定项选择、选项无序定项选择、选项可以无序或有序7.1.2多选项集定义在SPSS上的实现前面,我们已经完成了SPSS多选项问题的分解,根据多选项二分法或分类法对应多选项问题已经设置好了SPSS变量,现在还有一个重要的工作就是告诉SPSS哪些变量是为哪个多选项问题设置的,并且设置的方法是什么。这个都是通过我们的SPSS多选项集定义来完成的。严格来说,多选项集定义包含三个步骤:一、根据问题选择合适的多选项问题分解方法,二、定义多选项问题对应的SPSS变量,三、在SPSS中进行多选项集定义。下面我们仅讲第三点。下面我们通过一个例子来看多选项集的定义:例7-2有一组同学专门针对汶川地震后羌绣流入市场进行了市场调查,形成了调查数据1(见光盘7-1),问卷见光盘“羌绣市场调研.pdf”。我们摘录了部分多选项问题,请定义这些多选项问题的多选项集。多选项问题1:请问您在哪里接触过羌绣?1.汶川地震后的媒体宣传2.外出旅游3.市内的一些民族手工艺店铺4.家人、朋友提及5.其他多选项问题2:对于以下几种羌绣制品,您更倾向于哪种?(多选)1.生活用品2.工艺品、装饰品3.高端礼品、艺术品4.品牌附属品(与一些服装品牌结合)5.羌绣DIY(商家提供原料,自己绣制)6.羌绣个性服务(将喜欢的羌绣图案绣在指定物品上)7.其他多选项问题3:您更倾向于下列哪种场合购买羌绣商品(多选)1.羌绣时尚生活体验馆2.百货商场3.景区旅游纪念品专卖店4.手工艺品5.网络购物平台6.其他对于这个例子,我们可以看到几个多选项问题都是不定项选择,同时选项之间也没有顺序,因此,考虑采用多选项二分法进行问题分解,第1个多选项问题分解为6个问题,设置5个SPSS变量,同理第2、3个问题分别设置7、6个SPSS变量。变量按照二分法定义两个值,常用取值0-1,数据中用取值1-2也可以,下面就开始定义多选项集的操作:Step1:选择【Analyze】菜单→【MultipleResponse】菜单→【Definevariablesets】菜单在如图7-1的对话框中,主要有几个部分组成,左边的变量框中列出SPSS数据集文件中所有的变量,中间的VariablesinSet框中是多选项问题对应的SPSS变量,下面的VariablesAreCodedas单选框组是指定多选项问题的分解方法的,其中“Dichotomies”表示二分法,“Category”表示分类法;最下面的Name和Label文本框是用来指定多选项变量集的名称和变量名标签的。最右边的变量框MultipleResponseSets是用于放置定义好的多选项集的。Step2:选择多选项问题对应的SPSS变量因为变量Q201-Q205都是对应羌绣了解渠道这一多选项问题的,因此,将它们全部选入VariablesinSet框中,并在下面Name和Label文本框中,填写“ljqd”多选项集变量名和“了解羌绣的渠道”多选项集变量名标签。Step3:选择多选项问题分解方法,并进行相关设置1数据来源:西南财经大学2008年SPSS大赛第7章多选项分析『4』在VariablesAreCodedas单选框组中,选择二分法,后面要求填写用于计数的是哪个取值,通常情况下是1,但是本例中,变量定义取值为1、2,因此此处应该填写2。完成设置点击就可以定义好一个多选项变量集,在右边的窗口中,会出现“$ljqd”变量名,表示定义好一个多选项集。同时还可以利用和按钮对已经定义好的多选项集进行修改和删除。图7-1多选项变量集定义对话框照此处理,同样可定义多选项问题2和多选项问题3,具体操作作为习题留给读者完成。定义好多选项集后点击关闭多选项集定义对话框。7.2多选项分析本节中,将继续用到例7-1,我们将具体得到多选项频数分析和列联表分析与一般频数分析及列联表分析的差异,同时要求读者掌握多选项频数分析及列联表分析的SPSS操作流程。按照前面对多选项问题的分解和对应设置SPSS变量,从操作上是可以利用第3章所讲述的频数分析和列联表分析对多选项问题的单个变量进行分析,并且有时确实需要这样做。例如:采用多选项分类法设置SPSS问题时,选项如果是有主次顺序的,就需要对各变量进行一般频数分析,以了解被访者第一选择、第二选择、第三选择……中各备选选项所占比例,此比例的变化可能会带来一些有用的信息。但是是否仅仅这样就足够了呢?显然是不够的,因为我们还想了解在所有的被访者中,选择每个备选答案的被访者究竟有多大比例,这个结果仅仅分析一个SPSS变量是无法得出的,需要对该多选项问题的所有变量进行总体分析才能得到。或许有读者会问:如果多选项问题是无主次顺序的,我采用二分法定义多选项,对每个问题采用加总,不就可以得到选择每个备选答案的被访者的百分比了吗?不得不说,这是二分法的一个优点,而且也确实可以这样得到分类法所不能直接得到的被访者百分比构成。但是如果我们进一步还想了解在被访者所有的选择中(注意是所有选择而不是所有被访者,一个被访者可能有多个选择),各备选答案所占百分比,此时无论采用哪种问题分解方法,都需要在对全部问题整体分析的基础上才能得出了。因此,一般的频数分析对多选项问题的信息提取是不充分的,需要专门的工具来完成分析,这就是SPSS的多选项分析。在多选项分析中,可以获知两方面信息,一是被访者选择各备选答案的百分比,二SPSS变量区多选项问题分解方法区多选项变量名定义多选项变量区第二篇SPSS与统计基础统计分析是被访者所有选择中,各备选答案的百分比。下面我们就来看多选项分析的具体操作。7.2.1多选项频数分析在例7-1中,对于对选项问题1,我们想了解各备选答案在被访者中和被访者的选择中的比例,就需要用到多选项频数分析了,具体操作步骤为:Step1:选择【Analyze】菜单→【MultipleResponse】菜单→【Frequencie