一、多选项分析一)问卷中多选项问题的分析多选项问题的分解通常有2中方法:1、多选项二分法(MultipleDichotomiesMethod);2、多选项分类法(MultipleCategoryMethod)。1、多选项二分法(MultipleDichotomiesMethod);多选项二分法是将多选项问题中的每个答案设为一个SPSS变量,每个变量只有0或1两个取值,分别表示选择个该答案和不选择该答案。按照多选项二分法可以将居民储蓄调查中村(取)款目的这个多选项问题分解为十一个问题,并设置十一个SPSS变量。2、多选项分类法(MultipleCategoryMethod)多选项分类法中,首先应估计多选项问题最多可能出现的答案个数;然后,为每个答案设置一个SPSS变量,变量取值为多选项问题中的可选答案。按照多选项分类法可将居民储蓄调查中存(取)款目的这个多选项问题分解成三个问题(通常给出的答案数不会超过三个),并设置三个SPSS变量。以上两种分解方法的选择考虑是否便于分析和是否丢失信息两个方面。多选项二分法分解问题存在较大的信息丢失,这种方式没有体现选项的顺序,如果问题存在顺序则适合采用分类法。同时注意自己需要的信息加以选择。二)多选项分析基本操作1、多选项分析的基本实现思路第一、按多选项二分法或多选项分类法将多选项问题分解成若干问题,并设置若干个SPSS变量。第二、采用多选项频数分析或多选项交叉分组下的频数分析数据。为了实现第二步,应首先定义多选项选择变量集,即将多选项问题分解并设置成多个变量后,指定这些为一个集合。定义多选项变量集是为了今后多选项频数分析和多选项交叉分组下的频数分析作准备。只有通过定义多选项变量集,SPSS才能确定应对哪些变量取相同值的个案数进行累加。2、定义多选项选择变量集的基本操作步骤1)选择菜单Analyze—MultipleResponse—DefinedSets,出现如下图所示的窗口。2)从数值型变量中见进入多选项变量集的变量选择到VariablesinSets框中。3)在VariablesAreCodedAS框中制定多选项变量集中的变量是按照哪种方法分解的。Dichotomies表示以多选项二分法分解,并在CountedValue中输入对那组织进行分析。SPSS规定等于该值的样本为一组,其余样本为另一组;Categories表示以多选项分类法分解,并在Range框中输入变量取值的最小值和最大值。4)为多选型变量集命名。系统会自动在该名字前加$。5)单击Add按钮将定义好的多选项变量集加到MultipleResponseSets框中。SPSS可以定义多个多选项变量集。3、多选项频数分析的基本操作步骤多选项变量集定义完成后,便可进行多选项频数分析了。1)选择菜单Analyze—MultipleResponse—Frequencies,出现如下图所示的窗口。2)从MultipleResponsesets中把待分析的多选项变量集选择到Tablesfor框中;3)制定是否处理缺失数据。SPSS规定只有样本在多选项变量集中的某一个变量上取缺失值,分析时就将该样本剔除。Excludedcaseslistwisewithindichotomies适用于多选项二分法;Excludedcaseslistwisewithincategories适用于多选项分类。生成如下所示的结果。4、多选项交叉分组下的频数分析的基本操作步骤1)选择菜单Analyze—MultipleResponse—Crosstabs,出现如下图所示的窗口。2)选择列联表的行变量并定义取值范围,或选择多选项变量集为行变量。3)选择列联表的列变量并定义取值范围,或选择多选项变量集为列变量。4)选择列联表的控制变量并定义取值范围,或选择多选项变量集为控制变量。5)单击Option按钮选择列联表的输出内容和计算方法,出现如下图所示的窗口。其中,在CellPercentages中选择单元格输出哪些百分比,Row为行百分比,Column为列百分比,Total为总百分比;在PercentageBasedOn框中制定如何计算百分比,Case表示分母为个案数,Responses表示分母为多选项应答数;MatchVariableAcrossResponseSets选项表示,入股哦历练表的行列变量均为多选项变量集时,第二个变量集的第一个变量与第二个变量集的第一个变量做交叉分组,第一个变量集的第二个变量与第二个变量集的第二个变量做交叉分组。以此类催。至此,SPSS将自动产生相应的交叉列联表。二、相关分析Pearson简单相关系数用来度量定距型变量间的线性相关关系。如测量收入和储蓄、身高等变量间的相关系数。Spearman等级相关系数用来度量定序变量间的线性相关关系。一)计算相关系数的基本操作1、选择菜单Analyze—Correlate—Bivariate,出现如下图所示的窗口。2、把参加计算相关系数的变量选到Variables框。3、在CorrelationCoefficient框中选择计算哪种相关系数。4、在TestofSignificant框中选择输出相关系数检验的双尾(Two-Tailed)概率p值或单尾(One-Tailed)概率p值。5、选中Flagsignificancecorrelations选项表示分析结果中除显示统计检验的概率p值以外,还输出星号标记,以表明变量间的相关性是否显著;不选中则不输出星号标记。6、在Options按钮中的Statistics选项中,选中Cross-productdeviationasandcovariances表示输出各变量的离差平方和、样本方差、两变量的叉积离差和协方差。至此,SPSS将自动计算相关系数和进行统计检验,并将结果显示到输出窗口。三、偏相关分析偏相关分析也称净相关分析,它在控制了其他变量影响的条件下分析两变量间的线性相关。操作步骤:1、选择菜单Analyze-Correlate-Partial,于是出现如下图所示的窗口。2、把参与分析的变量选择到Variables框中。3、选择一个或多个控制变量到Controllingfor框中。4、在TestofSignificance框中选择输出偏相关检验的双尾(Two-Tailed)概率p值或单位(One-Tailed)概率p值。5、在Options按钮中的Statistics选项中,选中Zero-orderCorrelations表示输出零阶偏相关系数。至此。SPSS将自动进行偏相关分析和统计检验,并将结果显示到输出窗口。四、相关分析一)线性回归分析的基本操作变量的的筛选问题第一、向前筛选策略。向前筛选策略是解释变量不断进入回归方程的过程。首先,选择与被解释变量具有最高线性相关系数的变量进入方程,并进行回归方程的各种检验;然后在剩余的变量中寻找与解释变量偏相关系数最高且通过检验的变量进入回归方程,并对新建立的回归方程进行各种检验的变量进入回归方程,并对新建立的回归方程进行各种检验;这个过程一直重复,直到再也没有可进入方程的变量为止。第二、向后筛选策略。向后筛选策略是变量不断剔除出回归方程的过程。首先,所有变量全部引入回归方程,并对回归方程进行各种检验;然后,在回归系数显著性检验不显著的一个或多个变量中,提出t检验值最小的变量,并重新建立回归方程和进行各种检验;如果新建回归方程中所有变量的回归系数检验都显著,则回归方程建立结束。否则按照上述方法再依次剔除最不显著的变量,直到再也没有可剔除的变量为止。第三、逐步筛选策略。是向前筛选和向后筛选策略的综合。逐步筛选法事在向前筛选策略的基础上,结合向后筛选策略,在每个变量进入方程后再次判断是否存在应该剔除出方程的变量。因此,逐步筛选策略在引入变量的每一个阶段都提供了再剔除不显著变量的机会。1、选择菜单Analyze-Regression-Linear,于是出现如下图所示的窗口。2、选择被解释变量进入Dependent框。3、选择一个或多个解释变量进入Independent框。4、在Method框中选择回归分析中解释变量的筛选策略。其中Enter表示所选变量强行进入回归方程,是SPSS默认的策略,通常用在一元线性回归分析中;Remove表示从回归方程中提出所选变量;Stepwise表示逐步回归筛选策略;Backward表示向后筛选策略;Forward表示向前筛选策略。5、第三和第四步中确定的解释变量及变量筛选策略可放置在不同的快(Block)中。以单击Next和Previous按钮设置多组解释变量和变量筛选策略并放置在不同的块中。SPSS将首先在当前块(默认为1)中按照指定的筛选策略选解释变量和建立回归方程,然后自动按照下一个块中指定的策略筛选解释变量,并在上个回归方程的基础上作进一步建模工作,直到结束。可见,第四步中的Remove策略只可能放在第二个以后的块中。块设置便于作各种探索性的回归分析。6、选择一个变量作为条件变量放到SelectionVariable框中,并单击Rule按钮给定一个判断条件。只有变量值满足给定条件的样本才参与线性回归分析。7、在CasesLabels框中指定哪个变量作为样本数据点的标志变量,该变量的值将表在回归分析的输出图形中。至此便完成了线性回归分析的基本操作,SPSS将根据制定自动进行回归分析,并将结果显示到输出窗口中。二)线性回归分析的其他操作SPSS线性回归分析还有很多其他选项。掌握这些选项对进一步深入分析和掌握更多有用信息是非常有益的。在上图中单击Statistics按钮,出现如下图所示的窗口。该窗口可供应户选择更多的输出统计量。1)Estimates:SPSS默认输出项,输出与回归系数相关的统计量。包括回归系数(偏回归系数)、回归系数标准误差、标准化回归系数、回归系数显著性检验的t统计量和概率p值,各解释变量的容忍度(判断是否存在共线性)。多元回归分析中在个解释变量量纲不一致时(即有的显示绝对数,有的是相对数例如百分比),如果希望比较各解释变量对被解释变量的影响程度的大小,可以采用标准化回归系数。2)ConfidenceIntervals:输出每个非标准化回归系数的95%置信区间。3)Descriptive:输出各解释变量和被解释变量的均值、标准差、相关系数矩阵及单侧检验概率p值。4)Modelfit:SPSS默认输出项,输出判定系数、调整的判定系数、回归方程的标准误差、回归方程显著Fjianyande方差分析表。5)Rsquaredchange:输出每个解释变量进入方程后引起的判定系数的变化量和F值的变化量(偏F统计量)。6)Partsandpartialcorrelation:输出方程中各解释变量与被解释变量之间的简单相关、偏相关系数和部分相关。7)Covariancematrx:输出方程中各解释变量间的相关系数、协方差以及各回归系数的方差。8)CollinearityDiagnostics:多重共线性分析,输出各个解释变量的容忍度、方差膨胀因子、特征值、条件指标、方差比例等。(容忍度的取值范围在0~1之间,越接近0表示多重共线性越强;越接近于1表示多重共线性越弱。)(方差膨胀因子VIF取值大于等于1,如果取值远远大于10则表示存在严重的多重共线性。)9)在Residual框中:Durbin-Waston表示输出DW检验值;CasewiseDiagnostic表示输出标准化残差绝对值大于等于3(SPSS默认值)的样本数据的相关信息,包括预测值、标准化预测值、残差、标准化残差、学生化残差、杠杆值、库克举例等的最大值、最小值、均值和标准差。