spss学习第10章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章SPSS在调查问卷数据处理的应用1、使用目的调查问卷收集以后,需要先对调查问卷的结果进行一些整理,如对文字型的问题进行事前或事后编码,按变量分组、合并、加权、重新定义或计算新变量等,为最终的统计分析做准备。这些功能集中在数据和转换菜单项中,下面将以了解高校毕业生就业意愿情况进行调查而获得的一份问卷为例,介绍一些常用的功能。10.1调查问卷数据处理概述10.1.1数据整理与转换您的性别:■男□B女您所学专业名称:年级:1.你在班级里的学习成绩排名:■前10%□11%—30%□31%—70%□最后30%2.您参加了今年的考研:□参加了■未参加(跳答一题)3.您参加考研是否有本科毕业就业难方面的原因:□主要是□有一些□没有4.本科毕业以后您选择■参加工作□考研□边工作边考研□到国外□自主创业□暂时什么都不做数据整理与转换5.您一般通过哪些途径获取招聘信息?■招聘会■互联网■同学、朋友、熟人■报刊杂志□职介机构□其他6.对您而言,选择职业时哪些因素影响较大(请选三项并排序):1单位类型及规模□就业地区选择□工资水平及福利2有利于个人发展及晋升3对工作本身的兴趣工作稳定性□工作的环境及舒适性□父母意见□学校老师影响□其他7.您求职要求的工资底线2000元。8.你认为最理想的签约时间是大四第一学期末。2、基本原理⑴单项选择题的编码⑵多项选择题的编码⑶排序题的编码⑷开放式问题的编码⑸缺失值的编码⑹“不适用情况”的编码⑺数据转换3、其他注意事项用户缺失值与系统缺失值的含义不同。系统缺失值主要是指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为“·”,而用户界定的缺失值则不会在数据显示时出现“·”。问卷调查数据的整理与转换的操作主要由以下几个模块来实现。(1)【转换→计算变量】对原始数据进行四则运算等,进而派生出新的变量。(2)【转换→重新编码为相同变量】和【转换→重新编码为不同变量】,重新编码数据,重新安排次序。(3)【转换→对个案内的值计数】,创建一个新变量用以计算某些变量共同发生的频次(即计数)。10.1.2调查问卷数据的SPSS操作详解缺失值的类型:完全随机缺失;随机缺失;完全非随机缺失缺失值的处理方法:删除法和插补法10.2调查问卷缺失值处理问题10.2.1缺失值的类型与处理方法第一步:打开【替换缺失值】对话框选择菜单栏中的【转换】→【替换缺失值】命令,弹出【替换缺失值】对话框.10.2.2替换缺失值的SPSS操作详解第二步:选择检验变量在该对话框左侧的候选变量列表框中选择一个或几个变量,将其移入【新变量】列表框中,这时系统自动产生用于替代缺失值的新变量,用户也可在【名称】框处自己定义替代缺失值的新变量名。第三步:选择替换缺失值的方法在【方法】下拉下箭头选择缺失值的替代方式。●连续平均值:用该变量的所有非缺失值的均数做替代。●附近点的平均值:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义。●附近点的中间值:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义。●线性插值:线性插值法填补缺失值。用该列数据缺失值前一个数据和后一个数据建立插值直线,然后用缺失点在线性插值函数的函数值填充该缺失值。●点的线性趋势:缺失点处的线性趋势法。应用缺失值所在的整个序列建立线性回归方程,然后用该回归方程在缺失点的预测值填充缺失值第四步:其他选项设置当选择的替换缺失值的方法为【临界点的均值】或【临界点的中位数】时,选项【临界点的跨度】处于激活状态,可以选择取相邻点的跨度。第五步:单击【确定】按钮,结束操作,SPSS软件自动输出结果。如果分析中没有用到含缺失值的变量,可以不用关心缺失值问题。在SPSS相关的分析过程中,选择按对排除个案(P),这时如果没有用到含缺失值的变量,缺失值对分析没有影响;如果选择按列表排除个案(L),含有缺失值的个案将不会用于分析,可能会造成信息损失。1.实例内容就业意愿描述的是大学生寻找工作之前的设想,这种设想与现实的匹配程度会影响其能否实现就业。为了深入了解毕业生的就业意向,了解大学生的就业意向和将来的就业形势,为进一步完善毕业生就业工作提供导向和决策依据,进行了毕业生就业意愿调查。假设有一个由17名毕业生的调查问卷组成的简单随机样本,其中对于工资底线这一题的回答存在缺失,要求对这些进行缺失值替换。10.2.3实例图文分析:高校毕业生就业意愿调查第一步:打开对话框打开SPSS软件,选择菜单栏中的【转换】→【替换缺失值】命令,弹出如下图所示的对话框。实例操作第二步:在左侧的候选变量列表框中选择“工资底线”变量进入【新变量】列表框,这时系统自动产生用于替代缺失值的新变量,用户也可在名称框处自己定义替代缺失值的新变量名。在【方法】下拉列表框中选择替换方法【临界点的均值】,并在【临界点的跨度】文本框中输入“4”注意:进行缺失值替换时,只能对数字型变量进行缺失值替换。第三步:完成操作最后,单击【确定】按钮,操作完成。此时,原数据文件新增加了“income1”变量。第一步:打开【缺失值分析】对话框选择菜单栏中的【分析】→【缺失值分析】命令,弹出【缺失值分析】对话框。10.2.2缺失值分析的SPSS操作详解第二步:选择检验变量在该对话框左侧的候选变量列表框中选择一个或几个变量,将其移入【定量变量】或【分类变量】列表框中。定量变量是选择进入缺失值分析的变量。第三步:选择缺失值估计的方法在【估计】列表框中选择缺失值的处理,从而对参数进行方式。●按列表:分析时按列表排除个案,将缺失值排除在外,从而对变量进行分析。●成对:按配对的方式对缺失值进行分析。●EM:用ExpectationtMaxiumum方法对缺失值进行修补。●回归:用线性回归的方法对对缺失值进行修补。第四步:其他选项设置【模式】包含输出的模式、变量缺失的模式等五个部分。(1)输出。●按照缺失值分组的表格模式。●按照缺失值排序的个案模式。●按照选定变量指定顺序的所有个案。(2)变量●缺失模式。(3)附加信息。(4)排序依据。(5)排序顺序。●升序●降序【描述】主要对单变量统计量和指示变量统计量、忽略缺失值占总个案数的比例三部分。(1)单变量统计量。(2)指示变量统计量。●百分比不匹配。●使用有指示变量形成的分;组进行的T检验。●为分类变量和指示变量生成交叉表。(3)忽略缺失值占总个案数的比例小于的变量。第五步:单击【确定】按钮,结束操作,SPSS软件自动输出结果。相关系数为-0.4的二维正态随机变量的2000个观测值,其边缘分布分别为均值为0.2,标准差为0.2的正态随机变量w1,和均值为0.3,标准差为0.1的正态随机变量w2,随机删除变量w1中的3%数据,随机删除变量w2中的5%数据,现在进行缺失值分析。10.2.5实例图文分析:二维正态随机数的缺失分析实例内容实例操作第一步:打开对话框打开SPSS软件,选择菜单栏中的【分析】→【缺失值分析】命令,弹出对话框。第二步:在左侧的候选变量列表框中选择“w1”、“w2”变量进入【定量变量】列表框,在【估计】选项组中选择【成对】复选框。第三步:完成操作最后,单击【确定】按钮,操作完成。此时,软件输出结果出现在结果浏览窗口中。(1)单变量的基本统计信息汇总表执行完上面操作后,在SPSS结果报告中首先给出的是两个变量的基本统计分析,见表10-3所示。变量w1数据个数为1940,缺失60个数据,缺失的百分比为3%,样本均值为0.20,标准差为0.19,比Q1-1.5*IQR小的数据有5个,比Q3+1.5*IQR大的数据有8个;N均值标准差缺失极值数目a计数百分比低高w11940.20055337.198140912603.058w21900.30283098.0983910531005.034超出范围(Q1-1.5*IQR,Q3+1.5*IQR).3实例结果及分析(2)配对分析结果①两变量配对的频数这里,变量w1数据个数为1940,变量w2数据个数为1900,变量w1和变量w2的配对数据个数为1842。w1w2w11940w218421900②两变量配对的均值这里,变量w1的样本均值是0.20,变量w2的样本均值为0.30,变量w1的1940个数据在变量w2都不缺失的情况下的均值为0.20028339,变量w2的1900个数据在变量w1都不缺失的情况下的均值为0.30283098。w1w2w1.20055337.30266749w2.20028339.30283098存在其他变量时定量变量的均值.③两变量配对的样本标准差这里,变量w1的样本标准差是0.198140912,变量w2的样本标准差为0.098391053,变量w1的1940个数据在变量w2都不缺失的情况下的均值为0.199486851,变量w2的1900个数据在变量w1都不缺失的情况下的均值为0.098391053w1w2w1.198140912.098699395w2.199486851.098391053存在其他变量时定量变量的标准差.(4)两变量配对的样本协方差这里,变量w1的样本方差是0.039259821,变量w2的样本方差0.009680799,配对的变量w1与变量w2的样本协方差为-0.007154109。w1w2w1.039259821w2-.007154109.009680799(5)两变量配对的样本相关系数配对的变量w1与变量w2的样本协方差为-0.363。w1w2w11w2-.36311、使用目的为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度分析是评价调查问卷是否具有稳定性和可靠性的有效的分析方法。10.3调查问卷的信度分析10.3.1信度分析概述2、基本原理重测信度法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数,适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异。重测信度法属于稳定系数。复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般适用于态度、意见式问卷的信度分析。克朗巴哈信度系数法是评价的量表中各题的得分之间一致性的,属于内在一致性系数。这种方法适用于态度、意见式问卷的信度分析,是目前最常用的信度系数,其公式为:其中,为调查问卷中题项的总数,为个项目相关系数的均值。1(1)krkr信度分析概述第一步:打开【可靠性分析】对话框选择菜单栏中的【分析】→【度量】→【可靠性分析】命令,弹出【可靠性分析】对话框。第二步:选择信度分析变量在该对话框左侧的候选变量列表框中选择一个或几个变量,将其移入【项】列表框中,选择进入信度分析的变量。【度量标签】主要对信度分析的信度系数做一个标签。10.3.2信度分析的SPSS操作详解第三步:选择信度分析的方法在【模型】下拉列表框中选择信度分析的信度系数,从而对变量进行信度分析。●a:克朗巴哈(Cronbach)信度系数法。●半分:折半信度系数。●Guttmann:Guttman最低下限真实信度法。●平行:各题目变异数同质时的最大概率信度。●严格平行:各题目平均数与变异数均同质时的最大概率信度。第四步:其他选项设置【统计量】包含Hotelling的T平方检验,同类相关系数检验、Tukey的可加性检验等统计分析。●描述性:项表示输出各评估项目的基本描述性统计,度量表示输出各评估项目的总分的基本描述性统计,如果项已删除则进行度量表示输出剔除某评项目后的均值、方差、协方差等基本统计量,从而对评估项目进行逐个评估。●【项之间】选项组:相关性、协方差分别表示输出各评估项目的协方差系数矩阵和相关系数矩阵。●【摘要:均值】选项组:输出评估项目总分

1 / 81
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功