SPSS150教案1

starseacow
1 ℃
2020-01-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1关于SPSS1．当今世界最流行的三大统计分析软件包：SPSS、SAS、BMDP2．SPSS公司其英文全称以前是StatisticalPackagefortheSocialScience，现在变为StatisticalProductandServiceSolutionsSPSS15.0的特点和优势3．可以同时打开多个数据文件4．提供了2种作图方法：新的交互式作图法＋原来的对话框作图。两种方法各有特点，但交互式作图法更直接、方便，认识SPSS1．数据窗口：系统按打开数据文件的顺序给个临时编号，例如[dataset2]2．变量窗口：类型为numeric的变量又分为三个测量层次，即nominal、ordinal、scale3．数据文件窗口菜单常用功能简介《Y》P15-184．输出文件窗口：（1）每执行一个需要记录的操作，系统会自动弹出一个记录操作过程的输出文件窗口，以供选择是否对该步操作进行记录。（一般只保存最重要的数据文件和输出结果文件，无需将所有的操作过程都保存下来。）（2）系统会按输出文件窗口弹出的顺序给个临时编号，例如[document3]（3）左侧的目录树与右侧具体输出结果的一一对应关系数据文件的建立1．变量的属性及设置（1）必须要自己设定的几个属性：变量名（Name）、变量类型（Type）、测量层次（Measurement）变量名（Name）必须以汉字或字母开头，且系统不区分大小写变量类型（Type）有若干：数值型（Numeric）、字符型（String，例如姓名类问题变量）、日期型（Date，例如出生年月类问题变量）等，本课程涉及最多的为数值型变量。（Y：展示各种类型的数据）测量层次（Measurement）分为三类：Nominal、Ordinal、Scale（2）其他属性可采用系统默认，例如默认的缺失值为空格《Y》P402．将问卷中的问题转换为数据文件中的变量（1）单选题：通常用题号本身作变量名（2）矩阵表格题：设计成可以属性不同的4个变量《Y》P42（3）多选题：设计成几个属性相同的变量，例如《Y》P433．数据的录入（Y：休闲调查）（1）用View菜单下的valuelabel命令来变换数据录入窗口中的显示——变量的取值/取值标签（2）查看变量的信息：用Utilities菜单下的Variables命令/通过变量窗口查看4．Excel数据文件的导入（T）在SPSS中先新建一个空白数据文档File－New－Data选好要导入的Excel文档File－Open－Data（注意该文档在Excel中不能是打开状态；且在导入前最好将该Excel文档中每个变量的取值性质统一，详见《Y》P47）接下来的对话框中系统默认的选项为Readvariablenamesfromthefirstrowofdata练习：将“考试成绩”Excel文件导入SPSS中保存为数据文件2数据文件的管理、处理与整理1．File菜单下的命令：新建、打开、保存、显示、预览、打印《Y》P24－282．Edit菜单下的命令：Undo、Redo、Paste、PasteVariables、Clear、InsertVariables、InsertCases、Find、GotoCase等《Y》P29练习：主要练习操作以上下划线部分的命令3．Data菜单下的命令：（1）IdentifyDuplicateCases《Y》P31《Z》P60－61如果某个案的信息的确被重复录入了，则删除T：用数据文件“数学和英语成绩”练习□Indicatorofprimarycases(1=uniqueorprimary,0=duplicate)功能有时用于开放式问题的归类整理，此时a）可以勾选□Sequentialcountofmatchingcaseineachgroup(0=nonmatchingcase)□Movematchingcasestothetopofthefileb）但不要勾选□Displayfrequenciesforcreatedvariables，否则输出的频数统计表容易误导理解T（用于开放式问题的归类整理）：询问被访者关于政府应该如何控制房价方面的意见或建议，从开放式答案中可以归纳出意见比较集中的几种措施，在数据文件中设置一个nominalscale的变量以便对该问题的答案进行归类和整理。注：我的笔记本电脑E盘中该位置上有问题，还是用U盘操作练习吧。（2）SortCases与findcase练习（Y：考试成绩）：先将Excel数据文件导入SPSS，再按“先数学，后语文”的多重变量排序（3）SelectCases《Y》P70－74（Y：考试成绩1）Selectcases中各选项间的关系为互斥，而非“在某选项操作的基础上可以再进行关于另一选项的操作”。使用Ifconditionissatisfied功能时：a）稍复杂一点的表达式软件是不认的；b）变量的Type必须设为Numeric（设为String则不能用此功能），Measure的设置无所谓。(4)WeighCases《Z》P55－56如果若干不同个案的信息确实完全相同，则只需录入一次，并且要另设一个表明该记录出现频数的变量Count，用于在数据分析前进行WeighCases（加权）过程。此后的数据分析均按此权重进行，除非再自行取消该加权功能。该功能选项框中Frequency（把哪个变量作为权重变量）一项要选Count，而非其他变量（T）：计算在不加权和加权两种情况下的英语均值（5）Transpose《Y》P75－76该功能适用环境：除了对变量进行分析外，有时也需要对个案进行分析。这种情况下，就需要把个案转换为变量。（T）：无论原始数据文件中是否有序号变量（编号），都可以做转置。又例：几个知名的电器卖场在各个电器品牌上的销量数据表可以用来做品牌的销量分析，通过转置也可以后对几个卖场分别的销售情况进行分析。（6）MergeFiles《Y》P55－67《Z》P68－71（T）填空选择纵向合并（Addcases）后的文件在变量上取的是两个数据文件变量的交集，而个案上取的却是两个数据文件3各自个案的简单相加（非交集或并集的关系）；而横向合并（Addvariables）后的文件（可以理解为）取的是两个数据文件变量的并集，但只将外部数据文件与当前（原）数据文件中名称不同的变量合并进来，对于两个文件中名称相同的变量，只把原文件中的同名变量保存下来，而舍弃外部文件中的该同名变量（即便两个同名变量的属性设置不同），而将其放置到excludevariables中。如果想避免简单执行Addvariables后的文件中变量与个案达不成匹配而是阴差阳错，可以按关键变量合并，但必须先将两个数据文件按关键变量排序在□Matchcasesonkeyvariables下，只有选择了○Bothfilesprovidecases项，才能选择□Indicatecasesourceasvariable[Source01]，则合并后的文件中该变量取值（0或1）表明：在当前数据文件（activedatafile）基础上新合并进来的变量在每个个案上的取值分别来自哪个数据文件（是来自activedatafile还是externaldatafile）以Non-activedataset为关键表时，合并后则当前文件中的个案将都被保留下来，外部文件中的新变量加入进来；以Activedataset为关键表时，合并后则外部文件中的个案将都被保留下来，当前文件中的新变量加入进来。练习（Y：考试成绩1＋考试成绩2）：按讲过的各种方式合并，并观察结果。（7）SplitFiles《Y》P68－70直接输出结果其实就是对数据文件进行分组（分割），随后的分析将对每个组分别进行在SplitFile对话框中需要选择文件的排序状态，永远选Sortfilebygroupingvariables不会错（即系统默认）；只有在进入分割程序前已经按分组变量（如果选择了多个分组变量，则是大组套小组的多层分组）的取值对文件进行排序的情况下，才可以选Fileisalreadysorted分组（分割）后的数据文件窗口右下角标有SplitFileon（T）：a.按班级分组，计算各组英语均分b.按性别分组，计算各组英语均分c.按先班级后性别的原则分组，计算各小组英语均分（8）Aggregate《Y》P76－81要进行分析前面的处理与SplitFiles相似，即按照某分类变量的取值对数据文件进行分组（分类），再对各组进行针对另一个变量的描述统计分析；后面的处理是将该分析结果保存为一个新的数据文件（分类变量的每个类别/组将成为一个个案），以便再进一步进行统计分析。BreakVariables（分类变量）和SummariesofVariables（汇总变量，通常为尺度变量）都要求是Numeric型典型实例：某年级有若干个班，将其中所有学生的考试成绩录入成为一个数据文件。要求：计算出每个班各科的平均成绩，并对这些班各科的平均成绩进行比较分析。有些问题的分析，用Aggregate或Splitfile后再DescriptiveStatistics两种方法都行；而对于有些问题而言，前者较后者适用范围更直接方便，只是输出为数据文件(.sav)而非后者的分析结果文件(.spo)，例如：a.解决（Y：贫困调查）中两城市出生在1930年－1940年间的贫困者占各自城市总贫困人口的比例问题，用aggregate功能则直接方便得多。b.解决（Y：贫困调查）中类似“两城市的贫困者中男女各自的人数”问题，用aggregate功能直接方便得多。具体操作：在BreakVariables中选择“城市”和“性别”两个分类变量（双重分组），在SummariesofVariables中什么都不选，勾选□Numberofcases即可SummariesofVariables下，如果想统计出分组的最终层次上（相对于多变量分组的情况）各组的频次，就勾选□Numberofcases确定汇总后数据文件的文件名：用Writeanewdatafile……选项下面的File按钮来实现OptionsforVeryLargeDatasets下选□Sortfilebeforeaggregating，因为一般数据文件都没有按指定的分组变量取值预先排好了顺序的练习（Y：考试成绩3）：4①《Y》P81②对各班男女生人数进行统计之后再比较分析（多层分组，既BreakVariables中所选为不只一个变量）③对各班男女生的数学平均分进行统计之后再比较分析（多层分组）4．Transform菜单下的命令：RankCases《Y》P51－55（Y：考试成绩1）一般在Ties对话框里选Sequentialrankstouniquevalues的多单变量的描述统计分析(Analyze—DescriptiveStatistics)1．频数分析－Frequencies《Y》P99－103更多用于离散型数据，即定类（Nominal）和定序（Ordinal）变量的统计描述练习（Y：休闲调查1）：对文化程度、职业状况、读书1、读书2进行频数分析并输出图形2．描述统计－Descriptives《Y》P104－105更多用于尺度变量（定距Interval和定比Rational）的统计描述练习（Y：休闲调查1）：对年龄、家庭月收入、住房面积进行描述统计均值分析输出结果1．均值分析包括4方面内容：单样本均值检验，独立样本均值检验，配对样本均值检验，方差分析。2．单样本T检验（OneSampleTTest）《Y》P121－123（1）基本思想：先根据经验或以往的调查结果对总体均值提出一个假设（即μ＝μ0），然后用计算出来的样本均值X检验一下：总体均值是否为μ0？（2）大样本可以用Z（为近似）检验或t检验（更精确）都可以；但小样本只能用t检验。后者的小样本检验需要满足两个前提：总体服从正态分布总体方差未知（3）实例详解，见《Y》