Spss整理最终版

lion6766
1 ℃
2020-01-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

SPSS第一章概述1、统计信息的含义和特点（1）含义：统计信息是以数字、文字、图形、报告、声音、图像等形式为载体，运用科学的手段，经过一系列统计工作活动取得的有关统计对象的状态、结构、功能及其发展变化规律的客观描述，是经过统计加工处理、具有价值、对客观对象产生影响的统计数据。简言之，统计信息是经过分析加工后的有实用意义、有价值的统计数据。（2）特点：数量性社会性、客观性、时效性、共享性、再生性、法律性2、计算技术的发展对统计分析领域带来什么影响，硬件\软件现代统计分析是以计算机为支撑的，因此计算机硬、软件的发展，尤其是软件的日新月异，使现代统计分析功能日益增强，应用日益广泛。目前计算机硬件和软件正以空前的速度发展，现代统计分析是直接收益的领域之一，这表现在下面几方面：1.能分析的数据规模愈来愈大2.分析速度愈来愈快3.分析软件不断优化4.操作简单，易学易用第二章SPSS概述3、SPSS主要文件类型，每种文件类型对应的扩展名4、数据窗口两个界面，每个界面的功能（1）DataView界面用户进行数据输入、数据编辑、数据文件整理的界面（2）VariableView界面用户定义数据文件的变量界面5、变量界面从哪几个方面定义通过数据编辑窗的VariableView界面来定义。1。变量名（Name）2。变量类型（Type）3。变量长度（Width）4。小数位数（Decimals）5。变量名标签（Label）6。变量值标签（Values）7。缺失值定义（Missing）8.变量列宽（Column）9。数值对齐方式（Align）10。变量特性的测量尺度（Measure）（1）比例尺度（Scale）（2）定序尺度（Ordinal）（3）定类尺度（Nominal）6、SPSS的运行管理模式（1）全屏幕窗口菜单运行方式（2）程序运行方式（3）混合运行方式7、什么是缺失值（漏填值），作用是？（1）指在收集数据过程中的无记录或失真数据。对于无记录数据，SPSS默认为系统缺失值，如果是string型变量其值为空格，单元格显示为空；如果是数值型变量的其值为零，在其单元格显示一个圆点。（2）为了排除这些个案，使得结果更加真实8、什么是文件拆分由于统计分析的需要，有时需要对数据文件进行多层次的划分，分成若干个样品组，对每组进行统计分析或制作统计图形。9、什么是分组聚合对数据文件中所有的样品按指定变量或者变量组进行分组汇总，得到每个样本组的描述统计量，如均值、最大值、最小值等。10、文件合并的方式（两种）横向+纵向将外部文件的数据合并到当前数据文件中，合并方法有两种：（1）纵向合并（AddCases）指从外部文件中增加样本到当前数据文件中（2）横向合并（AddVariables）指从外部文件增加变量到当前数据文件，进行合并的前提是两个文件存在至少一个共有的关键变量，并有一些样本在关键变量上的值相等。11、什么是加权，什么情况下加权处理该命令可对当前数据文件中的个案赋予不同的权数。但一个数据文件只能设立一个加权变量，且该变量是取值为正数的数值型变量。12、选择个案有哪几种方式（1）选择所有样品（2）条件抽样（3）随机抽样（4）基于样本编号的范围抽样（5）使用过滤变量第三章单变量描述统计分析13、描述统计分析有哪几个过程（1）频数分析过程Frequencies…（2）描述统计过程Descriptives…（3）探索性描述统计过程Explore…（4）互联表统计分析过程Crosstable…14、探索性数据分析从哪几个方面分析探索性数据分析是对数据进行初步考察，由描述统计指标和直观的图形组成。包括检查数据的错误、描述数据的数量特征和分布特征、奇异值的辨认等。第四章几种常见的概率分布15、PDFIDFCDF三种函数意义（重点正态分布二项分布）Pdf为x取某一值的概率即P（x=k）,cdf为x从负无穷到某值的累计概率，idf是cdf的反函数，求P（xk）=p的分点k.二项分布：BINOM（q,n,p）q为变量x,n为试验次数，p为每次成功概率；正态分布：NORMAL（q,mean,stddev）q为变量x,mean为分布均值，stddev为分布的标准差；在离散变量概率分布中，数学表达式有以下几种情况：（1）若求P（x=k）时，其数学表达式为：CDF.BINOM（k,n,p）-CDF.BINOM（k-1,n,p）;（2）若求P（x=k）时，其数学表达式为：CDF.BINOM（k,n,p）;（3）若求P（x=k）时，其数学表达式为：1-CDF.BINOM（k-1,n,p）（4）若求P（xk）时，其数学表达式为：CDF.BINOM（k-1,n,p）（5）若求P（xk）时，其数学表达式为：1-CDF.BINOM（k,n,p）在连续变量概率中，数学表达式有以下几种情况：（1）若求P（x=k）或P（xk）时，其数学表达式为：CDF.NORMAL(k,ů,б)（2）若求P（x=k），P（xk）时，其数学表达式为：1-CDF.NORMAL(k,ů,б)第六章假设检验16、假设检验P值检验法P值法指在零假设正确的前提下，样本可能结果不低于实际观测值（右尾检验）或不高于实际观测值（左尾检验）的概率。P值说明（a=0.05）小于0.010.01~0.05大于0.05具有高度统计显著性，非常强的证据拒绝零假设具有统计显著性，适当的证据可拒绝零假设较不充分的证据拒绝零假设17、假设检验包括哪几种T检验3种？（1）单样本T检验（One-SampleTTest）过程主要是用于对单个总体均值的假设检验（2）独立样本T检验（Independent-SamplesTTest）过程主要是运用两个独立样本原始资料对两个总体均值之差进行假设检验。（3）相依样本T检验（Paired-SamplesTTest）过程主要是运用配对样本资料对两个总体均值之差进行假设检验18、独立样本、配对样本T检验各自对数据文本结构要求有什么不同？独立样本t检验，将两个待检验变量输入在同一列中，并新增一个分组变量以区分两个变量；配对样本t检验，两个待检验变量要求分两列一次输入，要求一一对应，没有分组变量。第七章非参数检验19、拟合、二项、游程检验的概念拟合优度检验（Chi-Square)是检验单样本的数据观测次数与期望次数之间是否存在显著差异。二项分布检验从样本观测到的某类事件的比率是否与期望的总体中的比率有显著性差异。游程检验是根据游程数来检验样本资料的随机性。第九章方差分析20、什么是方差分析，有哪几个前提条件，为什么做均值多重比较？（重点掌握单因素方差分析和没有交互作用的双因素方差分析）（1）方差分析（ANOVA）是一种通过分析样本资料各项差异的来源以检验三个或三个以上总体平均数是否相等或是否具有显著差异的方法。（2）进行方差分析的前提条件：1。被检验的各总体服从正态分布；2。各总体的方差皆相等；3。从各总体中抽取的样本是随机且独立（3）总离差平方和=组间平方和+组内平方和，做均值多重比较是为了进一步深入总体均值间显著性检验。单因素方差分析：考虑一个因素A取k个水平，分析这k个不同水平对所考察的指标y的影响，即在试验中只有A一种因素改变，而其它因素控制不变，这样的试验叫单因素试验，所进行的方差分析叫单因素试验的方差分析。没有交互作用的双因素方差分析:该过程即为单因变量多因素方差分析过程，主要是双因素方差分析过程。怎么做均值的多种比较：看P值，看均值与标准差成不成比例，不成比例，表示各个格子方差齐同。第十章相关与回归1、两变量相关分析哪几种方法（1）Pearson皮尔逊积矩相关系数隐含定义，连续变量选该方法；（2）Kendall’s肯德尔和谐系数有序变量选该方法；（3）spearman斯皮尔曼等级相关系数2、什么是偏相关是研究两个变量之间关系时控制可能对其产生影响的其他变量，只分析这两个变量之间相关程度的过程。3、线性回归分析过程，根据结果内容得出结论课本p1804、F检验、T检验的目的1)F检验：检验整个方程的显著性，即对回归模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。2)T检验：检验系数的显著性，即对模型中被解释变量与某个解释变量之间的线性关系是否显著成立作出推断。结论：线性回归方程第十一章聚类分析1、聚类分析种类根据分类对象的不同分为：Q型聚类，也叫样品（Case）聚类，是对样品进行分类处理。R型聚类，也叫变量（Variable）聚类，是以变量为单位进行聚类。2、分层聚类分析、快速聚类分析有什么不同分层聚类分析，也叫系统聚类分析：开始把参与聚类的每个样品（或变量）各视为一类，然后根据两类之间的距离或相似性逐步合并，直到所有的样品（或变量）合并为一个大类为止。快速样本聚类分析，也称逐步聚类或动态聚类：开始按照一定方法选取一批凝聚点（聚心），其次让样品向最近的凝聚点凝聚，形成初始分类，然后按最近距离原则修改不合理的分类，直到合理为止。同分层聚类相比，该方法在计算机处理过程中，不需要存储距离矩阵，因而计算机工作量小，占据的存储空间小，也不会因为计算机硬件的限制使得分析过程漫长而无法进行，因此适合大样本文件的Q型聚类分析。3、距离、相似系数什么含义研究样品（或变量）亲疏关系的数量指标有两个：距离是指离得多远的测量，通常将每一个物品看成m维（变量的个数）空间中的一个点，在这m维空间定义点与点之间的距离，距离较近的点归为同一类，距离较远的点归入不同的类。相似系数，是指两个事物离得多近的测量，性质越接近的样品，他们之间的相似系数越接近1（或-1），而彼此无关的样品，他们之间的相似系数越接近于零。在进行聚类处理时，将比较相似的样品归为一类，不怎么相似的样品归为不同的类。第十二章判别分析1、判别分析含义判别分析是多元统计分析中用于判别样品所属类别的一种方法，它与聚类分析相同的是将相似的事物归为一类，不同处在于聚类分析预先不知道分类，而判别分析实在研究对象分类已知的情况下，根据样本数据推导出一个或一组判别函数，同时指定一种判别规则，用于确定待判别样本的所属类别，使错判率最小。2、典则判别函数、线性判别函数值在判别分析中各起什么作用SPSS的判别分析过程，对于分为k组的研究对象，可建立k-1个典则判别函数和k个Fisher线性判别函数，然后将各样品的自变量值回代到判别函数中，计算其判别函数或属于各组的概率，根据数值的大小判别样品所属类别，对比样品分原始组别给出错分率。第十三章主成分分析和因子分析特征根1，方差贡献率(累计方差贡献率大于80%)怎样从因子矩阵得到主成分的表达式各主成分上的载荷值分别除以相应主成分的特征值的平方根Blabla会看结果，分析计算结果