浙江工商大学spss复习资料

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

专题一基础统计二、数据分析题1.情商对职业发展的影响分析。统计方法框架:(背默一下)测量型:定距、定比非测量型:定类、定序标准误=S是标准差平均数标准误=D(样本在多大程度上反映整体)1、数据的分布特征正态分布检验:正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。方差齐性检验:Levene【检验各组方差是否相等】统计意义下,方差不齐不能检验0.05反对原假设,有显著差异;0.05支持原假设,没有显著差异;均值比较及检验过程:1、Means过程2、T-test过程(1)单一变量T检验(变量均值VS常数)(2)独立样本T检验(男女平均收入是否相同?两组不相关样本是否来自具有相同均值的总体)(3)配对样本T检验(前后对比——如训练效果、治疗效果等,两组相关样本是否来自具有相同均值的总体)3、单因素方差分析一元(单因素)方差分析:检验几个(三个或三个以上)独立的组,是否来自均值相同的总体。4、相关分析5、多元线性回归【R指模型拟合优度,R2越大,效果越好,自变量对因变量的解释度越高;常数项为0(sig)0.05),看标准化的结果;常数项不为0(sig0.05),看非标准化的结果;原假设系数等于0,不显著(小概率事件)可进行回归;和相关系数殊途同归】6、因子分析H0:相关矩阵构成的是单位矩阵【降维-因子分析】KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.858Bartlett的球形度检验近似卡方213.217df10Sig..000KMO值越接近1,越适合做因子分析(0.7)。Bartlett的球形度检验的显著性水平=0.000<0.05,拒绝原假设,说明变量之间的相关系数矩阵不是单位阵,变量之间存在相关关系,可以进行因子分析。如果两个变量高相关,它们会出现在同一个因子里。公因子方差初始提取网络零售额1.000.864网络交易额1.000.964每百人网商数量1.000.923每百人网络消费者数量1.000.975网络零售额与社零占比1.000.982提取方法:主成份分析。“初始”表示的是所有变量均作为公共因子时的共同度,所有数值均为1。“提取”表示的是最终提取的所有公共因子中,每个初始变量能被解释的比例。这些变量共同度均高于0.8,是比较理想的状态。旋转成份矩阵a成份123网络零售额.461.641.492网络交易额.307.880.308每百人网商数量.675.448.516每百人网络消费者数量.907.295.256网络零售额与社零占比.307.347.876提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在4次迭代后收敛。通过因子旋转,载荷大小进一步分化。所以网络零售额和网络交易额可归于一类;每百人网商数量和每百人网络消费者数量可归为一类;网络销售额与社零占比为一类。7、Partial-偏相关分析(控制变量)计算两个变量在控制了其他变量影响下的相关关系研究两个变量之间线性关系时控制可能对其产生影响的变量Distance-距离相关,对变量或观测量进行相似性或不相似测度r越接近1,相关性越大H0通常的可能性:均值相等、方差相等、系数为0发生大概率事件(0.05)不存在显著差异,支持原假设发生小概率事件(0.05)存在显著差异,拒绝原假设老师课堂上问的问题和我的作业心得:1、为什么从方差分析结果表中的Lower和Upper也能看出显著2、调整的R2是怎么来的3、均值和相关没有任何关系;当两个变量高相关,因子分析是其极可能被并作一个因子配对样本t检验里面的t:标准化系数与残差的比值就是t值df:df是自由度的意思,指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的自变量的个数。它是意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。标准差:一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值;标准误:样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。还需要特别指出的是,标准误还可以指样本标准差、方差等统计量的标准差,不仅仅只是样本均数的标准差。单因素ANOVA分析里的方差齐性检验和组间分析分别是:方差齐性看数据是否来自相同特征的样本;组间分析初步看各分组的差异。齐性看LSD,非齐性看Tamhane。模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-1629.064321.231-5.071.000消费品零售总额1.094.045.96224.392.0002(常量)-1212.320359.540-3.372.002消费品零售总额.773.149.6805.202.000工业总产值.066.029.2952.255.029a.因变量:进出口额回归里,r是用来描述x和y的线性相关度的,R2为正定系数,表示y被x所解释的程度。F值是可以查临界值表的,一般情况下,F值都比较大。F值检验的是模型的整体显著性;t值检验的是某个参数的显著性。t值可以通过概率值判断,F值则要查表。一般情况下,F值都会比较大。B是解释系数。专题二结构方程一、简答题6.请对比分析潜变量、标识变量、內源变量、外生变量之间的差异,并说明內源变量、外生变量与调节变量、中介变量的关系。7.请论述什么叫做结构方程的违规估计或者违犯估计,并罗列其主要的几种表现形式。三、计算题2.结构方程模型(211)转化为矩阵方程的结构模型和测量模型。在评鉴模型拟合优度之前,必须先检查“违犯估计”,即估计系数是否超出了可接受的范围,也就是模型得到了不适当的解。一般需要逐一浏览参数估计的结果,检查每一个参数的正负号。数值大小、测量误差等。如果出现某些变量的测量误差过于严重,研究者应先行解决测量的问题,重新探讨参数的估计,而非进入模型评鉴的程序。违规估计现象:1)误差估计值为负2)标准化系数是否超过或太接近于13)某些估计值本身恰当,但标准误SE很大,甚至高出其他数值几百倍(1)模型注解内容NotesforModel(Groupnumber1-Defaultmodel)Thefollowingvariancesarenegative.(Groupnumber1-Defaultmodel)e25e26-.018-.038Computationofdegreesoffreedom(Defaultmodel)Numberofdistinctsamplemoments:300Numberofdistinctparameterstobeestimated:54Degreesoffreedom(300-54):246Result(Defaultmodel)MinimumwasachievedChi-square=884.224Degreesoffreedom=246Probabilitylevel=.000说明:模型中误差方差的测量误差估计值存在两个为负,发生违反估计现象。模型的自由度为246,适配度卡方值为884.224,显著性概率值P=0.000<0.05,拒绝原假设,即再生协方差矩阵与原协方差矩阵有差异,表明观测数据与假设模型之间不适配。正态性检验Assessmentofnormality(Groupnumber1)c.r.表示偏度系数(skew)或峰度系数(kurtosis)除以标准误的临界值,当c.r.值>2时,暗示有些单变量可能具有异常值;当c.r.值>1.96时,表明有些单变量违反正态分布的假设。由上表可知,多变量c.r.值为6.886,可以发现有些单变量可能具有异常值。(2)估计值内容ScalarEstimates(Groupnumber1-Defaultmodel)MaximumLikelihoodEstimatesRegressionWeights:(Groupnumber1-Defaultmodel)说明:该表为非标准化的回归系数及其显著性检验摘要表,非标准化系数是根据变量的原始分数或协方差矩阵求得。右边第一列估计值为非标准化的回归系数,此值可比较相对影响力;第二列为估计参数的标准误;第三列C.R.为临界比率值,相当于t检验的t值,t>1.96则P<0.05,t>2.28则P<0.01;第四列P值为显著性,“***”表示P<0.001,“**”表示P<0.01,“*”表示P<0.05。在潜变量与标识变量之间的路径系数中(如“自我学习”与“ZWXX1”之间)有一个标识变量出现“1”,而其他的没有,这个“1”表示识别性,也就是在非标准化的估计值中作为解释的基准。StandardizedRegressionWeights:(Groupnumber1-Defaultmodel)说明:上表为标准化的回归系数值,即路径分析中的路径系数。(3)拟合度检验Result(Defaultmodel)MinimumwasachievedChi-square=884.224Degreesoffreedom=246Probabilitylevel=.000模型的自由度为246,显著性概率值P=0.040<0.05,拒绝原假设,即再生协方差矩阵与原协方差矩阵有差异,表明观测数据与假设模型之间不适配;另外,卡方/自由度=1.177小于2,表明模型与数据的拟合度相对之前的3.594改善很多。Chi-square/Degreesoffreedom要小于2ModelFitSummaryCMINModelNPARCMINDFPCMIN/DFDefaultmodel54884.224246.0003.594Saturatedmodel300.0000Independencemodel242383.313276.0008.635上表中,NPAP是估计的参数个数,在不论在预设模型、饱和模型或独立模型中,NPAP与DF的和是相等的。上表中,均为300.CMIN是差异的宏函数。差异为卡方值,差异可以检查模型是否适合数据。当完全适合数据时,差异值为0;当模型不适合数据时,差异无限大。上表的饱和模型的差异值为0,说明其完全适合数据模型;预设模型和独立模型的差异值很大,说明与数据拟合程度不好。P是显著性。预设模型和独立模型的显著性小于0.05,表明该模型与数据拟合不适度。CMIN/DF是差异除以自由度。越接近0,说明模型与数据的配适越好。一般取值为2,此时CMIN/DF的值为3.594,大于2,表明模型与数据的拟合度不好。RMSEAModelRMSEALO90HI90PCLOSEDefaultmodel.124.115.133.000ModelRMSEALO90HI90PCLOSEIndependencemodel.213.205.220.000RMSEA=总体差异/自由度,为近似误差均方根,表示假设模型与饱和模型之间的差异。RMSEA小于0.05时,可以判断模型的拟合度好,RMSEA大于0.1时,表示模型的拟合度差。预设模型的RMSEA为0.126,大于0.1,模型的拟合度差。RMR,GFIModelRMRGFIAGFIPGFIDefaultmodel.236.746.690.611Saturatedmodel.0001.000Independencemodel.431.301.241.277GFI拟合优度指数,越接近1表示模型拟合度越好,通常采用GFI>0.9,预设模型的GFI=0.115<0.9,表明模型的拟合度不好。AGFI是越接近1模型适合度越好,通常为0.9,上表为0.69,表明拟合度不好。RMR是平均方根残值,越接近于0表示模型的拟合度越好,通常采用RMR<0.05,预设模型的RMR=0.236>0.05,表明模型的拟合度不好。BaselineCom

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功