第6章SPSS统计分析本章内容第一节均值比较第二节T检验第三节方差分析要点:均值比较是对同一样本进行分组,对组与组之间平均水平的比较。T检验主要运用在两个样本间平均水平的比较。方差分析运用于两个以上样本的均数比较。第一节均值比较一、Means过程Means过程是按用户指定条件,对样本进行分组计算均值和标准差。计算公式:nxxnii111例1以下是某个班同学的数学成绩,比较不同性别同学的数学成绩平均值和方差。性别数学male99795989798999female88545623708067步骤:Analyze-CompareMeans-MeansDependentList对话框-数学IndependentList对话框-性别Option按钮,选择统计项目第二节T检验一、单一样本T检验二、两个独立样本T检验一、单一样本T检验检验某个变量的样本均值与某个指定总体均值之间是否存在显著差异。计算公式:D是样本均值与检验值的差。S.E.Mean:样本均差,或抽样平均误差S是样本标准差,n为样本数nsDMeanESxxt/..中心极限定理如果总体存在有限的平均数和方差时,不管总体是否属于正态分布,只要当抽样单位数不断增加,当样本容量大于30后,即当抽样单位数足够大时,样本平均数x分布趋近于正态发布。当以全及总体平均数为中心各加减一个抽样平均误差范围时,此范围的抽样指标占总体所有可能指标的68.27%。两倍时为95.45%。这个倍数称为概率度正态分布x-uu68.27%-2u2u95.45%接受域否决域否决域抽样平均误差样本平均数x的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。)..()(2MeanESnSXx=所有样本的个数抽样平均误差T分布当样本容量小于30,样本平均数分布服从n-1个自由度的T分布。SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平a,则拒绝H0,认为总体均值和检验值之间存在显著差异。反之,总体均值和检验值之间不存在差异。例2上题中,数学高考成绩与全国平均成绩70之间是否存在显著差异?步骤Analyze-CompareMeans-OneSampleTTestTestVariables:数学TestValues:70Option:ConfidenceInterval:95%MissingValues:Excludecases结果与讨论T值为0.566相伴概率Sig=0.584Sig0.05,因此不能拒绝H0,可以认为11名同学的成绩与全国数学平均成绩相比,没有显著差异。作业抽取一个由12名学生组成的随机样本,调查他们在作业上花费的时间。假设学生作业时间服从正态分布,老师建议时间不低于36小时,检验其平均时间是否与老师建议的时间相符?314026303638294038303538二、两个独立样本T检验所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个变量之间是否有显著差异存在。检验的前提:1、两个样本相互独立2、样本来自的两个总体服从正态分布计算步骤利用F检验判断两总体的方差是否相同。Spss采用LeveneF方法检验两总体方差是否相同,自动计算F统计量,并根据F分布表给出统计量对于的相伴概率和显著水平a进行比较,从而判断方差是否相同。根据第一步的结果,决定T统计量和自由度的计算公式,进而对T检验的结论作出结论两个独立样本T检验的零假设H0为两总体均值之间不存在显著差异。在两总体方差未知且不等时,T统计量计算公式如右:22222121212221212222121//1nnsnnsnsnsfssxxtnn两总体方差未知且相同情况下,T统计量计算公式:1)1()1(//212222112222211nnsnsnSssxxtpnpnp评判标准:Spss将会根据计算的T值和T分布表,给出相应的相伴概率值Sig。如果相伴概率值小于或等于显著水平a,则拒绝H0,认为两总体均值之间存在显著差异,相反,相伴概率大于显著水平a,则不能拒绝H0,认为两总体均值之间不存在显著差异。例3清华、北大学生的高考数学成绩表学校数学清华998879595489795689北大992389705067788956步骤:Analyze-CompareMeans-Independent-SampleTTestTestVariables:数学TestValues:Source-DefineGroups本例中大于相伴概率0.461,大于显著水平0.05,不能拒绝方差相等的假设,可以认为两个学校学生数学成绩方差无显著差异;在方差相等时看T检验结果,T检验值等于相伴概率0.423,大于显著水平0.05,不能拒绝T检验的零假设,可以认为两个学校学生数学平均成绩无显著差异。作业一家企业生产某种产品,随机抽取50名工人,分成两个组,每组25名工人,用A方法生产所需时间:6.857.95.27.66.16.27.14.666.46.16.67.76.455.95.26.57.47.16.156.37作业用B方法生产所需时间:假设两个总体的方差相等,显著水平为0.05,这两种方法效率是否有显著差异?5.26.75.76.68.54.24.55.37.975.94.95.34.27.16.55.96.76.64.25.97.15.875.7第三节方差分析方差分析是研究一个或多个可分组的自变量与一个连续的因变量之间的统计关系,并且测定自变量对因变量的影响和作用的一种统计分析方法。T检验适合在两个样本间的比较。对于两组以上的均数比较,必须使用方差分析的办法。造成结果差异的原因可分为两类:一类是不可控的随机变量;一类是在研究过程中人为施加的控制变量。方差分析的的基本思想是:通过分析不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小,是否对结果产生了显著影响。如果没有,就是随机变量的作用。方差分析有:单因素重复试验双因素重复试验双因素无重复试验单因素试验单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如:农业上检验某种新型化肥的效果,做增产试验。将土地分为三组:第一组:使用Fa化肥第二组:使用Fb化肥第三组:使用传统化肥(对照)总变异SST=SSA+SSE其中:SST:总变异的平方和SSA:组间离差平方和SSE:组内离差平方和kinjiijkiiiixxSSExxnSSA1112)()(SSA:是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。SSE:是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。K:水平数;Ni为第i水平下的样本容量。计算公式,进行F检验F服从(k-1,n-k)个自由度的F分布)/()1/(knSSEkSSAFSPSS自动计算F统计值,F服从(k-1,n-k)个自由度的F分布(k是水平数,n为个案数),SPSS依据F分布表给出相应的相伴概率值。如果相伴概率值小于或等于显著水平a,则拒绝零假设,认为各水平下总体均值有显著差异,反之,则认为控制变量不同水平下各总体均值没有显著差异。例题三组学生的数学成绩组别数学组别数学组别数学199279355188256350199289367189299367194270356190289356研究一个班3组同学(分别接受3种不同的教学方法)在数学成绩上是否有显著差异.步骤在“Analyze”菜单“CompareMeans”中选择One-WayANOVA命令。在弹出的对话框中,选择“数学”变量添加到DependentList框中,选择“组别”变量添加到Factor框中。单击option按钮,出现一个对话框。由于方差分析的前提是各个水平下总体服从方差相等的正态分布,因此必须对方差分析的前提进行检验。方差相等检验方法在这里选择Homogeneityofvariancetest(方差相等检验方法)。如果相伴概率值小于或等于显著水平,则拒绝零假设,认为各水平下总体方差不等;相反,如果相伴概率值大于显著水平,则接受零假设,认为各水平下总体方差相等。单击continue返回。单击PostHoc按钮,打开一个对话框,在其中选择一种或几种比较分析的方法,选择LSD(Least-SignificantDifference)最小显著法。a默认为0.05,单击Continue返回。单击Contrasts按钮,选择Linear,作线形分解。结果与讨论单因素方差分析的前提检验结果TestofHomogeneityofVariances数学LeveneStatisticdf1df2Sig.3.862215.044方差检验从上表可以看出,相伴概率为0,小于显著性水平0.05,表示拒绝零假设,也就是说3个组中至少有一个组和其他两个组有明显的区别。总的离差平方和为5250,其中控制变量不同水平造成的组间离差平方和为3686,组内离差平方和为1563.6多重比较3个组之间的相伴概率都小于显著水平0.05,说明3个组之间都存在显著差别作业3方差分析某百货公司的营销部根据不同家庭的价值观细分了女性服装市场,分为保守型、传统型和潮流型,另外调查了不同类型家庭收入,见下表(单位:千元)。能否推断出不同类型的家庭的收入是否存在明显不同?保守型家庭收入43472237412536502232493150263247324138512833505442传统型家庭收入35335443384045383429432332372548414847334945292132传统型家庭收入35335443384045383429432332372548414847334945292132潮流型家庭收入34423835424643412229265638406331373519434736363233