在统计学中,我们往往从样本的特性推知随机变量总体的特性。但由于总体中个体之间存在差异,样本的统计量和总体的参数之间往往会有误差。因此,均值不相等的样本未必来自不同分布的总体,而均值相等的样本未必来自有相同分布的总体。也就是说,如何从样本均值的差异推知总体的差异,这就是均值比较的内容。SPSS提供了均值比较过程,在主菜单栏单击“Analyze”菜单下的“CompareMeans”项,该项下有5个过程,如图4-1。图4-1均值检验菜单平均数比较Means过程用于统计分组变量的的基本统计量。这些基本统计量包括:均值(Mean)、标准差(StandardDeviation)、观察量数目(NumberofCases)、方差(Variance)。Means过程还可以列出方差表和线性检验结果。[例子]调查了棉铃虫百株卵量在暴雨前后的数量变化,统计暴雨前和暴雨后的统计量,其数据如下:暴雨前110115133133128108110110140104160120120暴雨后9011610113111088921041268611488112该数据保存在“DATA4-1.SAV”文件中。1)准备分析数据在数据编辑窗口输入分析的数据,如图4-2所示。或者打开需要分析的数据文件“DATA4-1.SAV”。图4-2数据窗口2)启动分析过程在SPSS主菜单中依次选择“Analyze→CompareMeans→Means”。出现对话框如图4-3。图4-3Means设置窗口3)设置分析变量从左边的变量列表中选中“百株卵量”变量后,点击变量选择右拉按钮,该变量就进入到因子变量列表“DependentList:”框里,用户可以从左边变量列表里选择一个或多个变量进行统计。从左边的变量列表中选中“调查时候”变量,点击“IndependentList”框左边的右拉按钮,该变量就进入分组变量“IndependentList”框里,用户可以从左边变量列表里选择一个或多个分组变量。多个分组变量既可放在一层,又可放在不同层。利用图中的“Previous”和“Next”按钮可以在不同层之间切换。4)选择输出统计量单击“Options”按钮,将打开如下图所示的对话框。在“Options”对话框中,“Statistics”框中列出了SPSS可求的统计量。其中各项的意义分别为:1.Mean均值。2.NumberofCases观测量数目3.StandardDeviation标准差4.Median中位数。5.GroupedMedian分组的中位数6.Std.ErrorofMean均值的标准误7.Sum观测值之和8.Minimum最小值1.Range极差2.First第一个观测值3.Last最后一个观测值4.Variance方差5.Kurtosis峰度6.Std.ErrorofKurtosis峰度的标准误7.Skewness偏度9.Maximum最大值8.Std.ErrorofSkewness偏度的标准误其中,“Mean”、“NumberofCases”和“StandardDeviation”项为系统的默认选项。在“Cell”框中列出了已选中的统计量。从“Statistics”框中选择要生成的统计量。“StatisticsforFirstLayer”框中列出了第一层分组的另外两个统计量。“Anovatableandeta”选中将给出方差分析表和eta统计量。方差分析表的前提条件是按照分组变量分组后各组的均值都相等。eta统计量为分组变量与生成统计量的变量关系紧密程度的度量。“TestforIinearity”选中给出分析变量和分组变量的线性关系参数,其前提条件为:分组变量和分析变量线性相关。本例子选定统计量为“Mean”、“NumberofCases”、“StandardDeviation”3个统计变量。选中复选项“Anovatableandeta”。5)提交执行提交各选项,在本例中我们不做其他选择,保持缺省值。在图4-3中点击“OK”按钮,SPSS输出结果将显示在输出浏览器中。6)结果与分析表4-1结果报告(Report)表4-2方差分析表ANOVATable结果分析:表4-1结果报告,分别给出暴雨前和暴雨后卵量的统计量:暴雨前有13个样本,平均数122.38,标准差15.95,方差254.42;暴雨后有13个样本,平均数104.46,标准差15.11,方差228.269;总体26个样本,平均数113.42,标准差17.75,方差315.214。表4-2方差分析表,共有六列,第一列说明方差的来源,BetweenGroups是组间的,WithinGroups组内的,Total总的。第二列为平方和,其大小说明了各方差来源作用的大小。第三列为自由度。第四列为均方,即平方和除以自由度。第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性。第六列是F统计量的显著值,由于这里的显著值0.007小于0.05,所以模型是显著的,降雨对卵量有显著影响。单一样本的T检验如果已知总体均数,进行样本均数与总体均数之间的差异显著性检验属于单一样本的T检验。在SPSS中,单一样本的T检验由“One-SampleTTest”过程来完成。[例子]有一种新型农药防治柑桔红蜘蛛,进行了9个小区的实验,其防治效果为:95%,92%,88%,92%,93%,95%,89%,98%,92%与原用农药的防治效果90%比较,分析其效果是否高于原用农药。该数据保存在“DATA4-2.SAV”文件中。1)准备分析数据在数据编辑窗口输入分析的数据,如图4-4所示。或者打开需要分析的数据文件“DATA4-2.SAV”。图4-4数据窗口2)启动分析过程在SPSS主菜单选中“Analyze→CompareMeans→One-SampleTTest”,打开单一样本T检验主对话框,如图4-5。图4-5单一样本T检验变量选择窗3)设置分析变量设置检验变量:从左边的变量列表中选中“防治效果”变量后,点击中部的右拉按钮后,这个变量就进入到检验分析“TestVariable(s):”框里,用户可以从左边变量列表里选择一个或多个变量进行分析。输入检验值:在“TestVariable(s)”输入栏里,输入用于比较检验的均值:在本例中为90。4)设置其他参数单击“Options”按钮,打开设置检验的置信度和缺失值对话框。在“ConfidenceInterval:”框输入置信度水平,系统默认为95%。在“MissingValues”栏里选择缺失值处理方式:5)提交执行输入完成后,在过程主窗口中单击“OK”按钮,SPSS输出分析结果如表4-3和表4-4。6)结果与分析表4-3单一样本的统计量列表One-SampleStatisticsTestValue=90tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper防治效果2.5968.0322.6667.29755.0359表4-4均值的检验结果One-SampleTest在表4-4中,各项的意义分别为:tT统计量;df自由度;Sig(2-ailed)双尾T检验的显著性概率;MeanDifference检验值和实际值的差;95%ConfidenceIntervaloftheDifference具有95%置信度的范围。独立样本的T检验对于相互独立的两个来自正态总体的样本,利用独立样本的T检验来检验这两个样本的均值和方差是否来源于同一总体。在SPSS中,独立样本的T检验由“Independent-SampleTTest”过程来完成。实例在有小麦丛矮病的麦田里,调查了13株病株和11株健株的植株高度,分析健株高度是否高于病株。其调查数据如下:健株26.032.437.337.343.247.351.855.857.864.065.3病株16.719.819.823.323.425.036.037.341.441.745.748.257.8该数据保存在“DATA4-3.SAV”文件中,变量格式如图4-6,状态变量中:1表示病株,2表示健株。图4-61)准备分析数据在数据编辑窗口输入分析的数据,如图4-6所示。或者打开需要分析的数据文件“DATA4-3.SAV”。2)启动分析过程在主菜单选中“Analyze”中的“CompareMeans”,在下拉菜单中选中“Independent-SampleTTest”命令。出现图4-7设置对话框。。图4-7独立样本T检验窗口3)设置分析变量从“TestVariable(s):”从左边的变量列表中选中变量后,点击右拉按钮后,这个变量就进入到检验分析“TestVariable(s):”框里,用户可以从左边变量列表里选择一个或多个。本例选择“小麦丛矮病[株高]”。“GroupingVariable(s):”栏是分组变量栏。从左边的变量列表中选中分组变量后,按右拉按钮,这个变量就进入到“GroupingVariable(s):”框里。本例选择“状态”变量。“DefineGroups”按钮是定义分组变量的分组值。当该按钮可用时,出现图4-8对话框。图4-8定义分组值对话框如果分组变量是离散型数值变量应选择“Usespecifiedvalues”项,该项下面的“Group1”和“Group2”栏用于输入分组变量值;字符型数据输入相应分组字符。若分组变量是连续型变量,应选择“Cutpoint”项,分组变量会按该项输入值分为大于和小于两组。本例选择“Usespecifiedvalues”项,在“Group1”栏输入1;在“Group2”栏输入2。按“Continue”按钮退回上一级对话框。4)设置其他参数点击“Options”按钮,打开设置检验的置信度和缺失值对话框。在“ConfidenceInterval:”框输入置信度水平,系统默认为95%;“MissingValues”框里的“Excludecasesanalysisbyanalysis”栏,是只排除分析变量为缺失值的选择项,“Excludecaseslistwise”是排除任何含有缺失值的选择项。5)提交执行输入完成后,在过程主窗口中单击“OK”按钮,SPSS输出分析结果如表4-5和表4-6。6)结果与分析结果表4-5分组统计量列表GroupStatistics表4-6独立样本的检验结果IndependentSamplesTesto“Equalvariancesassumed”行是方差齐次性时的t检验判读值;o“Equalvariancesnotassumed”行是方差不齐次性时的t检验判读值。分析表4-6“Levene'sTestforEqualityofVariances”列方差齐次性检验结果:F值为0.038,显著性概率为0.847,因此两组方差不显著。那么应该从表4-6的“Equalvariancesassumed”行读取数值。t值是-2.539,Sig.(2-tailed)是双尾t检验的显著性概率0.019,小于0.05。可以得出结论:病株与健株的株高差异显著。两组的株高均值之差为13.56,平均病株低于健株13.56。差值的标准误为5.341。