LOGO第4章平均数差异检验•重点班的学生和一般学生的平均智商是否有差异呢?要解决这个问题就可以运用本章将要介绍的平均数差异检验的方法。4.1假设检验原理•假设检验(hypothesistesting)是推论统计中的重要内容,是指先提出一个假设,一般是对总体参数或总体分布形态的假设,然后通过检验样本统计量的差异来推断总体参数之间是不是存在差异。因为在现实调查研究中,往往由于各种限制而无法得到总体的参数。•例如要调查汉族和蒙古族7岁儿童的运算能力是否存在差异,不可能对所有的汉族和蒙古族7岁儿童进行测试,只能通过合理的抽样,然后对样本进行调查。这样得到的参数就是样本参数,通过对样本的参数进行检验从而推测汉族7岁儿童总体和蒙古族7岁儿童总体在运算能力上是否有差异。4.1.1假设与假设检验•在统计学中,假设一般用来指对总体参数所做的假定性说明。•在统计学上有两种假设,一种称为虚无假设(nullhypothesis),或叫做零假设,记为H0;一种称为备择假设(alternativehypothesis),或叫做对立假设,记为H1。H1是研究者提出的研究假设。•在统计学上,只能对虚无假设H0进行直接的检验。假设检验的任务就是先假设H0是真的,然后以此为前提,如果有不合理的现象出现则说明假设是错误的,即H0为真这一假设是不成立的,要被拒绝。如果H0为假,就要拒绝H0并接受H1,则研究者的假设成立;如果H0为真,就要接受H0并拒绝H1,则研究者的假设不能成立。这就是统计学上的“反证法”。H1称为备择假设就是指其是预备当H0被拒绝时以供选择的。虚无假设和备择假设互相排斥并且只有一个正确,因此H1又称为对立假设。4.1.2假设检验中的小概率事件•小概率事件就是指一个发生概率接近零的事件,也就是一般情况下不会发生的事件。4.1.3假设检验的两类错误•虽然小概率事件发生的可能性很小,但仍有发生的可能。•若设定临界概率为0.05,从某一平均数为μ0的总体中抽取任一样本,样本平均数为。当没有落入总体分布两端5%概率的范围内,如图阴影部分所示。•然而,即使概率再小(如α=0.01)、临界区域的面积再小,任意抽取的仍有1%的概率落入临界区域,即这种小概率事件的发生仍有1%的可能性是合理的。这时H0是真的,然而依据假设检验的统计逻辑却要拒绝H0,这样就犯错误了。统计学中将这类不该拒绝H0却拒绝了H0的错误称为Ⅰ型错误(typeⅠerror),因为常用α表示概率,所以又常称为α型错误。这种错误往往导致虚假的科学发现。•如图所示,是H0为真时和H1为真时的分布,两个分布是有重合的。•在这个阴影部分中既有可能是H0为真也有可能H1为真。但是我们拒绝了H1为真的可能性,这就可能又犯错误了。统计学中将这类不该拒绝H1却拒绝了H1的错误称为Ⅱ型错误(typeⅡerror),这类错误的概率用β表示,所以又称β型错误,这类错误往往导致科学发现被埋没。4.1.4单侧检验和双侧检验•根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小。4.1.5假设检验的步骤•假设检验一般包括以下五个步骤:•(1)根据研究问题的要求提出假设,包括虚无假设H0和备择假设H1。•(2)选择合适的检验统计量。•(3)根据需要选择显著性水平α。•(4)计算出检验统计量。•(5)根据检验统计量做出统计决策。4.2均值比较•介绍了一定的假设检验的统计学知识,下面将具体讲解在SPSS18.0中如何利用假设检验的思想对平均数的差异进行检验。在SPSS18.0中,是由“分析”|“比较均值”下的子菜单完成各种情况下的平均数差异检验的。先从最基本的“均值过程”进行介绍。4.2.1均值比较的主要功能•均值过程和前面的描述统计过程一样,可以对指定变量的描述性统计变量进行呈现。4.2.2均值比较的适用条件•均值过程主要功能是统计变量的描述和不同组之间粗略的比较,因此对数据没有什么要求。需要注意的是用来形成分组的变量应该是能明确表明某种特征的变量。另外均值过程中有一个对数据进行线性检验的功能,由“选项”对话框中的“线性相关检验”功能实现,这要求在第一层的控制变量要不少三个水平。4.2.3均值比较的操作过程•在SPSS中均值比较的操作过程如下:•(1)打开或建立数据文件。•(2)选择“分析”|“比较均值”|“均值”命令,打开“均值”主对话框,如图所示。•(3)选择因变量:对话框左面是源变量框,其中罗列了数据文件中已命名的变量,从中选择作为因变量的变量,单击上方的箭头按钮,该变量进入“因变量列表”框。因变量可以根据需要选择一个或多个变量。•(4)选择自变量:在源变量框中选择作为自变量的变量,即分组变量。单击下面的箭头按钮,该变量进入“自变量列表”框。首先选择的自变量默认为第一层控制变量,若单击“下一张”按钮,可以再选择其他变量作为第二层控制变量。•(5)选择描述性统计量:单击“选项”按钮,出现“选项”对话框,如图所示。•(6)选择进行单因素方差分析或线性相关性检验:在“选项”对话框的下方有两个复选按钮,分别是Anova表和eta、线性相关检验,前者对第一层的自变量进行单因素方差分析和计算变量相关程度的eta值;后者在第一层自变量有三个以上水平时对其进行线性相关性检验。•(7)设置完成后,单击“继续”按钮返回均值主对话框,单击“确定”按钮,执行操作,输出结果。4.2.4实例分析:某普通高校本科生自尊平均水平•在某普通高校随机抽取152名本科生,运用缺憾感量表对其自尊水平进行测量,收集测验数据。部分数据如下所示:1.描述不同性别学生自尊的平均水平解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊水平;自变量是被试的性别和专业。要描述不同性别学生的自尊平均水平,可以直接由均值比较的操作实现。•操作过程(1)创建新的数据文件:变量包括被试的性别、专业和自尊。(2)打开主对话框并完成变量选择:选择“分析”|“比较均值”|“均值”命令,打开“均值”对话框。将因变量“自尊”选入“因变量列表”框中,将分组变量“性别”选入“自变量列表”框中,如图所示:(3)选择描述性统计量:单击“选项”按钮,打开“选项”对话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击“继续”按钮,返回“均值”主对话框。(4)单击“确定”按钮,执行操作,输出结果。•结果分析(1)案例处理摘要表:结果首先呈现的是案例处理摘要表。该表格呈现了在均值比较中参与统计分析的案例和排除的案例的个数和所占的百分比。如下表所示,有152个数据个案参与统计处理,占总个案数的100%,剔除的个案数为0。(2)均值比较结果报表:均值比较结果报表呈现了不同分组的描述性统计量变量,便于直观比较。如下表所示,分别呈现了女生和男生自尊的平均水平,女生共有85人参与检验,平均自尊得分是158.65,标准差为27.230;男生共有67人参与检验,平均自尊得分是173.00,标准差为28.410;所有参与比较的被试的总数为152,自尊平均值是164.97,标准差为28.572。2.描述不同性别和不同专业的学生的自尊平均水平解:在该案例中,如果要描述不同性别和不同专业学生的平均自尊水平,需要有两层分组,分别以“性别”和“专业”为分组变量,可以通过均值比较中添加分组层次的功能来实现。•操作过程(1)打开数据文件。(2)打开主对话框并完成变量选择:选择“分析”|“比较均值”|“均值”命令,打开“均值”主对话框。将因变量“自尊”选入“因变量列表”框中,将分组变量“性别”选入“自变量列表”框中。单击“下一张”按钮,选择“专业”进入“自变量列表”框中作为第二层分组变量,如图所示:(3)选择描述性统计量:选择描述性统计量:单击“选项”按钮,打开“选项”对话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击“继续”按钮,返回“均值”主对话框。(4)单击“确定”按钮,执行操作,输出结果。•结果分析结果除了呈现案例处理摘要表,还呈现了均值结果报表,如下表所示。从该统计报表中不仅可以分别看出女生和男生的平均自尊得分,还可以进一步看到不同专业的女生和男生的平均自尊得分,以及不同专业学生总体的平均自尊得分。例如哲学专业女生共有26人,平均自尊得分为151.46,标准差为20.120;心理学专业的学生共有111人,平均自尊得分为167.06,标准差为29.601。4.3单一样本T检验•4.2节所介绍的均值过程可以呈现分组变量的平均值等描述统计量,将不同的组进行一个直观的比较。在以下的三节中将介绍的检验方法有单样本T检验、独立样本T检验、配对样本T检验,根据数据的特征,选择运用合适的检验方法。4.3.1单一样本T检验的主要功能•单一样本t检验是比较某一样本的平均数与某一确定总体均值是否有统计学意义上的差异。用样本的平均数来估计样本所代表的未知总体的平均数,通过检验样本平均数与确定总体平均数值是否存在差异来推论未知总体是否和确定总体一致。4.3.2单一样本T检验的适用条件•当确定均值的总体的条件不同时,如总体是否为正态分布以及总体方差是否已知,所适用的单一样本平均数差异检验的方法是不同的。4.3.3单一样本T检验的操作过程•在SPSS中进行单一样本t检验的操作过程如下:•(1)打开或建立数据文件。•(2)打开主对话框:选择“分析”|“比较均值”|“单样本T检验”命令,打开“单样本T检验”主对话框,如图所示。•(3)选择变量:在左边的源变量列表框中选中要进行单一样本t检验的变量名,单击中间的箭头按钮,使选中的变量进入右边的“检验变量”列表框中。•(4)输入检验值:在“检验变量”列表框下方的“检验值”文本框中填入要进行检验的确定的均值。•(5)设置置信度、选择缺失值处理方法:单击“选项”按钮,打开“选项”对话框,如图所示。•(6)设置完成后,单击“继续”按钮返回单样本t检验主对话框,单击“确定”按钮,执行操作,输出结果。4.3.4实例分析:全国各地区城市园林绿地面积•2008年的全国调查显示中国各地区平均城市园林绿地面积约为56300公顷。假设2010又进行一次全国各地区城市园林绿地面积的调查,试检验2010年各地区城市园林绿地面积与2008年全国平均城市园林绿地面积是否有差异。解:在本案例中,要检验2010年各地区城市园林绿地面积与2008年全国平均城市园林绿地面积(已知值:56300公顷)是否有差异,即某一样本数据与某一确定均值进行比较。虽然不知道总体分布是否是正态,但样本较大(N=30),狂热以运用单样本T检验。1.操作过程(1)建立数据文件:将调查获得数据输入数据文件中,如下表所示,单位(公顷)。(2)打开主对话框:选择“分析”|“比较均值”|“单样本T检验”命令,打开“单样本T检验”主对话框。(3)选择变量:将变量列表框中“绿化面积”变量移入右边的“检验变量”列表框中。(4)输入检验值:在“检验变量”列表框下方的“检验值”文本框中填入检验均值56300,如图所示:(5)单击“确定”按钮,执行操作,输出结果。2.结果分析(1)描述性统计量表:该表格呈现了单个样本的描述性统计量的值,包括参与统计的单个样本的个案数(N)、均值、标准差和均值的标准误。如下表所示,共调查了中国30个地区,平均城市园林绿地面积为58030.63公顷,标准差为69705.957,标准误为12726.508。(2)单样本T检验结果报表:该样本呈现了单样本T检验的结果,包括T值、自由度(df)、检验的概率(Sig.)、均值差值,以及差分的95%置信区间。如下表所示,本案例T检验的T值为0.136,自由度df=29,双侧T检验的概率Sig.(双侧)=0.893.由于显著性水平为0.05,而0.8930.05,因此接受虚无假设,即2010年调查所得各地区平均城市园林绿地面积,与2008年调查所得的全国平均城市园林绿地面积56300公顷无显著差异。T检验对应的置信区间的公式为:则2010年全国平均城市园林绿地面积95%的置信区间=均值(58030.63)