第7章非参数检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第7章非参数检验非参数方法可以广泛应用于社会科学、行为科学、生物科学和数理科学等研究领域。与参数方法相比,它具有分布自由、可用于按数值意义讲并不严格但有一定等级顺序的资料的分布以及计算简单三大优点。将鼠标指向Analyze主菜单中的NonparametricTests选项,打开子菜单,如图所示。单击子菜单中的选项,将进行不同的检验。子菜单中的选项有:Chin-Square:2检验;Binomial:二项检验;Runs:游程检验;1-SampleK-S单个样本的柯尔莫哥洛夫-斯米若夫检验(简称K-S检验);2-IndependentSamples两个独立样本的检验;KIndependentSamples多个相关样本的检验;2RelatedSamples两个相关样本的检验;KRelatedSamples多个相关样本的检验。下面分别介绍应用于各种不同情况的非参数检验方法。第一节单个样本的检验单个样本的非参数检验方法包括卡方检验、二项检验、游程检验和柯尔莫哥洛夫-斯米若夫检验等。1.2检验(1)基本数学原理2检验属于拟合度型检验,适用于具有明显分类特征的某种数据,用来检验属于某一类别的对象或反映的个案数与根据所得零假设所得期望数目之间是否有显著差异,进行检验时,需要构造下面的统计量:221()kiiiiOEE式中,iO为归入第i类的实际个案数,iE为零假设成立时第i类中的期望频数。若实际的各案数与期望数越接近,则差值()iiOE越小,所以2值就越小;若差值越大,则2值就越大,则实际的各案数就越可能不是来自于服从零假设的总体,而且零假设成立时,2数值的抽样分布服从自由度为1k的卡方分布。(2)SPSS实现在NonparametricTests子菜单中单击Chi-Square选项,打开Chi-SquareTest对话框,如图所示。各个选项的意义如下:TestVariablesList列表框用右箭头按钮从左边源变量列表框移变量名到该框中,则对对应变量的数据进行2检验。ExpectedRangeList方框在该方框中进行选择,确定对变量中的那些数据进行检验。※Getfromdata单选按钮为默认选项,选择此项,由系统指定数据范围(全部数据参与检验)。※Usespecifiedrange单选按钮选择此项,下面的Lower文本框和Upper文本框变为可用,在其中输入数值,确定自定义数据范围的下限和上限。※ExpectedValues方框在该方框中确定变量中各组数据期望值的设置方式。Allcategoriesequal单选钮为默认选项,选择此项,假设变量中各组数据的期望值相等,抽样检验样本是否服从均匀分布时选择此项。Values单选项选择此项,其右恻以及下方的文本框和按钮变为可用,在单选按钮右恻的文本框中输入数值,然后单击Add按钮,则该数值按钮添加到右边列表框中。重复以上操作,可以输入多个数值,这些数值将被作为需检验分布的期望值。在列表框中选定数值以后,使用Change按钮可以对该数值进行修改,单击Remove按钮可以删除该数值。Options按钮:单击该按钮,打开Chi-SquareTest:Options对话框,如下图所示:该对话框设置统计量的描述和缺失值的处理。其中Descriptive核选框并显示个数、均值、标准离差等等指标;Quartile核选框,计算并显示四分位数;MissingValues:方框在该方框内的选项设置缺失值的处理方式。Excludecasestest-by-test单选按钮为默认选项,剔除进行检验的数据中存在缺失值的个案;Excludecaseslistwise单选按钮,剔除所有含有缺失值的个案。SPSS演示值得注意的是,需要对两种情况进行分别演示,即Allcategoriesequal和AddValues两种情况。2.二项检验(1)基本数学原理二项分布属于拟合度型检验,适用于只能划分为两类的数据总体,例如男生和女生,小于或者等于某值的数和大于某值的数。对于取自该总体的所有可能结果,要么是这两类中的某一类,要么是另一类,不可能同时属于对立的两类,称具有这种分类特征的数据所服从的分布为二项分布。进行检验时,假定一类事件所占比例为P,另一类所占比例为1-P,则二项检验便是检验能否认为从样本中观察到的两类比例来自具有指定的P值的总体。(2)SPSS实现在NonparametricTests子菜单中单击Binomial选项,打开BinomialTest对话框,如图所示。TestVariables列表框在该列表框中输入变量名,对应变量的数据用做检验分析。DefineDichotomy方框在该方框中进行选择,确定进行二项分布的数据获取方式。※Getfromdata单选框为默认选项,从原数据文件中获取分类数据;※Cutpoint单选框在后面的文本框中输入一个数值,将以该数值为边界把数据划分为两组,小于等于的为一组,而大于的为另外一组。Test文本框在该文本框中输入一个数值,作为二项中第一项的概率。默认值为50%,表示样本中分属于两类的概率相等。即检验样本数据是均匀分布的。Exact按钮和Options按钮:单击这两个按钮,将打开ExactTest对话框和Binomial:Options对话框,按照要求进行设置。SPSS演示3.游程检验1.基本数学原理游程检验有游程最大长度和游程总个数检验两种方法,SPSS采用的是游程总个数检验方法,用该法可以检验一组样本数据是否来自于同一总体(或者差异不明显、服从同一分布),即考察按照随机顺序得到的一组样本的观察值是否表现出足够的随机性。假设观察结果可以表示为0和1的序列,则把0和1连续出现构成的数据段称为一个游程,总的数据段称为游程总个数,例如下面的序列:在0011101100中,00、111、0、11、00为游程,游程总个数为5。当游程总个数太大或者太小时,认为样本数据不是随机序列的。2.SPSS在NonparametricTests子菜单中单击Run选项,打开Run:Test对话框,如图所示。TestVariable列表框在该列表框中输入变量名,对应变量的数据作为检验对象。CutPoint方框在该方框中选择断点的设置方式。※Median核选框即用数据中点作为断点;※Mode核选框用数据众数作为断点;※Mean核选框用数据均值作为断点;※Custom核选框在后面的方框内输入数值作为断点。SPSS演示4.柯尔莫哥洛夫-斯米若夫检验(1)基本数学原理该检验为拟合度型检验,可以检验样本数据服从指定的理论分布,假设F0(x)是一个已经知道的分布函数,Fn(x)是未知的总体分布函数F(x)的一个较优的估计,取检验统计量:D=max|Fn(x)-F0(x)|则样本数据服从指定分布(即F(x)=F0(x))时,D的观察值应该较小,如果D的观察值较大,则零假设可能不成立。(2)SPSS实现在NonparametricTests子菜单中单击OneSampleKolmogorov-Smirnov选项,打开OneSampleKolmogorov-SmirnovTest对话框,如下图所示:TestVariables列表框在该列表框中输入变量名,对应变量的数据作为检验对象。TestDistribution列表框在该方框中选择一种分布形式,假设样本数据服从该种分布,SPSS将进行检验。※Normal核选框正态分布※Uniform核选框均匀分布※Poisson核选框泊松分布※Exponential核选框指数分布Exact按钮和Options按钮单击该按钮,打开对应的对话框,可以根据需要进行设置。SPSS演示值得关注的是,检验也可以用语句表示:对于上面介绍的方法的选择,可以根据一些经验进行选择:※当检验的假设是关于样本是否来自于指定分布总体的问题时,可采用3种具有拟合优度类型的检验方法中的一个。即卡方检验、二项检验和K-S单样本检验;※卡方检验要求样本容量一般=50;※当样本数据的分类只有两类时,用二项检验。当样本容量小到卡方检验不能够用的时,二项检验是唯一可用的检验;※资料分类是若干个离散型类别,以及当期望值的频数足够大时,最好用卡方检验;※样本数据为连续分布时,最好用K-S检验;※在K-S检验能够进行的情况下,其是最好的检验方法。第二节两个独立样本的非参数检验两个独立样本的非参数检验包括Meann-WhitneyU检验,Kolmogorov-Smimov双样本检验和Wald-Wolfowitz游程检验和Moses极端反应检验方法。1.在NonparametricTest子菜单中单击2Independent-SamplesTests选项,打开TwoIndependent-SamplesTests对话框,如图所示:TestVariables列表框在该表中输入变量名,对应变量的数据作为检验对象。GroupingVariables文本框在该文本框中输入变量名,则对应的变量作为分组变量,该变量名后面添加小括号,小括号内有两个问号,用DefineGroups按钮进一步设置。DefineGroups按钮单击该按钮,打开TwoIndependent-SamplesTests:DefineGroups对话框,在对话框中分别输入数值,从而将数据进行分组。TestType方框在该方框中进行选择,确定用什么方法进行检验。对于Exact和Options选项的设置可以根据具体情况进行,不再赘述。2.Man-Whitney检验该检验可用来检验两个独立样本是否取自同一总体,它是最强的非参数检验之一,用该法进行检验时,首先将两个样本放在一起,对所有的个案进行升序排列,计算样本一的观测值大于样本二的观测值的次数,再计算样本二的观测值大于样本一的观测值的次数,分别用U1和U2表示。如两者比较接近,则说明两个样本来自相同的分布,否则说明来自于不同的总体。SPSS演示同上,不再赘述。3.Kolmogorov-Smimov双样本检验该检验可用来检验两个独立样本是否取自同一总体分布,进行检验时,对每个观测样本作累积频数分布,并对分布采用相同的间隔。对于每个间隔,将两个阶梯函数相减,并着重分析观测值的差值中间的最大者。对于单尾检验,令D=max[Fn1(x)-Fn2(x)]对于双尾检验,令:D=max|Fn1(x)-Fn2(x)|其中,Fn1(x),Fn2(x)分别为两个样本观测累积阶梯函数,如果D较小,则可以认为两个洋来自于同一个总体,如果D较大,则可以认为两个样本不是取自同一个总体分布。SPSS演示4.Moses极端反应检验该法适用于实验条件将导致两个不同方向的极端反应的情况,如经济危机可能使得政府决策变得保守,而另一些政策却变得更加激进。该检验分析对照样本数据的跨度和弥散性。例如将样本A和样本B的数据放在一起,并按照升序排列,则两组数据来自于同一总体时,特别高的,特别低的和中等都有属于A组和B组的,总之,应该表现出一定的弥散性。如果一组表现出相对集中,到达一定程度便可以以为两个样本不是来自于同一总体的。5.Wald-Wolfowitz游程检验该检验的零假设是两个独立的样本来自于同一个总体,两个样本在某一个方面如集中趋势、偏度和变异性等方面存在差异,则可以用该法否定零假设。进行检验时,首先将两个样本的数据放在一起,并且升序排列,然后统计游程数目。如果来自于同一总体,则游程数目相当大;如果游程太小,则两组数据可能不是来自于同一总体。注意:这里原假设是两组没有差别,显著代表来自于同一总体。第三节多个独立样本的非参数检验多个独立样本的非参数检验方法有3种:即Kruskai-WallisH法,中位数法和Jonckheere-Terpstr法。1.对话框介绍在NonparametricTest子菜单单击KIndependent–Samples选项,打开TestsforSeveralIndependentSamples对话框,如图所示,该对话框意义如下:TestVariables列表框:用右边箭头按钮从源变量名列表中框中输变量名到

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功