第六章非参数检验目录非参数检验介绍5.1单样本非参数检验5.2课程回顾•均值比较和T检验课程回顾•均值比较和T检验均值比较:按照分组变量计算因变量的描述统计量,例如均值、方差、标准差等,并将结果并列显示出来,提供比较分析单样本T检验:用于进行样本均值与已知总体均值的比较,检验样本是否来自已知均值的总体。(检验样本总体均值是否为某个值)独立样本T检验:用于检验两个样本是否来自具有相同均值的总体两配对样本T检验:是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。目录非参数检验介绍5.1概述•前面已经讨论的许多统计分析方法对总体有特殊的要求,如T检验要求总体符合正态分布,等等。这些方法常用来估计或检验总体参数,统称为参数检验。•但许多调查或实验所得的科研数据,其总体分布未知或无法确定。因为有的数据不是来自所假定分布的总体,或者数据根本不是来自一个总体,还有可能数据因为某种原因被严重污染,这样在假定分布的情况下进行推断的做法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。•这种不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的统计分析方法称非参数检验(NonparametricTests)。概述•非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。概述•非参数检验的优缺点目录单样本非参数检验介绍5.2单样本非参数检验介绍在进行统计分析过程中,往往需要根据一组样本的信息来对某个总体分布或抽样过程是否随机进行判断,利用一个样本对总体进行推断的非参数检验。卡方检验二项分布检验科尔戈洛夫-斯米尔诺夫单样本检验游程检验卡方检验•卡方检验:一种典型的对总体分布进行检验的非参数检验方法,根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著性差异,是一种吻合性检验。通常用于对有多项分类值的总体分布的分析。•统计学上的定义•定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。•总体分布的卡方检验的原理是:如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时,就近似服从X的总体分布。卡方检验•假设样本来自的总体服从某个期望分布或理论分布,同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q,作出推断:其中,Qi表示观察频数,Ei表示期望频数或理论频数。•H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。•HA:样本来自的总体分布形态和期望分布或某一理论分布有显著差异。卡方检验•打开文件不合格产品数量卡方检验.sav卡方检验•打开文件卡方检验•周一——周五不合格产品是否均匀分布卡方检验•5.12+4.35+1+2.5+3.15Oi实际观察到的频数Ei均匀分布得到的理论频数Q卡方量卡方检验•给定检测性水平为0.05时,临界值为9.488•卡方统计量>9.488,拒绝H0,接受HA卡方检验P值<0.05拒绝H0,接受HA卡方检验对应的数值卡方检验•加权变量卡方检验•某地一周内各日患忧郁症的人数分布如表所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1二项式检验•在生活中有很多数据的取值是二值的•例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。•通常将这样的二值分别用1或0表示。如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。如果随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。二项式检验•SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。二项式检验•打开产品合格率二项检验.sav二项式检验•检验二项式检验系统默认为第一个记录行的变量值作为第一类别,另一值归为第二类别,检验比例框中所输入的期望概率值对应数据中第一类别的概率值。二项式检验游程检验•定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称为游程检验(Run过程)。•它的零假设为H0:总体某变量的变量值出现是随机的。•单样本变量值的随机性检验通过游程(Run)数来实现。所谓游程是样本序列中连续出现的变量值的次数。游程检验•在SPSS单样本变量值的随机性检验中,SPSS将利用游程构造Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本值的出现不是随机的;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为变量值的出现是随机的。游程检验•在SPSS单样本变量值的随机性检验中,SPSS将利用游程构造Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本值的出现不是随机的;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为变量值的出现是随机的。游程检验•打开H0:出现正、背面的概率是随机的HA:出现正、背面的概率不是随机的投硬币试验.sav游程检验单样本K-S检验•单样本K-S检验是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续型随机变量的分布形态。•单样本K-S检验可以将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)、指数(Exponential)分布进行比较。•其零假设H0为样本来自的总体与指定的理论分布无显著差异。单样本K-S检验•打开儿童身高体重检验.sav单样本K-S检验单样本K-S检验•作业•检验独生子女比例是否符合0.75•采用K—S检验分析减肥前后体重是否符合正态分布,并做出直方图与P-P图进行对比