单样本K-S检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

SPSS16实用教程第10章非参数检验10.4.1统计学上的定义和计算公式10.4SPSS单样本K-S检验定义:K-S(Kolmogorov-Smirnov)检验它是检验单一样本是否来自某一特定分布的方法。它的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。假设检验问题:H0:样本所来自的总体分布服从某特定分布H1:样本所来自的总体分布不服从某特定分布F0(x)表示理论分布的分布函数,Fn(x)表示一组随机样本的累计频率函数。设D为F0(x)与Fn(x)差距的最大值,定义如下式:D=max|Fn(x)-F0(x)|结论:当实际观测DD(n,α)(D(n,α)是显著水平为α样本容量为n时,D的拒绝临界值),则拒绝H0,反之则接受H0假设。D(n,α)的简略表以Kolmogorov-Smirnov正态性检验为例介绍它的统计原理。例1:35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自正态分布8777926880788477818080779286768081757772817284868068778776777892758078n=35检验过程如下:H0:健康成人男性血糖浓度服从正态分布H1:健康成人男性血糖浓度不服从正态分布经计算,样本的均值μ=80,标准差σ=6,这便可以作为对原假设,正态分布的参数估计值,运用于检验计算中。D值序列的计算结果得到D统计量的值为0.1754.然后查表判断是否拒绝原假设χ2检验与Kolmogorov-Smirnov检验的区别χ2检验与Kolmogorov-Smirnov检验都采用实际频数和期望频数进行检验。它们之间最大的区别在于前者主要用于类别数据,而后者主要用于有单位的数量数据,有时前者也可以用于数量数据但必须将数据分组得到实际观测频数,并要求多变量之间独立,而后者可以不分组直接把原始数据进行检验因此k-s检验对数据的应用较完整。SPSS在统计中将计算K-S的Z统计量,并依据K-S分布表(小样本)或正态分布表(大样本)给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本来自的总体与指定的分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体与指定的分布无显著差异。单样本K-S检验可以将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)、指数(Exponential)分布进行比较。10.4.2SPSS中实现过程研究问题某地144个周岁儿童身高数据如表10-4所示,问该地区周岁儿童身高频数是否呈正态分布?表10-4儿童身高数据身高区间人数64-268-469-770-1671-2072-2573-2474-2276-1678-279-683-1实现步骤图10-12在菜单中选择“1-SampleK-S”命令图10-13“One-SampleKolmogorov-SmirnovTest”对话框有四种可作为原假设中理论分布的分布类型Options选项和精确检验选项。图10-14“One-SampleK-S:Options”对话框10.4.3结果和讨论(1)本例输出结果如下表所示。D统计量的数值Z值等于D*sqrt(n)近似相伴概率值等于0.681大于我们一般的显著水平0.05,则接受原假设,认为学生身高频数服从正态分布。注意:在样本数少于50时,要求使用精确检验概率值。作业!要求作业中,在进行K-S检验时,结果中需要含有表明D值计算过程的表格(包括累积频率,理论累积分布函数,D值序列并指明D统计量的值),最后运用spss计算的相伴概率值,给出检验结果。1.对于例一的正态性检验问题,运用k-s检验的方法进行检验。2.运用k-s检验方法检验研究问题中,儿童的身高(不是身高频数,处理数据时,如:“64—”按“64”处理)是否服从正态分布。3.据一家商场的调查报告记载了该商场一位售货员在一个工作日内接待的110位顾客中花费在每一位顾客的服务时间(单位:秒),如下表所示。根据数据分别用卡方检验和K-S检验,卡方检验检验花费在每一位顾客的服务时间是否服从指数分布?(卡方检验时,需要给出分组和各分组取值的理论频率,最终通过spss计算出的相伴概率值作出检验结果)。

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功