3.2--K-S检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3.2Kolmogorov-Smirnov正态性检验Kolmogorov-Smirnov检验法主要用来检验单一样本是否来自于某一特定分布,比如检验一组数据是否为正态分布.主要用于有计量单位的连续和定性数据由于经验分布是对分布函数最直接的估计,Kolmogorov-Smirnov用以检验一个经验分布是否符合某种理论分布或比较两个经验分布是否有显著性差异.一般来说,要检验手中的样本是否来自于一个已知分布,假定它的真实分布为,下面以双边假设为例进行说明.:对于所有的,:对至少一个,K-S检验统计量K-S检验主要是将样本数据的经验分布与特定的理论分布相比较,若两者之间的差距很小,则可推论该样本取值于特定的分布.0()Fx()Fx0()()FxFx0()()FxFx0H1HxxK-S统计量定义如下:注:其中表示该组数据的经验分布设为来自于分布的一组简单随机样本,其经验分布定义如下:此阶梯函数即为的经验分布函数.(EDF)0101max|()()|,|()()|nniiniiinDFxFxFxFx()nFx#,1,2,,()inXxinFxn12,,,nXXX()Fx()FxK-S检验的基本步骤1)建立假设检验2)由样本数据计算经验分布函数与理论分布函数,代入计算3)查表确定临界值4)作出判断若样本计算得,拒绝零假设,否则认为拟合是满意的,即认为该样本来自于特定的理论分布.)以下以Kolmogorov-Smirnov正态性检验为例说明:0101max|()()|,|()()|nniiniiinDFxFxFxFx()nnDD()nD例1.35位健康男性在未进食前的血糖浓度如下,试检验这组数据是否来自均值为,标准差为的正态分布.8068788926880788477818080779286768081757772819084868068778776777892758078解:建立假设检验:健康成年男性的血糖浓度服从正态分布:健康成年男性的血糖浓度不服从正态分布根据正态分布计算理论分布值如下表所示:健康男性血糖浓度观测频数与理论分布表0H1H血糖浓度次数累计次数经验分布函数标准化值理论分布68220.0571-2.00.0228-0.03430.022872240.1143-1.330.0918-0.0250.034775260.1714-0.830.20330.03190.089076280.2286-0.670.2514-0.02280.0800776140.4000-0.500.3085-0.09150.0799783170.4857-0.330.3707-0.1150-0.0293806230.657100.5000-0.15710.0143813260.74290.170.5675-0.1754-0.0896842280.80000.670.7486-0.05140.0057862300.85711.000.8413-0.01580.0413872320.91431.170.8790-0.03530.0219923351.0002.000.9772-0.02280.0629xnD0()()iniFxFx01()()iniFxFxfF()/nFxFnxz0()Fx其中,带的表示该列的最大值.由的标准化查附表可得在给定显著性水平下,查表得而故不能拒绝零假设,从而不能说明健康成年人的血糖浓度不服从正态分布.注:当样本容量较大时,可以用求得结果0()Fxxz0.0535(0.05)0.23D350.1754(0.05)0.23DD1.36()nDn例2.在检验一个车间生产的20个轴承外座圈的内径后得到下面数据(单位:mm)15.0415.3614.5715.5315.5714.6915.3714.6614.5215.4115.3414.2815.0114.7614.3815.8713.6614.9715.2914.95按照设计要求,这个内径应为mm,现希望检验一下这个数据是否来自均值为方差为的正态分布?150.215,220.20.04解:建立假设检验:轴承外座圈的内径服从正态分布:轴承外座圈的内径不服从正态分布根据正态分布计算理论分布值如下表所示:轴承外座圈的内径观测频数与理论分布表如书上图7.2所示:0H1HK-S检验和Pearson拟合检验的比较相同点:都是采用了实际频数与期望频数之差进行检验,均属于拟合优度检验.不同点:检验主要用于类别数据,而K-S检验主要用于有计量单位的连续和定量数据检验也可以用定量数据,但是必须将数据分组后才能获得实际的观测频数,而K-S检验可以直接对原始的个观测值进行检验,所以它对数据的利用较为完整.222n另外,对于拟合检验来说,一般要求大样本,且分组频数不小于5,从而使得样本信息受损,而K-S检验则无此要求,从而K-S检验较检验适用更广(当数据偏离正态分布太多时t检验失效,而K-S检验仍可适用),且比检验更有效.在用任何软件进行关于正态性检验时都需要弄明白是不是大样本近似,若是大样本近似,应该避免适用K-S检验.222

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功