Shapiro-Wilk检验含义:Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n时所对应的系数αi,根据特定公式计算出检验统计量W.最后查特定的正态性W检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布.W检验全称Shapiro-Wilk检验,是一种基于相关性的算法。计算可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好。w检验是检验样本容量8≤n≤50时,样本是否符合正态分布的一种方法。计算式为:其检验步骤如下:①将数据按数值大小重新排列,使x1≤x2≤…≤xn;②计算上式分母;③计算a值,可查表得出;④计算检验统计量W;⑤若W值小于判断界限值Wα(可通过查表求得),按表上行写明的显著性水平α舍弃正态性假设;若WWα,接受正态性假设。【转】常用的相关系数(Pearson相关、Spearman相关、Kendall相关)标签:相关系数2013-01-1616:41阅读(2063)评论(0)常用的相关系数Pearson相关系数亦称积差相关系数(coefficientofproduct-momentcorrelation),用r表示样本相关系数,P表示总体相关系数。它是说明有直线关系的两变量间,相关关系密切程度和相关方向的统计指标。计算公式:注意事项:ü变量是正态分布,没有奇异值噪音。所以做相关性分析之前要去除可能的奇异值,而且如果不是正态分布,可以通过取对数来近似获得。ü另外,对于某些数据样本,考查两个变量之间的相关性,按照某类属性将样本分割,分别考查,或许会获取更有价值的知识。Spearman相关系数又称秩相关系数、等级相关系数,或顺序相关系数,是利用两变量的秩次大小作线性相关分析,具体是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。Spearman对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。计算等级相关系数,可以将数据变换成等级以后用原有的相关系数公式计算,也可以将算出每一对样本的等级之差di,然后用下列公式计算,所以又称为“等级差数法”。Kendall相关系数:肯德尔系数又称和谐系数(theKendallcoefficientofconcordance)是表示多列等级变量相关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让K个被试(或称评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)好坏、优劣、喜好、大小、高低等排出一个等级顺序。因此,最小的等级序数为1,最大的为N,这样,K个评价者便可得到K列从1至N的等级变量资料,这是一种情况。另一种情况是一个评价者先后K次评价N件事物或N件作品,也是采用等级评定的方法,这样也可得到K列从1至N的等级变量资料。这类K列等级变量资料综合起来求相关,可用肯德尔系数。如欲考察几位老师对多篇作文的评分标准是否一致(又称评分者信度),就应该使用肯德尔系数。德尔和谐系数常用符号W表示。其公式为:Ri为每一件被评价事物的K个等级之和,N为被评价事物的件数即等级数,K为评价者的数目或等级变量的列数。W值介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。这种方法的原理是基于这样一种思想:如果各列变量完全一致,那么各被评价的事物(或人),其各评价者所评的等级应该相同,其等级和的最大方差即最大可能的S应为K2(N3-N)/12。如果评价的等级不同,则S变小,一致性程度降低,如果完全没有相关,则所评各等级之和应该相等,其最大可能方差(S)应为零,这样实际资料等级和的方差与最大可能的方差的比值,便是和谐系数,其值必介于0与1之间。