6.2Kendall相关检验Spearman(斯伯曼/斯皮尔曼)秩相关分析模仿了Pearson(皮尔逊)相关的思想,Kendall(肯德尔)于1938年提出了另一种与Spearman秩相关相似的检验方法,他从两个变量是否协同一致的角度出发检验两变量之间是否存在相关性,其适用条件和Spearman秩相关检验相同.首先引入协同的概念(,)(1,2,,)iixyin定义:假设n对观测值,如果乘积对于,则称数对与满足协同性,或者说它们的变化方向一致.反之,则称数对不协同,表示变化方向相反.协同性测量了前后两个数对的秩大小变化为同向还是反向.1122(,),(,),,(,)nnxyxyxy()()0jijixxyy,,1,2,,jiijn(,)iixy(,)jjxyKendall检验统计量全部的数据所有可能前后对数共有对,用表示同向数对的数目,表示反向数对的数目,则Kendall相关系数统计量由二者的平均差定义如下:其中,(1)22nnncNdN(1)2cdnnNN2(1)/2(1)cdaNNSnnnn,11.cdSNN1)若所有的数对协同一致,则表示两组数据正相关2)若所有的数对都相反,则表示两组数据负相关3)Kendall为零时,表示数据中同向或反向的数对势力均衡,没有明显趋势,这与相关性的含义是一致的.(1)/2,0,1cdNnnN0,(1)/2,1cdNNnn如果定义则Kendall相关系数统计量又可定义为式中,是的核估计量,因而为U统计量1;()()0(,,,)0;()()01;()()0jijiijijjijijijixxyyXXYYxxyyxxyy12(,,,)(1)aijijijnXXYYnn(,,,)ijijXXYY(()()0)jijipxxyy定理:在零假设成立的条件下,1)2)关于原点O对称(1)(25)()0,()18nnnED大样本计算当样本容量n较大时,对于打结的情况,Kendall给出了调整后的结果为其中,是X观测值中第i组打结的个数,为Y观测值中第j组打结的个数.18(0,1)(1)(25)Nnnn(1)/2(1)/2(1)/2(1)/2biijjijSnnnnij当样本容量n较大时,相应的大样本近似公式为12(0,1)(1)(25)/18cdNNNnnntttt12(1)(25),(1)(25)(1)(1)/2(1)(1)(2)(1)(2)/9(1)(2)iiijjjijiijjijiiijjjijtttnntnnn其中易得,在没有打结的情况下,,且大样本近似也一样ab在实际问题中,不失一般性,假定已从小到大排列,因此协同性问题就转化为的秩的变化问题.令为的秩,因而x,y的秩形成,若记令,则Kendall统计量的值为ixiy12,,,nddd12,,,nyyy12(1,),(2,),,(,),1nddndin()(),1,2,,,1,2,,jijiiddjiiddjipIinqIin11,nniiiiPpQq(1)/2PQKnn也就是说,对于每一个,求当前位置后比大的数据的个数,将这些数相加所得就是,同理可计算.Kendall还经常用于分析列联表数据,度量两个有序变量的相关性,当列联表中的行列数目r和c较大时,使用Kendall更合适.bciyiycNdN22(),min(,)(2)cdcqNNqrcnqKendall检验结果当时拒绝零假设,当时不能拒绝零假设.临界值满足,由对称性得,K小于0时,取绝对值查表即可.KCKCC()pKC例:现在想研究体重和肺活量的关系,调查了某地10名女初中生的体重和肺活量的数据如下所示,,进行相关性检验.学生体重和肺活量比较表指标\学生编号12345678910体重x75958570766860668088肺活量y2.622.912.942.112.171.982.042.202.652.69解:建立假设检验问题为体重和肺活量没有相关关系体重和肺活量有相关关系计算每个变量的秩如下表:0:H1:H秩\学生编号78641593102体重x的秩12345678910肺活量y的秩25136471089和的求解方法如下:cNdN38,7,31,10,(1)10990cdcdNNSNNnnn秩128125533170436056416440773081002981010900合计387cNdN(,)iixy由公式得在给定显著性水平下,故拒绝零假设,认为体重和肺活量之间有相关关系2310.688990K0.050.467C0.68890.467KC由公式得在给定显著性水平下,故拒绝零假设,认为体重和肺活量之间有相关关系2310.688990K0.050.467C0.68890.467KC例2:为了研究某化学反应中成品的收率与温度之间的关系,记录了10次试验的数据(见下表):温度45525463626875769288成品的收益100110120130140150160170180190计算成品的收率与温度之间的Spearman秩相关检验和Kendall相关系数.成品的收率与温度之间正相关吗?