三种常用的不同变量之间相关系数的计算方法1.定类变量之间的相关系数.定类变量之间的相关系数,只能以变量值的次数来计算,常用λ系数法,其计算公式为:(3.2.12)式中,为每一类x中y分布的众数次数;为变量y各分类次数的众数次数;n为总次数。一般来说,λ系数在0~1之间取值,值越大表明相关程度越高。例如,性别与对吸烟的态度资料见表3—2。表3—2性别与对吸烟态度态度y性别x男女合计(Fy)容忍反对37158424557合计(Fx)5250102从y的分布来看,对吸烟的态度众数是“反对”,众数次数为57,即=57。再从x的每一个分组(男、女)中y的次数分布来看,男性中y的分布众数是“容忍”,次数为37();女性中y的分布众数是“反对”,次数为42();总次数为102(n)。于是,从计算结果可知,性别与对吸烟态度的相关程度为0.49,属于中等相关。2.定序变量之间的相关系数定序变量之间的相关测量常用Gamma系数法和Spearman系数法。Gamma系数法计算公式为:(3.2.13)式中,G为系数;Ns为同序对数目;Nd为异序对数目。所谓序对是指表明高低位次的两两配对,如果一对个案在变量x,y的分类表现位次一致,则为同序对;如果位次相反,则为异序对。G系数取值在—1--十1之间。G=1,表示完全正相关;G=-1,表示完全负相关;G=0,表示完全不相关;-1G0,表示负相关;0G1,表示正相关。Spearman系数法计算公式为:(3.2.14)式中,P为系数;D为所测定的两个数列中每对项目之间的登记差,这个差的正值之和等于负值之和;N为项数。系数p主要代表两个定序变量的等级相关程度,其取值范围和相关程度含义与G系数相同。3.定距变量之间的相关系数定距变量之间的相关测量常用Pearson系数法。对于未分组资料,Pearson系数法计算公式为:对于已分组资料,Pearson系数法计算公式为r系数取值范围和相关程度的含义与G系数相同。