秩和比法RSR2015-1-23史晓涛评价方法系列之一RSR什么是“秩和比”(RSR)秩:样本秩注意:不同于线性代数中矩阵的秩和:求和秩的和:Rank-Sum比:一种运算Ratio秩和比是行(或列)秩次的平均值,是一个内涵丰富的统计量,表明不同计量单位多个指标的综合水平创始人:田凤调教授于1988年提出应用领域:•医疗卫生领域的多指标综合评价•统计预测预报•统计质量控制等方面。秩和比综合评价法基本原理是:在一个n行m列矩阵中,通过对每个元素的秩进行运算,获得无量纲统计量RSR;在此基础上,运用参数统计分析的概念与方法,研究RSR的分布;以及RSR值对评价对象的优劣直接排序或分档排序,从而对评价对象做出综合评价.什么是无量纲统计量:1.量纲和单位的区别:单位是物理学基本量的不同级别量纲是多个基本量之间的组合例如:长度的基本量是m长度的单位有mmcmmkm例如:速度v是长度单位和时间单位的组合v=l/t速度的量纲是m/s但速度的单位却有许多种组合2.有量纲量和无量纲量物理量分为两类:有量纲:有量纲量大小与量度所选单位有关如:长度时间速度无量纲:无量纲量与量度所选的单位无关如:角度应变:LLRSR就是一个无量纲量无量纲量并不是没有单位,它的单位是1样本秩rank的概念:12,,,nxxxn设是从一元总体抽取的容量为的样本,1(2)()(),,,nikxxxxx()其从小到大顺序统计量是.若,则称k是在样本中的秩,记作,ixiR1,2,,,iinRi对每一个称是第个秩统计量。12,nRRR,,,总称为之统计量。例如,对样本数据-0.8,-3.1,1.1,-5.2,4.2顺序统计量是-5.2,-3.1,-0.8,1.1,4.2而秩统计量是3,2,4,1,51.编秩将n个评价对象的m个评价指标排列成n行m列的原始数据表.编出每个指标各评价对象的秩。 ()ijnmRR得到秩矩阵,记为秩和比综合评价法的步骤:如何编秩:RSR法在最初创立时就是简单地用样本秩次来编秩,得到秩矩阵。这种方法简单易懂,操作方便,但也有很大缺点:1.第一是在指标转化为秩次时会使一些信息发生改变。2.第二是编秩时如何正确区分高优指标、低优指标及其组合(偏高优、稍高优、偏低优、稍低优等)改进编秩方法:对于第一个缺点:1.高优指标从小到大编秩2.低优指标从大到小编秩高优就是越越好的量,一般对应效益型指标,一个公司盈利越多越好,效益就是高优;低优就是越少越好的量,一般对应成本性指标,一个公司成本越低越好,成本就是低优。3.同一指标数据相同者,成为相持,编平均秩.例如,对样本数据-0.8,-3.1,1.1,-5.2,1.1顺序统计量是-5.2,-3.1,-0.8,1.1,1.1而秩统计量是3,2,4.5,1,4.5对于第二个缺点:解决较为复杂:见文章《RRS法中各指标按任意系数进行编秩的探讨》所以处理一般评价问题时,只解决第一个缺点就足够了2.计算秩和比(RSR):秩和比的计算常需按行(R)或按列(C)分别进行计算:公式1或公式2,式中m为指标数,n为分组数。一般都是使用行秩和比进行评价当给每一个样本秩附一个权值是,就可以求得加权秩和比(RSRw):式中w为权重系数。几个RSR的合并:各组RSR→R→合并RSR3.计算概率单位.编制得到RSR(或WRSR)频率分布表,列出各组频数fi计算各组的累计频数cf和累计频率p,将p转换为概率单位Probiti,Probiti为标准正态分布的pi分位数加5.秩矩阵加权秩矩阵4.计算直线回归方程.以累积频率所对应的概率单位Probiti为自变量,以RSRi(或WRSRi)值为因变量,计算直线回归方程,即()RSRWRSRabprobit5.分档排序.按照回归方程推算所对应的RSR(WRSR)估计值对评价对象进行分档排序.•请对某省10个地区孕产妇保健工作就3个指标进行综合评价第一步:编秩1.编秩标准:高优指标从小到大编秩,低优指标从大到小编秩,同一指标数据相同者编平均秩。2.根据专业知识:“产前检查率”为高优指标“孕产妇死亡率”和“围产儿死亡率”为低优指标编秩结果:第二步:计算秩和比并直接排序使用行秩和比:当计算指标权重不同时,计算加权秩和比:通过秩和比RSR值的大小,就可以对评价对象进行综合排序,这种利用RSR综合评价指标进行排序的方法称为直接排序。但是在通常情况下还需要对评价对象进行分档,特别是当评价对象很多时,如十几个或几百个评价对象,就需要通过分档排序找出RSR的分布。RSR值及直接排序表第三步:确定RSR的分布、计算概率单位(Probit)RSR的分布是指概率单位Probit表达的值特定的累计频率。步骤:1.编制RSR频数分布表,列出各组的频数f,计算各组的累计频数∑f;2.确定各组RSR的秩次范围R及平均秩次3.计算累计频率(/n)100%,最后的累计值按照(1-1/4n)校正;4.将百分率p换成概率单位probit:probit为p对应的标准正太分布的分位数u+5RR标准正太分布与分位数标准正态分布的密度函数与图像:分位数:当随机变量X的分布函数为F(x),实数α满足0α1时,α分位数是使P{Xu}=F(u)=α的数uProbit=u+5RSR分布与对应的probit值:按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果按照(1-1/4n)校正后的结果标准正太分布表第四步:计算直线回归方程以累积频率所对应的概率单位Probit为自变量,以RSR(或WRSR)值为因变量,计算直线回归方程。用Excel中的intercept函数求截距,slope函数求斜率即可可得:RSR=-0.61+0.22probit()RSRWRSRabprobit第五步:分档排序按照回归方程推算对应的RSR估计值对评价对象进行分档排序分档标准为标准正态分布的分位数,其范围在-3到3之间最好根据各分档情况下概率单位probit值,按照回归方程推算对应的RSR估计值对评价对象进行分档排序,具体分档数根据实际情况而定由分档结果可看出,10个地区中孕妇保健工作做的最好的差的是J地区,中档的是B、E、G、I、F,而C、H为上档某市人民医院1983年-1992年工作质量统计指标及权重系数见表1,其中为治愈率,为病死率,为周转率,为平均病床工作日,病床使用率,为平均住院日,这里和是成本型指标,其余为效益型指标。1x2x3x4x5x6x2x6x年度x1x2x3x4x5x6198375.23.538.2370.1101.510.0198476.13.336.7369.6101.010.3198580.42.730.5309.784.810.0198677.82.736.3370.1101.410.2198775.92.338.9369.4101.29.61198874.32.436.7335.391.99.2198974.62.237.5356.297.69.3199072.11.840.3401.7101.110.0199172.81.937.1372.8102.110.0199272.11.533.2358.197.810.4权重系数0.0930.4180.1320.1000.0980.159表1统计指标及权重系数年度x1x2x3x4x5x6WRSRi19836187.595.50.453851984824.56520.35821985103.51115.50.35975198693.537.5830.470719877695780.68051988454.522100.504219895773390.634019901.59101065.50.768419913869105.50.7169519921.51024410.55345表2编秩和加权秩和比的计算结果年度ficfipiprobitiWRSRfiti排序1983110.13.71840.4093101984120.24.15840.451291985130.34.47560.481481986140.44.74670.507271987150.550.531361988160.65.25330.555551989170.75.52440.581341990180.85.84160.611531991190.96.28160.6534219921100.9756.960.71801表3各组频数,累计频数,累积频率,概率单位,加权秩和比估计值求得一元线性回归方程为:WRSR=0.0552+0.0952probit计算得到的WRSR的估计值见表3,各年份工作质量排序见表3最后一列。计算过程如下:clearaw=load(‘zhb.txt’);%导入数据w=aw(end,:);%提取权重向量a=aw(1:end-1,:);%提取指标数据a(:,[2,6])=-a(:,[2,6]);%把成本型指标转换成效益型指标ra=tiedrank(a);%对每个指标值分别编秩,%即对a的每一列分别编秩[n,m]=size(a);%计算矩阵的维数RSR=mean(ra,2)/n;%计算秩和比w=repmat(w,[n,1]);%计算加权秩和比WRSR=sum(ra.*w,2)/n;p=[1:n]/n;%计算累计频率p(end)=1-1/(4*n);%修正最后一个累计频率%最后一个累积频率按1-1/(4n)估计probit=norminv(p,0,1)+5;%计算标准正态分布的p分位数+5X=[ones(n,1),probit'];%构造一元线性回归分析的数据矩阵[ab,abint,r,rint,stats]=regress(WRSR,X);%一元线性回归分析WRSRfit=ab(1)+ab(2)*probit;%计算WRSR的估计值[sWRSRfit,ind]=sort(WRSRfit,'descend');%对WRSR的估计值从大到小排序