秩方法的初步应用毕业生就业与学历的关系比较近年来,随着高校毕业生的数量不断增加,就业压力越来越大,很多人选择再深造,认为只要学历越高,就业就会越好。然而在本科毕业之后,再考取研究生,其投资成本大大加大的同时,就业却不一定会更好。近几年,我国很多省市出现研究生就业不如本科生,本科生就业不如专科生好,以及研究生期望收入相当本科生的现象。以下是广东省近年来高校毕业生初次就业率的数据。广东省毕业生初次就业率研究生本科生专科生2004年92.37%70.95%54.49%2005年81.72%72.23%65.47%2006年88.96%88.36%88.36%2007年86.41%90.66%87.55%2008年88.05%89.98%90.65%2009年88.15%86.91%90.49%2010年87.21%92.02%94.90%数据来自“广东省教育网”。根据以上数据,我们看到,广东省在2007年时本科生就业率超过研究生0.0425,2008年专科生就业率超过本科生0.0358,并且从2004年到2010年研究生、本科生、专科生的就业率差异越来越小,甚至在2010年研究生初次就业率最低,本科生次之,专科生最好。一、下面运用统计方法检验研究生、本科生、专科生的就业率差异性,由于其分布未知,采用非参数方法中的秩检验。首先介绍非参中的秩检验方法。1、Wilcoxon符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的。该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。2、正态记分检验秩定义了数据在序列中的位置和序,它们与未知分布F(x)的n个p分位数一一对应,分布函数是单调增函数,秩大意味着对应分布中较大的分位数,秩小则对应着分布中较小的分位点。不同的分布所对应的点虽然不同,但是序相同,即秩对应到不同分布的分布位数之间的单调关系不变。这种以正态分布作为转换记分函数,将Wilcoxon符号秩检验改进的方法称为正态记分检验。步骤如下:(1)把两样本混合并按升序排列(2)把每一个观测值在混合样本中的秩r替换为第r/(m+n+1)个标准正态分位数,记之为Wij(3)正态记分定义为2112111(1)njkijnjkijwijniTNwij(4)在零假设条件下,21Tk:,从而得到P值。3、两样本Brown-Mood中位数检验假设X1····,Xm,,Y1···,Yn是两组相互独立样本,来自两个分布F(x)和F(x-u),有相应中位数Mx,My.假设检验问题是:H0:Mx=My,H1:MxMy在零假设之下,如果两组数据有相同的中位数,则将两组数据混合后,两组数据的混合中位数与各自中位数相同,两组数据应该均匀的分布在Mxy两边。X和Y按照分布在Mxy两侧计数表XY总和MxyABtMXYCD(m+n)-(A+B)总和mnm+n=A+B+C+D检验统计量及分布:原假设成立时,A服从超几何分布()ktkmntmnCCPAKC大样本下用正态近似:3/()(0,1)()/()AmtmnZNmntmntmn:4、Mann-Whitey检验Brown-Mood中位数检验与符号检验的思想类似,仅仅比较了两组数据的符号,与单样本的Wilcoxon符号秩检验类似,把样本混合排列后得到秩的和,当秩的和过小时,怀疑零假设。其中样本秩和分别为Wx、Wy,在零假设情况下,Wxy与Wyx同分布,它称为Mann-Whitey统计量。5、Kruskal-Wallis检验:对原数据的秩进行方差分析的检验Kruskal—Wallis检验用于推断非正态分布定量变量或有序分类变量的多个总体分布位置是否有差别。K个连续总体分布形状相同、方差相等,只可能存在位置上的差异。来自总体Xi的K个独立随机样本容量分别为n1,n2,···,nk.其统计量为:21123(1)(1)kiRiKWNNNni对于置信水平,如果使KW的值大于其实现值的分配数目小于m则拒绝零假设,拒绝域位于检验统计量右尾。6、Friedman秩方差分析法当各处理的样本重复数据存在区组之间的差异时,必须考虑区组对结果的影响。对于随机区组的数据,可以采用两因素的方差分析,但方差分析要求实验误差是正态分布的,当数据不符合方差分析的正态前提时,采用Friedman秩方差分析法,此检验对试验误差没有正态分布的要求,仅仅依赖于每个区组内所观察的秩次。二、对大学生就业率差异性进行秩检验1、首先采用K-W秩检验H0:研究生、本科生、专科生就业率无显著差异,H1:研究生、本科生、专科生就业率有显著差异混合后排序赋秩研究生本科生专科生2004年20312005年5422006年1412.512.52007年61992008年1015182009年117172010年81621计算统计量为21123(1)(1)kiRiKWNNNni=0.07978零假设下,KW2(20),在=0.05时,查2表得到拒绝域为{P31.410},因为KW=0.07978,未落入拒绝域,不能拒绝原假设,即没有理由认为研究生、本科生、专科生就业率无明显差异。2、两样本的秩检验-------W-M-W检验显然上面的检验没能拒绝原假设,没有充足的理由认为三种毕业生就业有差异。再对研究生和本科生、本科生和专科生各自做两样本-W-M-W检验。(1)H0:研究生与本科生就业率无显著差异H1:研究生与本科生就业率有显著差异样本70.95%72.23%81.72%86.41%86.91%87.21%88.05%秩1234567来源BBAABAA样本88.15%88.36%88.96%89.98%90.66%92.02%92.37%秩891011121314来源ABABBBAAW=52,BW=53其中m=n=7大样本下:(1)/2527*15/20.0639(1)/127*7*15/12AWnNZmnNP=0.949,保留原假设,即研究生和本科生的就业率没差别。(2)H0:本科生与专科生生就业率无显著差异H1:本科生与专科生就业率有显著差异样本54.49%65.47%70.95%72.23%86.91%87.55%88.36%秩1234567.5来源CCBBBCB样本88.36%89.98%90.49%90.65%90.66%92.02%94.90%秩7.591011121314来源CBCCBBCBW=53.5,CW=51.5输入数据,运用SPSS软件,得出结果,统计量z=-0.128保留原假设,即认为本科生与专科生就业率无明显差异。三、通过以上秩检验,我们得出结论,对广东省2004-2010年高校毕业生的初次就业率进行秩检验,认为就业率无明显差异,那么在严峻的就业形势下,大学生的个人素质及能力要求越来越高,当代大学生应努力提高自身能力,在竞争中有一席之地。参考文献1、王星:《非参数统计》2、吴喜之赵博娟:《非参数统计》3、《概率论与数理统计》