一、次序统计量二、样本中位数和样本极差第1.4节次序统计量及其分布一、次序统计量1、次序统计量1212121212()()()(,,,),(,,,),(,,,)(,,),TnTnnTTnnXXXXxxxxxxXXXxxx设是从总体中抽取的一个样本是其一个观测值将观测值按由小到大的次序重新排列为当取值为时定义1212()()()()()(,,),(,,,)kkTnXxknXXX取值为由此得到称为样本的次序统计量.12(,,,)TnXXX特别地,.min1)1(称为最小次序统计量iniXX.max1)(称为最大次序统计量ininXX.),,()()2()1(称为其观测值对应的nxxx.),,,(:21)(个次序统计量的第样本kXXXXnk注.,,,,,,),,,()()2()1(21)(一般不相互独立并且它们也都是随机变量所以的函数都是样本由于每个nnkXXXXXXX定义1.1212,,,nXXX设样本按由小到达的顺序重排为12()()()nXXX1212()()()(),,,)(,,,)TTnnkXXXXXXXk则称(为样本的次序统计量,称为样本的第个次序统计量,1()(),nXX称为样本的最小次序统计量称为样本的最大次序统计量.2、次序统计量的性质定理1.19次序统计量是充分统计量证由充分统计量的定义可知,只需要证明其条件分布与总体分布无关即可.由于样本具有独立性与同分布性,因而1111()()()(){,,|,,}nnnnPXxXxXxXx1111()()()()()(){,,|,,}niinnnPXxXxXxXxc12112-(,,,)(,,,)!(!)niiinncn其中是的一个置换,这样的置换共,因而。由此可见,此条件分布与总体无关,故次序统计量是充分统计量.3、次序统计量的分布定理1.19()(Xfx设总体的分布密度为或分布函数12(),,,,nkFxXXXXkX为为来自总体的样本,则第个次序统计量的分布密度为111()!()[()][()]()()!()!kknkXnfxFxFxfxknk12,,,.kn其中证根据分布函数的定义,可以得到11()()()()()(){}{()knXkiinikFxPXxPXxXXx11()()(){}{}niinikPXxXPXx1212()(),,,.{}(,,,)()(,()),nnTnnvxxxxxxXnXxXXXxvxBnFx设表示中不超过于的个数它表示的是总体作次重复独立观测时,事件出现的次数,也就是样本观测中不超过的个数,因而因此111()()()()(){}{}={()}{()}knXiiniknikFxPXxXPXxPvxiPvxn11=[()][()]niininikCFxFx1011()!=()d()()!()!Fxknkntttknk利用分部积分因此111!()=(())(())()()!()!kknkXnfxFxFxfxknk()11121()()()()[()]()nXXfxnFxfx最小次序统计量的分布密度为11()()()()[()]()nnnXXfxnFxfx最大次序统计量的分布密度为说明例1(p30例1.18)1201()[,],(,,,),.nkXXXXXX设总体服从区间上的均匀分布为总体的样本试求的分布解1010,(),Xxfx总体的分布密度为其他000111,(),,XxFxxxx的分布函数为111!()=(())(())()()!()!kknkXnfxFxFxfxknk()11011!=()(),.()!()!knknxxxknk定理1.20()(Xfx设总体的分布密度为或分布函数1212()(),,,,(,,,)nTnFxXXXXXXX()()为为来自总体的样本,则次序统计量的联合分布密度为121120!(),(,,,),niininnfyyyyfyyy其他,证明省略例2(p30例1.19)120[,],(,,,),.nXXXXX设总体服从区间上的均匀分布为总体的样本试求样本的联合分布解100,(),Xxfx总体的分布密度为其他121200!,,(,,,),nnnnyyyfyyy样本的联合分布为其他,定理1.21()(Xfx设总体的分布密度为或分布函数121()(),,,,(,)nTnFxXXXXXX()为为来自总体的样本,则次序统计量的联合分布密度为1210()()(,)()[()()]()(),(,),nnXXnnFyFxfxfyxyfxy其他,证根据分布函数的定义可得11()()(,)()()(,){,}nXXnFxyPXxXy以下分两种情形讨论:1()xy当时,11()()(,)()()()(,){,}{}nXXnnFxyPXxXyPXy11()()(){,,}{}[()]nnniiPXyXyPXyFy2()xy当时,11()()(,)()()(,){,}nXXnFxyPXxXy1111()()()()()()()()(){}{,}{,}{,}{,,}nnnnnXyXxXyXxXyXxXyxXyxXy又由于因而1()()(,)[()](,)[()()]nnnXXFyFxyFyFx所以1()()(,)(,)[()][()()]nnnXXFxyFyFyFx于是可以得到其联合分布密度为112210()()()()(,)(,)(,)(,)()[()()]()(),,nnXXXXnFxyfxyxynnFyFxfxfyxy其他,二、样本中位数和样本极差1212()()(),,,)(,,,)TnTnXXXXXX设(为样本的次序统计量,样本的中位数定义为1212212()()()[],nnnXnXXXn,为奇数,为偶数,1、样本中位数定义其观测值为1212212()()()[],nnnxnxxxn,为奇数,为偶数,2、样本中位数的意义样本中位数主要用来描述样本位置的特征,具有和样本均值类似的含义,但它不受样本异常值的影响,同时也容易计算,也可以作为总体均值的估计.缺点是分布不容易计算,因而在理论讨论时,带来一定困难.3、样本极差1212()()(),,,)(,,,)TnTnXXXXXX设(为样本的次序统计量,样本的极差定义为定义111()()maxminniiininRXXXX其观测值为111()()maxminniiininrxxxx4、样本极差的意义样本极差主要用来描述样本变化幅度以及离散程度的特征,具有和样本方差类似的含义,但它受样本异常值的影响较小,同时也容易计算,也可以作为总体均方差的估计.在实际中应用比较广泛.例3(p32例1.20)从总体中抽取容量为6的样本,测得样本值为32,65,28,35,30,29试求,样本中位数、样本均值、样本极差、样本方差、以及样本标准差。解首先将样本观测值进行排序,可得28,29,30,32,35,65,则341312()()()xxx样本中位数:6113656.iixx样本均值:1616652837maxminiiiirxx样本极差:62211129546.niisxx样本标准差:6222111675836.niisxx样本方差:再见