第五章统计量及其分布§5.1总体与样本§5.2样本数据的整理与显示§5.3统计量及其分布§5.4三大抽样分布§5.5充分统计量§5.5充分统计量5.5.1充分性的概念例5.5.1为研究某个运动员的打靶命中率,我们对该运动员进行测试,观测其10次,发现除第三、六次未命中外,其余8次都命中。这样的观测结果包含了两种信息:(1)打靶10次命中8次;(2)2次不命中分别出现在第3次和第6次打靶上。第二种信息对了解该运动员的命中率是没有什么帮助的。一般地,设我们对该运动员进行n次观测,得到x1,x2,…,xn,每个xj取值非0即1,命中为1,不命中为0。令T=x1+…+xn,T为观测到的命中次数。在这种场合仅仅记录使用T不会丢失任何与命中率有关的信息,统计上将这种“样本加工不损失信息”称为“充分性”。样本x=(x1,x2,…,xn)有一个样本分布F(x),这个分布包含了样本中一切有关的信息。统计量T=T(x1,x2,…,xn)也有一个抽样分布FT(t),当我们期望用统计量T代替原始样本并且不损失任何有关的信息时,也就是期望抽样分布FT(t)像F(x)一样概括了有关的一切信息,这即是说在统计量T的取值为t的情况下样本x的条件分布F(x|T=t)已不含的信息,这正是统计量具有充分性的含义。充分性统计量是Fisher于1922年提出的概念。定义5.5.1设x1,x2,…,xn是来自某个总体的样本,总体分布函数为F(x;),统计量T=T(x1,x2,…,xn)称为的充分统计量,如果在给定T的取值后,x1,x2,…,xn的条件分布与无关.说明:参数θ和充分统计量T=T(x1,x2,…,xn)并不一定是一维的。这一点我们在后面的例5.5.5中就能看到。设总体X服从0-1分布b(1,θ),例5.5.2(P279)x1,x2,…,xn是来自该总体的容量为n的样本,则统计量样本均值Tx为充分统计量。5.5.2因子分解定理充分性原则:在统计学中有一个基本原则--在充分统计量存在的场合,任何统计推断都可以基于充分统计量进行,这可以简化统计推断的程序。充分性原则和另外一个完备性原则在我们寻求对总体中的未知参数作统计推断时扮演者重要角色。定理5.5.1设总体概率函数为p(x;),x1,…,xn为样本,则T=T(x1,…xn)为充分统计量的充分必要条件是:存在两个函数g(t;)和h(x1,…,xn),使得对任意的和任一组观测值x1,x2,…,xn,有p(x1,x2,…,xn;)=g(T(x1,x2,…,xn);)h(x1,x2,…,xn)(5.5.1)其中g(t,)是通过统计量T的取值而依赖于样本的。例5.5.4设x1,x2,…,xn是取自总体U(0,)的样本,即总体的密度函数为p(x;)=1/,0x0,其他于是样本的联合密度函数为p(x1;)…p(xn;)=0,其它(1/)n,0minximaxxi取T=x(n),并令g(t;)=(1/)nIt,h(x)=1,由因子分解定理知T=x(n)是的充分统计量。由于诸xi0,所以我们可将上式改写为p(x1;)…p(xn;)=(1/)nIx(n)例5.5.5设x1,x2,…,xn是取自总体N(,2)的样本,=(,2)是未知的,则联合密度函数为取t1=xi,t2=xi2,并令g(t1,t2,)=(22)−n/2exp−n2/(22)exp(t22t1)/(22),其中h(x)=1,由因子分解定理,T=(xi,xi2)是充分统计量。2/2212122/2222121(,,;)(2)exp()21(2)expexp222nnniinnniiiipxxxnxx是一一对应的,这说明在正态总体场合常用的进一步,我们指出这个统计量与(x,s2)(x,s2)是充分统计量。补充结论:设T=T(x1,…xn)为θ的充分统计量,是单值()ft可逆函数,则也是从分统计量。()fT由因子分解定理,该结论是显然的。思考:对于某总体F(x;),设x1,x2,…,xn是来自该总体的样本。令T=T(x1,x2,…,xn)=(x1,x2,…,xn),那么T是否是充分统计量?可以看到,由容量为n的样本自己所构成的随机向量总是充分统计量。但该充分统计量对我们没有任何帮助,他没有对样本作任何加工,没有对数据的处理作任何的简化。什么样的充分统计量才是最有价值的呢?显然,充分统计量的维数越小就越有价值,因为我们用尽可能少的量概括了样本中提供的信息。在大多数情形下,我们都能看到:维数与未知参数维数相等的充分统计量是存在的,即我们经常都能对T=(x1,x2,…,xn)作降维处理。但在某些场合,降维的充分统计量并不存在。如著名的威布尔分布当时,不存在任何低于n维的充分统计量。3n注意理解充分统计量的概念和作用,并掌握因子分解定理充分统计量总是针对我们所关心的总体的具体参数而言的充分统计量并不是唯一的作业:习题5.51,5