第六章:样本和抽样分布一个统计问题有它明确的研究对象.1.总体研究对象全体称为总体(母体).总体中每个成员称为个体.一、总体和样本总体可以用随机变量及其分布来描述.例如:总体X为某批灯泡的寿命,为推断总体分布及各种特征,从总体中抽取n个个体,所抽取的部分个体称为样本.样本中所包含的个体数目n称为样本容量.2.样本2(4000,20).XN样本的二重性:抽样之前,样本为随机变量,记X1,X2,…,Xn.抽样之后,样本为一组数值,记x1,x2,…,xn.2.独立性:X1,X2,…,Xn是相互独立的随机变量.“简单随机抽样”,要求抽取的样本满足:1.代表性:X1,X2,…,Xn中每一个与所考察的总体有相同的分布.说明:我们所考虑的都是简单随机抽样的样本。从而有:X1,X2,…,Xn独立同分布,与总体分布相同。例1设X1,X2,X3是取自正态总体),(2N的样本,写出样本X1的概率密度函数。221()()exp22xfxxR二、统计量12,,,nXXX12(,,,)nfxxx设为总体X的样本,为一个n元连续函数,若样本函数12(,,,)nfXXX不含任何未知参数,则称12(,,,)nfXXX为统计量.例2设X1,X2,X3是取自正态总体),(2N的样本,指出下列哪个不是统计量.12312222123123111.()2.(2)3313.max(,,)()4.XXXXEXXXXXXX,已知,未知2几个常见统计量样本均值修正的样本方差niiXnX112211ˆ()1niiSXXn样本成数11ˆniipXn修正的样本标准差2211ˆˆ()1niiSSXXn三.抽样分布统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做“抽样分布”.1.样本均值的正态分布a.单个正态总体下的样本均值的分布211(,).niiXXNnn设总体X服从正态分布2(,),N12,,,nXXX为来自总体的一个样本,定理1.则X为样本均值,b.两个正态总体下的样本均值的分布22121212(,).XYNnn设总体X服从正态分布2(,),11N112,,,nXXX为分别来自X与Y的样本,X,Y定理2.相互独立,总体Y服从正态分布2(,),22N212,,,nYYY和,XY分别为它们的样本均值,则c.非正态总体下的样本均值的分布211(,).niiXXNnn定理3.设总体X为任意总体,其2,,EXDX12,,,nXXX为来自总体的一个样本,则222ˆ,,.EXDXESn且n较大时,近似地有__.n为样本均值,要使X2()0.1EX成立,则样本容量2~(,2)XN12(,,,)nXXX例3设为来自母体X的样本,n402(20,3)N122,,XXX51625117182iiiiPXX((.).280997)例4设总体X服从正态分布,来自总体X,计算.2(30,3)N1220,,XXX1225,,YYY0.4XY((.).0444067)设总体X和Y相互独立,且都服从正态分布,和是分别来自X和Y的样本,求的概率。例5定理4(样本方差的分布)222122()ˆ(1)(3)~(1).niiXXnSn设X1,X2,…,Xn是来自正态总体),(2N的样本,2ˆXS和分别为样本均值和修正的样本方差,则有2ˆ(2).XS与独立2212()(1)~().niiXn2.样本方差的卡方分布定理5(单正态总体样本均值的t分布)设X1,X2,…,Xn是取自正态总体),(2N的样本,2ˆXS和分别为样本均值和修正的样本方差,则有~(1)ˆXtnSn3.样本均值的学生氏分布定理6(两总体样本均值差的t分布)22121211221212()~(2)ˆˆ(1)(1)112XYtnnnSnSnnnn,,设),(~),(~2221NYNX两个样本独立,样本修正的样本方差,则有2212ˆˆSS和X1,X2,…,1nX是来自X的样本,是取自Y的样本,Y1,Y2,…,2nYYX和分别是这两个样本的样本均值,是这两个设两样本相互独立,定理7(两总体样本方差比的F分布)221122~(,)~(,)XNYN,,YX和分别是这两个样本的X1,X2,…,1nX是来自X的样本,是取自Y的样本,为这两个样本修正的样本方差,则有2212ˆˆSS和Y1,Y2,…,2nY样本均值,21112222ˆ~(1,1)ˆ22SFnnS4.样本方差比的F分布