第八章数理统计初步§8.1数理统计基础知识§8.1.1总体、样本与统计量引例8.1某工厂为了检测一批出厂的十万只灯泡的寿命,出厂时随机抽取了1000只灯泡进行检测.引例8.2为了统计全国的人均消费,规定每个地区随机抽取千分之一的人口进行统计调查.在数理统计中我们把研究对象的全体称为总体,组成总体的每一单元称为个体,被抽取到的所有个体的集合称为样本.总体样本总体样本在进行统计抽样时,由于调查具有破坏性(如检测灯泡寿命、检验炸弹的威力等)或者总体所包含的个体数量非常庞大(如调查全国的人均消费水平、股票指数的变化等)等原因,不可能对所有个体进行观测.而只能抽取其中一部分样本进行观测.从总体中抽取样本时,为了使抽取的样本具有代表性,通常要求:1.抽取方法要统一,应使总体中每一个个体被抽到的机会是均等的.2.每次抽取是独立的,即每次抽样结果不影响其它各次抽样结果,也不受其它各次抽样结果的影响.满足以上两点的抽样方法称为简单随机抽样,由简单随机抽样得到的样本叫做简单随机样本,今后我们凡提到抽样及样本都是指简单随机抽样和简单随机样本.我们通常只关心总体的一个或几个指标,这些指标可用随机变量来表示.在对样本进行观测时,每个个体的取值结果都是一个随机变量.12(,,,)nXXXn个样本12(,,,)nxxx样本观测值表示样本样本的某种函数集中样本中我们关心的信息统计量“加工”“提炼”在引例8.1中,我们希望知道全体灯泡的平均寿命,一个简单的方法就是用样本的平均寿命去估计总体的平均寿命.在此过程中,我们将称为统计量.121000,,,XXX1210001000XXX1210001000XXX常用的统计量有:样本均值(9.1)样本方差(9.2)样本均方差(9.3)11niiXXn2211()1niiSXXn211()1niiSXXn§8.1.2统计量的分布统计量是随机变量,其概率分布又称抽样分布.这些分布在统计推断时起重要作用.下面我们介绍几种常见分布.设是X的一个样本,则或(9.4)一、样本均值的分布212~(,),(,,,)nXNXXX2~(,)XNn(0,1)~XNn设,对给定的,称满足条件(8.5)或(8.6)的点为标准正态分布的上分位点或上侧临界值,简称上点,(8.5)式的几何意义如图8-1所示.~(0,1)XN(01)aa{}aPXUa{}1aPXUaaUa()xa图8-1:OUxa称满足条件的点为标准正态分布的双侧分位点或双侧临界值,简称双点,其几何意义见图8-2所示.在统计中,可直接由(8.6)式通过查本书后附表1正态分布表求得,可由查表求得.2aPXUa2aUa/2a/2a()xO2aU2aUx图8-2:aU2aU22aaPXUa二、分布2设为取自正态总体的样本,则称为服从个自由度的分布,记作分布的概率密度函数为注①注①式中为函数:在的函数值.12(,,,)nXXX~(0,1)XN222212nxXXXn222~()xn12221,0()2()20,0nynyeynfyy()2n10()(0)xtxtedtx2nx2n=10n=4n=1图8-3:0.501357911131517y0.40.30.20.1()fx类似于标准正态分布,我们称满足:(8.7)的点为分布的上分位点或上侧临界值,简称上点,其几何意义如图8-4所示.这里是分布的概率密度.222()()()()aaxnPnnfydya2()an2a()fy2图8-4:()fyO2()axnya显然,在自由度取定以后,的值只与有关.2()anaa三、分布设,且X与Y相互独立,则称随机变量服从个自由度的分布或学生氏分布,记作.分布的概率密度函数为:其图形如图8-5所示t2~(0,1),~()XNYnXTYnnt~()Ttnt1221()2()(1)()()2nntfttnnn0.10.20.30.4-3-2-10123n=14n10n图8-5:其形状类似标准正态分布的概率密度的图形.当较大时,分布近似于标准正态分布.nt对于给定的,我们也称满足条件:(8.8)的点为分布的上分位点或上侧临界值,简称上点,其几何意义如图8-6所示:(01)aa()()()()aatnPtntnftdta()atnta图8-6:()ft()atntOaa由分布的对称性,也称满足条件:(8.9)的点为分布的双侧分位点或双侧临界值,简称双点,其几何意义如图8-7所示.图8-7:/2a/2a()ft/2()atntO在附表4中给出了分布临界值表.当时,可以用标准正态分布代替分布查的值,.t45n()atn()aatnXt2()()aPtntna2()atntat/2()atna四、F分布设,且与相互独立,则称随机变量服从第一自由度为、第二自由度为的分布,记作F分布的概率密度函数为:其中221122~(),~()VnVn1122VnFVn1V2V1n2nF12~(,)FFnn11211222(1),0()0,0nnnnAyyyfyny11212122()2()()()22nnnnAnnn其图形如图8-8所示.图8-8:012y2120nn225n210n类似于分布与分布,F分布的上分位点或上侧临界值简称上点是指满足条件:(8.10)的点,其几何意义如图8-9所示,其中为F分布的概率密度.a121212(,)(,)(,)()1aaFnnPFnnFnnfydyaa(0)12(,)aFnn()fya2t的值可由F分布表(附表5)查得:在附表5中所列的值都比较小,当较大时,可用下面公式(8.11)查F分布表得到12(,)aFnnaa112211(,)(,)aaFnnFnn图8-9:12(,)aFnnOy()fya8.1.3关于分布的几个性质性质8.1分布具有可加性.设,且相互独立,则性质8.2设为来自总体的样本,则:(1)样本均值与样本方差相互独立;(2)(8.12)222221122~(),~()xnxn2221212~()xxnn12(,,,)nXXX2~(,)XNX2S222122()(1)~(1)niiXXnSxn性质8.3设为来自总体的样本,则统计量(8.13)性质8.4设和分别来自正态总体和的样本,且它们相互独立,则统计量(8.14)其中,,分别为两总体的样本方差.12(,,,)nXXX2~(,)XN~(1)XtnSn121(,,,)nXXX122(,,,)nYYY21(,)N22(,)N121212()~(2)11wXYtnnSnn22112212(1)(1)2wnSnSSnn21S22S性质8.5设为正态总体的样本容量和样本方差;为正态总体的样本容量和样本方差,且两个样本相互独立,则统计量(8.15)21(,)N222,nS222(,)N2212122212/~(1,1)/SSFnn211,nS随堂练习1、设样本值如下:19.1,20.0,21.2,18.8,19.6,20.5,22.0,21.6,19.4,20.3.求样本均值,样本方差。2sx解:按定义,样本均值为111(19.120.0...20.3)1020.25niiXXn样本方差为:2212221()11(1.150.25...0.05)91.165niiSXXn2、设总体,(1)抽取容量为36的样本,求;(2)抽取容量为64的样本,求;(3)取样本容量n多大时,才能使4010.95Px2~(40,5)XN3843Px401Px解:若总体服从正态分布,其样本均值服从,经标准化有。2~(,)xNn2~(,)XN~(0,1)xNn(1)对于容量为36的样本43403840384355660.9916Px(2)对于容量为64的样本,4014015588(1.6)(1.6)0.8904xPxP(3)401401551210.955xPxPnnn11.965n所以96n3、设总体,己知样本容量n=24,样本方差求总体标准差大于3的概率。2~(,)XN212.5227s解:对于总体,样本方差满足2~(,)XN2222(1)~(1)nsn查自由度n=23的分布表得222222312.52272312.5227331(23)3210.10.9PPP