第六章样本与抽样分布数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势因此.在对随机变量的研究中,确定某些数字特征是重要的.其中最常用的是期望和方差学习统计无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:SAS,SPSS,STAT等,都可以让你快速、简便地进行数据处理和分析.概述数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.它们构成了统计推断的两种基本形式.这两种推断渗透到了数理统计的每个分支.现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法.因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的.概括起来可以归纳成两大类:参数估计──根据数据,用一些方法对分布的未知参数进行估计.假设检验──根据数据,用一些方法对分布的未知参数进行检验.总体:研究对象的某项数量指标的全部可能的观察值某学校男生的身高的全体一个总体,每个男生的身高是一个个体。某工厂生产的灯泡的寿命是一个总体,每一个灯泡的寿命是一个个体;个体:每一个可能观察值为个体。容量:总体所包含的个体的个数称为总体的容量有限总体:容量有限的称为有限总体无限总体:容量无限的称为无限总体§6.1随机样本nXX,1则称为从总体X中得到的容量为n的简单随机样本,简称为样本,其观察值称为样本值。nxx,1简单随机样本:设X是具有分布函数F的随机变量,若是具有同一分布函数F的相互独立的随机变量,nXX,1样本:被抽取的部分个体叫做总体的一个样本总体一般被看作随机变量niinxFxxF11*)(),,(niinxfxxf11*)(),,(定理:若为X的一个样本,则的联合分布函数为:nXX,,1nXX,,1若设X的概率密度为f,则的联合概率密度为:nXX,,1§6.2抽样分布一.概念二.来自正态总体的几个常用统计量的分布一.概念x1,x2,…,xn是相应于样本X1,X2,…,Xn的样本值,则称g(x1,x2,…,xn)是g(X1,X2,…,Xn)的观察值。注:统计量是随机变量。是一统计量。若X1,X2,…,Xn是来自总体X的一个样本,g(X1,X2,…,Xn)是X1,X2,…,Xn的函数,不含任何未知参数,则称g(X1,X2,…,Xn)若g中1.设为来自总体的一个样本,nXX,1),(~2NX已知,未知其中2,问下列随机变量中那些是统计量..)(;)(;;2122111nnXXXXnXXXXnnnn思考?2.常用统计量样本均值样本方差niiXnX11niiXXnS122)(11它反映了总体均值的信息它反映了总体方差的信息niiXXnSS122)(11样本标准差:样本k阶原点矩样本k阶中心矩nikikXnA11nikikXXnB1)(1k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息它们的观察值分别为:niixnx11][11)(11122122niiniixnxnxxnsniixxns12)(112,1,11kxnanikik2,1,)(11kxxnbnikik样本均值样本方差样本标准差样本k阶矩样本k阶中心矩依概率收敛的序列性质知道),,,(),,,(2121kPkgAAAg时,则当存在,记成阶矩的若总体nXEkXkk)(,,2,1,kAkPk为连续函数g证同分布独立且与XXXXn,,,21kknkkXEXEXE)()()(21同分布独立且与kknkkXXXX,,,21由辛钦定理,,2,1,kAkPk说明3.经验分布函数与总体分布函数F(x)相对应的统计量的一个样本是总体设FXXXn,,,21的随机变量的个数中不大于表示用xXXXxxsn,,,),(21定义经验分布函数为xxsnxFn),(1)()(,3213xFF经验分布函数,,具有一个样本值设总体的观察值)(3xF2,121,32,1,0)(3xxxxF若若若,1,0x若21,31x若32,32x若3,1x若)(,2113xFF经验分布函数,,具有一个样本值设总体的观察值的一个样本值是总体一般,设Fxxxn,,,21并重新编号按自小到大的次序排先将,,,,21nxxx)()2()1(nxxx设为的观察值为则经验分布函数)(xFn)()1()()1(,1,,,0)(nkknxxxxxnkxxxF若若若对于经验分布函数)(xFn格里汶科在1933年证明了如下定理即一致收敛与分布函数以概率时,当对一切实数),(1)(xFxFnxn1}0)()(suplim{xFxFPnxn统计量是样本的函数,它是一个随机变量,统计量的分布称为抽样分布。X1,X2,…Xn是来自总体N(0,1)的样本,则称统计量222212nXXX二.来自正态总体的几个常用统计量的分布服从自由度为n的2分布.(一)2分布记为2~2(n).2分布是由正态分布派生出来的一种分布.1.定义及概率密度2分布的密度函数为000)2(21),(2122xxexnnxfxnn来定义.其中伽玛函数通过积分0,)(01xdttexxt)(x)()1(xxx!)1(nn)21(2分布的密度函数的图形如右图.),,(2N(1)设相互独立,都服从正态分布nXXX,,,21则21222~)(1nniiX22121~nnXX,~,~222121nnXX(2)设且X1,X2相互独立,则分布的可加性22.)()(222212nXXXEE)()()(22221nXEXEXE)(2iXnE})]([)({2iiXEXDnnn)01(2)()(222212nXXXDD)()()(22221nXDXDXD)(2iXnD})]([)({224iiXEXEn2241212dxexnx13nn2nDnE2)(,)(223.期望和方差)}({)10(22nP,称满足条件:对于给定的。分位点上分布的为的点)()(22nn分位点。是标准正态分布的上充分大时,当znznn22)12(21)(24.上分位点nYXt/(二)t分布设X~N(0,1),Y~2(n),且X,Y相互独立,称统计量服从自由度为n的t分布.记为t~t(n).T的密度函数为:212)1()2(]2)1[(),(nnxnnnnxf1.定义及概率密度当n充分大时,其图形类似于标准正态分布密度函数的图形.2221),(xnenxfLimt分布的密度函数关于x=0对称,且当n充分大时,t分布近似N(0,1)分布.但对于较小的n,t分布与N(0,1)分布相差很大.)}({)10(nttP,称满足条件:对于给定的。分位点上分布的为的点tnt)()()(1ntnt:由概率密度的对称性知.)(45zntn时,当)(nt)(1nt2.上分位点21//nVnUF(三)F分布设U~2(n1),V~2(n2),且U,V相互独立,服从自由度为(n1,n2)的F分布.记为F~F(n1,n2).F1~),(12nnF1.定义).,(~/1),,(~F1221nnFFnnF则若12nUnV称统计量),(/1),(12211nnFnnF结论:)},({)10(21nnFFP,称满足条件:对于给定的。分位点上分布的为的点FnnF),(21),(21nnF2.上分位点}),(11{211nnFFP所以),(1),(),(~/12111212nnFnnFnnFF所以,又因为),(1),(12211nnFnnF即357.080.21)12,9(1)9,12(05.095.0FF例:}),(11{1211nnFFP1)},({211nnFFP}),(11{211nnFFP,)(XE特别地,若X~N(,2),有),(~2nNX(四)正态总体的样本均值与样本方差的分布设总体X的均值为,方差为2,X1,X2,…Xn是X的一个样本.nXD2)()1,0(~NnXn取不同值时样本均值的分布X.2相互独立与SX对于正态总体的样本方差S2,有以下定理:定理1X1,X2,…Xn是总体N(,2)的一个样本.(1)(n-1)S2/2~2(n-1)(2)n取不同值时的分布22)1(Sn设X1,X2,…,Xn是取自正态总体),(2N的样本,2SX和分别为样本均值和样本方差,则有)1(~/ntnSX定理2证明定理2:)1,0(~/NnX),(~2nNX由定理1,(n-1)S2/2~2(n-1))1(~)1()1(/22ntnSnnX即)1(~/ntnSXXY由t分布的定义,定理3(两总体样本均值差的分布)221212222112121~112)1()1()(nntnnnnSnSnYX,,设),(~),(~2221NYNXYX和分别是这两个样本的样本均值,且X与Y独立,X1,X2,…,1nX是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,则有2221SS和Y1,Y2,…,2nY是定理4(两总体样本方差比的分布)1,12222212121~nnFSS,设),(~),,(~222211NYNXYX和分别是这两个样本的且X与Y独立,X1,X2,…,1nX是取自X的样本,取自Y的样本,分别是这两个样本的样本方差,均值,2221SS和则有Y1,Y2,…,2nY是样本假设某物体的实际重量为,但它是未知的.现在用一架天平去称它,共称了n次,得到X1,X2,,Xn.根据基本定理,例1,去估计X),(2nNX~通常我们用样本均值:假设每次称量过程彼此独立且没有系统误差,则可以认为这些测量值都服从正态分布N(,2),方差2反映了天平及测量过程的总精度.如=0.1时,若取n=10.则:“3σ规则”于是根据第二章讲过:),0(,),(22nNXnNX~~%7.993nXP.3越来越小n随着称量次数n的增加,这个偏差界限还是=0.1时,若取n=100.则:.095.0101.03.03.01001.03在设计导弹发射装置时,重要事情之一是研究弹着点偏离目标中心的距离的方差.对于一类导弹发射装置,弹着点偏离目标中心的距离服从正态分布N(,2),这里2=100米2.现在进行了25次发射试验,用S2记这25次试验中弹着点偏离目标中心的距离的样本方差.求:S2超过50米2的概率.解:例2根据基本定理2122/)1(nSn~查附表4,得到:}50{2SP975.012}50{2242PSP10050242125P2225