数理统计学Statistics数理统计是运用概率论的知识,研究如何有效地对带有随机性的自然及社会现象进行数据收集、整理、分析和推断、预测的学科。回归分析方差分析统计分析假设检验参数估计统计推断主要内容第六章样本及抽样分布数理统计的基本概念一、总体和样本二、统计量及其分布1.将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体.整体和个体一、总体与样本某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体§1随机样本一般地,我们所研究的总体,即研究对象的某项数量指标X,它的取值在客观上有一定的分布,X是一个随机变量.我们对总体的研究就是对相应的r.vX的分布的研究。X的分布函数和数字特征分别称为总体的分布函数和数字特征。总体r.vX例如,考察某工厂10月份生产的灯泡的寿命所组成的总体。灯泡寿命落在各个时间区间内有一定的百分比,如灯泡寿命落在1000小时~1300小时的占灯泡总数的85%,落在1300小时~1800小时的占灯泡总数的5%,…。即灯泡寿命的取值有一定的分布。为推断总体的形态而从总体中抽取部分个体的过程称为“抽样”,所抽取的部分个体称为样本.样本中个体的数目称为样本容量.2.样本从国产轿车中抽5辆进行耗油量试验样本是随机变量.抽到哪5辆是随机的,容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).样本容量为5注:1在抽取或观察每个个体之前,X1,X2,…,Xn都是未知的,因而它们都是随机变量,(X1,X2,…,Xn)为n维随机变量.2当n次抽取或观察一经完成,我们就得到一组实数(x1,x2,…,xn),称其为样本观察值或样本值.2.独立性:由于抽样的目的是为了对总体的分布规律进行各种分析推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作“简单随机抽样”,抽取的样本(X1,X2,…,Xn)称为简单随机样本1.代表性:每次抽取或观察独立进行,其结果不受其它抽取或观察结果的影响.每个Xi都是X的一个代表,X的一个复制品。注:若总体的分布函数为F(x),则其简单随机样本的联合分布函数为F(x1)IF(x2)I…IF(xn)在上述条件之下,r.vX1,X2,…,Xn独立且与X有相同的分布.有限总体时,采用放回抽样所得的样本才是简单随机样本,今后只讨论简单随机样本.——除具有随机性,还满足:*样本的定义的简单得到的容量为、或总体或总体nXF)(,,,,21称为样本值它们的观察值nxxx又称.个独立的观察值的为nX,的随机变量是具有分布函数设FX,1X若,2X,、是具有同一分布函数FXn相互独立的,随机变量FXXXn为从分布函数则称,,,21,随机样本.简称样本.)(),,,(121*niinxFxxxF的一个样本,为,若FXXXn,,21,,,则21XX相互独立,nX,且它们的分布函数都是F所以的分布函数为,),,(21nXXX,具有概率密度又若fX的,则),,(21nXXX概率密度为.)(),,,(121*niinxfxxxf&简单随机抽样的定义获得简单随机样本的抽样方法称为简单随机抽样.我们抽样后得到的资料都是具体的、确定的值.如:我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.总体、样本、样本值的关系统计方法具有“部分推断整体”的特征.总体(理论分布)?样本样本值统计是从手中已有的有限的资料---样本值,去推断总体的情况---总体分布F(x)的性质.样本是联系二者的桥梁统计量及其分布注意:221XX212221212,3,XXXXXX例设(X1,X2)是从总体X~N(,2)中抽取的一个容量为2的样本,其中为未知参数,则1、统计量定义不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.X1/,统计量是独立同分布随机变量X1,X2,…,Xn的函数,因而它也是一个随机变量..都是统计量,不是统计量抽样分布,中不含未知参数若g),,,(,,,,2121nnXXXgXXXX的一个样本是来自总体设,,,,21的函数是nXXX.是一个统计量),,,(21nXXXg则称2、几种重要的统计量(样本数字特征)设(X1,X2,,Xn)为总体X的样本,则样本均值niiXXnS122)(11样本方差niiXXnS12)(11样本标准差,2,1,11kXnAnikik样本k阶(原点)矩nikikkXXnB1,2,1,)(1样本k阶中心矩niiXnX11niiXXnS122)(11.11122niiXnXn解设25瓶洗净剂灌装量为2521XXX,,,,它们是来自均值为3.0X方差为1的总体的样本,现在需要计算的是事件的概率,根据性质(2)有3.03.03.0XPXPnnXnP/3.0//3.0nn/3.0/3.08664.01)5.1(2125/13.02对于装25瓶的一箱而言,平均每瓶灌装量与标定值之差不超过0.3毫升的概率近似为0.8664.),(2N例1某公司用机器向瓶子里灌装液体洗净剂,规定每瓶装毫升,但实际灌装量有一定的波动,假定灌装量服从正态分布,方差瓶洗净剂的平均每瓶灌装量与标定值的概率是多少?=1,如果每箱装25瓶这样的洗净剂,试问这相差不超过0.3毫升2设总体X~N(μ,σ2),X1,X2,…,Xn为取自该总体X的样本.几种常用统计量及常用分布①标准正态分布及其上侧α分位数若P(Zzα)=α,则称zα为标准正态分布的上侧α分位数.1)(zzααXφ(x)其中nXZ定义设X~N(μ,σ2),则~N(0,1),对任意0α1,正态总体下的常用统计量及其分布设X~N(,2),(X1,X2…Xn)是它的一个样本,niiXnX11那么有),(~2nNX统计量的分布(随机变量函数的分布)又称抽样分布证:由概率论的知识知,服从正态分布.nnXEnXnEXEniinii1)(1)1()(11nnnXDnXnDXDniinii2221211)(1)1()(X样本均值的分布X(一)统计三大分布)(~22n记为2分布(1)定义:设相互独立,且都服从正态分布N(0,1),则称随机变量:服从自由度为n的分布.nXXX,,,21222212nXXX2xy0xy0n=1n=4xy0n=10概率密度函数图象3、常用统计量及其分布分布的概率密度为)(2n)(yf,0,2122e)2(21ynnyn0y.其他性质:②①设Y1~2(n1),Y2~2(n2),且Y1,Y2相互独立,则Y1+Y2~2(n1+n2),(可加性)(此性质可以推广到多个随机变量的情形.)mii12则),(~22iin设,独立相互并且),,2,1(2mii~).(212mnnn),(~22n若,)(2nE则.2)(2nD证明),1,0(~NXi因为)(2iXE所以)(iXD,1)(2iXD13.,,2,1ni224)]([)(iiXEXE,2)(2E故niiXE12)(,nniiXE12)(2DniiXD12)(.2nniiXD122分布的上分位点的点为2(n)分布的上分位点.)(2n)n(~22设,对于给定的正数(01),称满足条件n﹥45时,用近似公式:.)1,0(1221)(22分位点的上是其中Nznznx有表可查(P304附表5)05.0592.126P2即95.0733.28P2733.2)8(592.12)6(295.0205.0xx(n)ndyyfnP2)(22n=∞n=1概率密度函数图象1)图形关于t=0对称;2)t分布的的极限是标准正态分布,即2221)(limtnetf事实上,当n30时,两者就非常接近了.注:当n充分大时,t分布近似N(0,1)分布.但对于较小的n,t分布与N(0,1)分布相差很大.则称随机变量相互独立与并且设,YXnYNX),(~),1,0(~2nYXT服从自由度为n的t分布,记为Tt(n).又称Student分布.(2)t分布定义上分位点t(n)还有性质:当n45时,查表P303附表4当n45时,可利用N(0,1)近似,即t(n)≈Z,t1-(n)=-t(n)例05.07531.1)15(,7531.1)15(05.0tPt即X~t(n)Tα(n)t分布的上分位点t(n):对于给定的(01),称满足条件)()(ntdttfntntP的点t(n)为t分布的上分位点。),(212121)(),(),(nnFdyyfnnFnnFPF分布的上分位点:可查P305附表6,如F0.01(10,15)=3.8.(01)的点F(n1,n2)为F分布的上分位点.定义:设U~2(n1),V~2(n2),且U与V相互独立,则称r.v21//nVnUF服从自由度为(n1,n2)的F分布.(3)F分布),(~1),,(~1221nnFFnnFF则若F分布的上分位点有性质:),(1),(12211nnFnnF1、若X~N(,2),(X1,X2…Xn)为其样本,①与S2相互独立,②niiXnX11)1(~)1(222nSn)1(~/ntnSX212)(11XXnSnii与四、几个重要结论分别为样本均值与样本方差,则有X①的证明从略。②的证明如下:证明②:),(~2nNX)1,0(~/NnX)1(~)1(222nSn又与并且nX/相互独立22)1(Sn)1(~)()1/()1(/22ntSnXnSnnX从而由t分布的定义得例2在研究设计导弹发射装置时,弹着点偏离目标中心的距离服从正态分布,这里=100米2,现在进行了25次发射试验,表示这25次试验中弹着点偏离目标中心距离的样本方差,试求超过50米2的概率.),(2N22S2S解根据上述重要结论也即本定理6.1知:)1(~)1(222nSn于是502SP22250)1()1(nSnP975.012)24(1005024)24(22PP2S超过50米2的概率为0.9752、设总体XN(1,2),YN(2,2)而(X1,X2…Xn1)和(Y1,Y2…Yn2)分别是取自总体X和Y的样本,X与Y相互独立,则有)2(~11)()(212121nntnnSYX.,2)1()1(2221212222112本方差分别为这两个样本的样和其中SSnnSnSnS3、设总体XN(1,21),YN(2,22)而(X1,X2…Xn1)和(Y1,Y2…Yn2)分别是取自总体X和Y的样本,S12,S22分别表示它们的样本方差,且X与Y相互独立,则1,1~2121222221nnFSSF)1(~)1(1221211nSn)1(~)1(2222222nSn)1,1(~21212222211)1(1)1(222222121211nnFSSFnSnnSn)(1521XXX,,,)2,0(~2NX例3设是来