数理统计序概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从什么分布是未知的;产品是否合格服从两点分布,但参数——合格率p是未知的;数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。从第本章开始,我们学习数理统计的基础知识。主要有参数估计、假设检验、方差分析、回归分析等内容.本章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基础。学习的基本内容第六章样本及抽样分布6.1随机样本6.3抽样分布6.1随机样本1.总体、个体2.样本3.总体、样本和样本值的关系4.小结称总体中所含个体的数目为总体容量,总体容量有限的称为有限总体,总体容量无限的称为无限总体.总体1、总体、个体研究对象的全体称为总体(母体),总体中每个对象称为个体.研究某批灯泡的质量总体考察国产轿车的质量该批灯泡寿命的全体就是总体灯泡的寿命每公里的耗油量所有国产轿车每公里耗油量的全体就是总体每个个体具有的数量指标的全体就是总体.注意:今后不必区分总体和其相应的随机变量.并常用随机变量的记号或用其分布函数表示总体.比如说总体X或总体F(x).例:设某大学一年级学生的年龄分布如下年龄1819202122比例0.50.30.10.070.03若从该大学一年级学生中任意抽查学生的年龄,所得结果为一随机变量,记作X可见,X的概率分布反映了总体中各个值的分布情况.很自然地,我们就用随机变量X来表示所考察的总体.也就是说,总体可以用一个随机变量X或其分布来描述.X概率如X的分布函数和数字特征就是总体的分布函数和数字特征.样本中所包含的个体数目称为样本容量.但是,一旦取定一组样本,得到的是n个具体的数x1,x2,…,xn,按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息.为推断总体分布及各种特征,2、样本注:样本是随机变量容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).所抽取的部分个体称为样本.这一抽取过程称为抽样,称为样本(X1,X2,…,Xn)的一组观测值,简称样本值.若抽取的样本X1,X2,…,Xn满足下面两点:它可以用与总体同分布的n个相互独立的随机变量X1,X2,…,Xn表示.简单随机抽样1.独立性:X1,X2,…,Xn是相互独立的;由简单随机抽样得到的样本称为简单随机样本,2.重复性:Xi(i=1,2,…,n)与所考察的总体X同分布.约定:今后,说到“X1,…,Xn是来自某总体的样本”时,若不特别说明,就指简单随机样本.则其简单随机样本X1,…,Xn的联合分布函数为F*(x1,x2,…,xn)=简单随机样本是应用中最常见的情形,若总体X的分布函数为F(x),.)(1niixF若总体X的概率密度为f(x),则其简单随机样本的联合概率密度为.)(),,(11*niinxfxxfF(x1)F(x2)…F(xn)3、总体、样本、样本值的关系总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁.),,,(,),,,(,)0(2121的概率密度求样本是来自总体的样本布的指数分服从参数为设总体nnXXXXXXX解的概率密度为总体X,0,0,0,e)(/1xxxfx,,,,,21有相同的分布且与相互独立因为XXXXn的概率密度为所以),,,(21nXXX)(),,,(121niinnxfxxxf.,0,0,e1/)(n1其他ixxnii例1.),,,(,),,,(,10),,1(2121的分布律求样本是来自总体的样本其中服从两点分布设总体nnXXXXXXppBX解的分布律为总体X,,,,21相互独立因为nXXXiippiXP1)1(}{)1,0(i,有相同的分布且与X的分布律为所以),,,(21nXXX例2},,,{2211nnxXxXxXP}{}{}{2211nnxXPxXPxXPniiniixnxpp11)1(.}1,0{,,,21中取值在集合其中nxxxnnxxxxxxpppppp111)1(...)1()1(2211的分布律为所以),,,(21nXXX4.小结总体概念的三层含义)1(样本的二重性)2((3)简单随机样本:设X1,X2,…,Xn为来自总体X的样本.若X1,X2,…,Xn相互独立且与均总体X同分布,称X1,X2,…,Xn为来自总体X的简单随机样本..;;概率分布总体是一个随机变量或指标总体是一个或多个数量全体总体是我们研究对象的.,...,;,...,2121nnxxxXXX抽样之后样本是一组数量抽样之前样本是随机变在实际中遇到的总体往往是有限总体,它对应一个离散型随机变量;当总体中包含的个体的个数很大时,在理论上可认为它是一个无限总体.总体有限总体无限总体6.3抽样分布一、统计量二、抽样分布1.统计量的定义.),,,(,,,,,),,,(,,,,21212121计量是一个统则称不含未知参数中若的函数是的一个样本是来自总体设nnnnXXXggXXXXXXgXXXX.),,,(),,,(,,,,,,,21212121的观察值是则称的样本值是相应于样本设nnnnXXXgxxxgXXXxxx6.3抽样分布一、统计量?,,,,),(,,22321哪些不是些是统计量判断下列各式哪为未知为已知其中样本的一个是来自总体设NXXX,11XT,3212XeXXT),(313213XXXT),,,max(3214XXXT,2215XXT).(123222126XXXT是不是实例12.几个常用统计量的定义.,,,,,,,2121是这一样本的观察值是来自总体的一个样本设nnxxxXXX(1)样本均值;11niiXnX(2)样本方差niiXXnS122)(11.11122niiXnXn.11niixnx其观察值其观察值niixxns122)(11.11122niixnxn其观察值niixxns122)(11.11122niixnxn(3)样本标准差;11122niiXXnSS其观察值.)(1112niixxns(4)样本k阶(原点)矩;,2,1,11kXnAnikik其观察值.,2,1,11kxnanikik(5)样本k阶中心矩;,3,2,)(11kXXnBnikik其观察值.,3,2,)(11kxxnbnikik例在某工厂的轴承中随机取10只,测得其中量(以kg计)为2.362.422.382.342.402.422.392.432.392.37求样本均值,样本方差和样本标准差.解:);(39.21037.242.236.2kgx);(0008222.0)39.21037.242.236.2(1101222222kgs).(02867.00008222.0kgs二、抽样分布6.小结分布22.3.t-分布4.F-分布5.正态总体的样本均值与样本方差的分布1、正态分布抽样分布统计量的分布称为抽样分布.统计推断是通过统计量去进行的,所以统计推断的好坏取决于所用统计量的分布,因此寻求抽样分布就显得十分重要.当总体的分布函数已知时,抽样分布是确定的,但要求出统计量的精确分布,是困难的.本节介绍来自正态总体的几个重要统计量的分布.1、正态分布niiiniiiniiiaaNXa12211,~特别地,nNXnXnii21,~1则nXXX,,,21),(~2NXi若i.i.d.~(1)描述:若nXXX,,,21),,(2iiN~二、抽样分布则2、标准正态分布的分位数分布的上分位数.若,则称z为标准正态定义正态分布的双侧分位数.若,则称为标准,zXP2zXP2Z标准正态分布的分位数图形575.296.1645.1005.0025.005.0zzz-2-1120.10.20.30.4z•常用数字-2-1120.10.20.30.4/2-z/2=z1-/2/2z/2•-z/2•zXP2zXP).(~,,)1,0(,,,22222221221nnXXXNXXXnn记为分布的服从自由度为=统计量则称的样本是来自总体设.:222212变量的个数中右端包含独立指自由度nXXX分布22.分布的概率密度为)(2n.00,e)2(21)(21222其他xxnxfxnn.)(2图分布的概率密度曲线如n分布的性质2性质1).(~,,),(~),(~2122221222122221221nnnn则立独并且设)(2分布的可加性(此性质可以推广到多个随机变量的情形.)).(~,),,2,1(),(~21212222mmiiiiinnnmin则独立相互并且设性质2.2)(,)(),(~2222nDnEn则若证明),1,0(~NXi因为,1)()(2iiXDXE所以2242)]([)()(iiiXEXEXD,213.,,2,1niniiXEE122)(故niiXE12)(,nniiXDD122)(niiXD12)(.2n)(2分布的数学期望和方差分布的分位点:性质32.)()(d)()}({,10,22)(222分位点分布的上为的点称满足条件对于给定的正数nnxxfnPn.,,分位点的值得上可以通过查表求对于不同的n分位点满足的上设)(),(~22nnZ,d)()}({)(222nynnZP.,)(2可通过查表完成的值求n)8(2025.0)10(2975.0)25(21.0附表5只详列到n=40为止.,535.17,247.3.381.34例2..)12(21)(,22分位点是标准正态分布的上其中充分大时当znznn例如2205.0)99645.1(21)50(.221.67利用上面公式,费舍尔资料而查详表可得.505.67)50(205.0.,40分位点的近似值上时可以求得n性质4:费舍尔(R.A.Fisher)证明:).(~,/,,),(~),1,0(~2ntttnnYXtYXnYNX记为分布的服从自由度为则称随机变量独立且设t分布又称学生氏(Student)分布.学生氏资料xnxnnnxfnt,12π21)(212分布的概率密度函数为)(nt分布t3.图分布的概率密度曲线如t.0对称的显然图形是关于t当n充分大时,其图形近似于标准正态变量概率密度的图形.,eπ21)(lim22xtnxf因为,)1,0(分布分布近似于足够大时所以当Ntn.)1,0(,分布的尾部要长分布比但对于较小的Ntn.)()(d)()}({,10,)(分位点分布的上为的点称满足条件对于给定的ntnttxfnttPntt.分位点的值得上可以通过查表求由分布的对称性知).()(1ntnt.)(,45zntn时当分布的分位