样本及抽样分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第六章样本及抽样分布【基本要求】1、理解总体、个体和样本的概念;2、理解样本均值、样本方差和样本矩的概念并会计算;3、理解统计量的概念,掌握几种常用统计量的分布及其结论;4、理解分位数的概念,会计算几种重要分布的分位数。【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2分布,t分布,F分布;分位数的理解和计算。【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。【学时分配】4学时【授课内容】§6.0前言前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。§6.1随机样本2一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。例1:考察一块试验田中小麦穗的重量:X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x3对应的分布:xNdtex重量xPxFxt0),(~21}{)(22)(22总麦穗数的麦穗数例2:考察一位射手的射击情况:X=此射手反复地无限次射下去所有射击结果全体;每次射击结果都是一个个体(对应于靶上的一点)个体数量化未中射中01x1在总体中的比例p为命中率0在总体中的比例p1为非命中率总体X由无数个0,1构成,其分布为两点分布),1(pBpXPpXP1}0{,}1{2.样本与样本空间为了对总体的分布进行各种研究,就必需对总体进行抽样观察。抽样——从总体中按照一定的规则抽出一部分个体的行动。一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。按照一定规则从总体X中抽取的一组个体),,,(21nXXX称为总体的一个样本,显然,样本为一随机向量。为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行n次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了nXXX,,,21的分布相同,与总体一样。②独立性:nXXX,,,21相互独立。那么,符合“代表性”和“独立性”要求的样本),,,(21nXXX称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,无放回的抽样不能保证nXXX,,,21的独立性;但对无限总体而言,无放回随机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。4对每一次观察都得到一组数据(nxxx,,,21),由于抽样是随机的,所以观察值(nxxx,,,21)也是随机的。为此,给出如下定义:定义2:设总体X的分布函数为)(xF,若nXXX,,,21是具有同一分布函数)(xF的相互独立的随机变量,则称(nXXX,,,21)为从总体X中得到的容量为n的简单随机样本,简称样本。把它们的观察值(nxxx,,,21)称为样本值。定义3:把样本(nXXX,,,21)的所有可能取值构成的集合称为样本空间,显然一个样本值(nxxx,,,21)是样本空间的一个点。注:样本具有双重性,在理论上是随机变量,在具体问题中是数据。二、样本的分布:设总体X的分布函数为)(xF,(nXXX,,,21)是X的一个样本,则其联合分布函数为:)x,,x,x(Fn*21=ni1)(ixF。例3:设总体),,(,),1(~21nXXXpBX为其一个简单随机样本,则样本空间}n,,,i;,x)x,,x,x{(in211021,因为1{}(1)xxPXxpp,0,1x所以样本的联合分布列为:11221122{,,,}{}{}{}nnnnPXxXxXxPXxPXxPXxnixppppppixxxxxxnn,,2,11,0)1()1(.)1(11122115§6.2抽样分布0、引言有了总体和样本的概念,能否直接利用样本来对总体进行推断呢?一般来说是不能的,需要根据研究对象的不同,构造出样本的各种不同函数,然后利用这些函数对总体的性质进行统计推断,为此,我们首先介绍数理统计的另一重要概念——统计量。一、统计量(随机变量)定义1:设12(,,,)nXXX是来自总体X的一个样本,12(,,,)ngXXX是样本的函数,若g中不含任何未知参数,则称g(nXXX,,,21)是一个统计量。设12(,,,)nxxx是对应于样本12(,,,)nXXX的样本值,则称12(,,,)ngxxx是12(,,,)ngXXX的观察值。下面列出几个常用的统计量。1、样本均值与样本方差(随机变量)定义2设(nXXX,,,21)是来自总体X的一个样本,称n1iiXn1X为样本均值。)XnXnX(n)XXXX(n[)XX(nSniniiniiii211221222221121111)]XnX(nnii21211为样本方差。niiXXnSS122)(11为样本标准差。样本均值与样本方差分别刻划了样本的位置特征及样本的分散性特征。2.样本矩(r.v)6设总体X的分布函数为)(xF,则称)X(Emkk(假设它存在)为总体X的k阶原点矩;称]))X(EX[(Ekk为总体X的k阶中心矩。把总体的各阶中心矩和原点矩统称为总体矩。特别地:1m=)(XE;)(2xD是总体X的期望和方差。定义3:设)X,,X,X(n21是来自总体X的一个样本,则称nikikXnA11,k=1,2,3……;为样本的k阶原点矩(随机变量)nikikXXnB1)(1,k=1,2,3……;为样本值的k阶中心矩(随机变量)。特别地,XA1,但2B与2S却不同,由2S与2B的计算式可知:221SnnB,当n时,2B=2S,所以常利用2B来计算S(标准差)。设)x,,x,x(n21为样本)X,,X,X(n21的观测值,则样本矩对应观测值分别为:niixnx11;2s=nii)xx(n1211;nii)xx(nss12211;nikikxna11;nikikxxnb1)(1;k=1,2,3……;在不至于混淆的情况下,这些值也分别称为样本均值、样本方差、样本标准差、样本k阶原点矩、样本k阶中心矩。【注】:()1,2,pkkAmnk,这就是下一章要介绍的矩估计的理论根据。统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,所以寻求统计量的分布成为数理统计的基本问题之一。我们把统计量的分布称为抽样分布。然而要求出一个7统计量的精确分布是十分困难的。而在实际问题中,大多总体都服从正态分布:而对于正态分布,我们可以求出一些重要统计量的精确分布,这就是:二、几种常用的抽样分布:(正态分布中的几种统计量的分布)把2分布,t分布,F分布,统称为“统计三大分布”。1、正态分布由正态分布的性质,可得如下结论:1)定理:设nXXX,,,21相互独立,),(~2iiiNX,ni,,2,1,是关于iX的任一确定的线性函数(niiiXa1),则也服从正态分布,且~niniiiiiaaN1122),(。2)结论:若(nXXX,,,21)是来自总体2~(,)XN的一个样本,X为样本均值,则①~X),(2nN,由上述结论可知:X的期望与X的期望相同,而X的方差却比X的方差小的多,即X的取值将更向集中。②X与2S相互独立。2、2分布1)定义:设(nXXX,,,21)是来自总体),(N~X10的一个样本,则称统计量:niiX122所服从的分布是自由度为n的2分布,记作:)n(~22。)(2n的概率密度函数为:0)(21),(212222xnnexnxn00xx,其中:012)2(dxexnxn,218显然,0),(2nx,且1),(2dxnx,即符合密度函数性质。事实上,niinXX122)21,2(~2)2分布的性质I、2分布的可加性:设)(~1221n,)(~2222n,且21与22相互独立,则:21+~22)(212nnII、若)(~22n,则nE)(2,nD2)(2,事实上,因为)1,0(~NXi,则:1)()(2iiXDXE,213121)]([)()(2242242dxexXEXEXDxiii,ni,,2,1所以:22211()()()nniiiiEEXEXn;22211()()()2nniiiiDDXDXn3)结论:设(nXXX,,,21)为来自总体),(~2NX的一个样本,,2为已知常数,则:I)统计量niinX12222)(~)(1(当=0时也成立)事实上,令iiXY,则)1,0(~NYi,所以niinY1222)(~II)样本均值X与样本方差2S相互独立,且统计量niinXXSn122222)1(~)(1)1(。证明请参阅有关数理统计的课本。93、t-分布1)定义:设)1,0(~NX,)(~2nY,且X与Y相互独立,则称统计量:nYXT所服从的分布是自由度为n的t分布,记为)(~ntT,t分布又称为学生氏(Student)分布。t分布的概率密度函数为:21)1()()(),(2221nnxnnxtnnx。2)t分布的特点(性质)。I、);(nxt关于x=0对称;II、);(nxt在x=0达最大值;III、);(nxt的x轴为水平渐近线;IV、2221),(limxxenxt;即n时,t分布)1,0(N,一般地,当n30时,t分布与)1,0(N非常接近。V、当n较小时,t分布与)1,0(N有较大的差异,且对Rt0有00||||tXPtTP,其中)1,0(~NX。即t分布的尾部比)1,0(N的尾部具有更大的概率。VI、若)(~ntT,则1n时,2)(,2;0)(nnTDnTE时3)结论:I)设(nXXX,,,21)是来自总体),(~2NX的一个样本

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功