应用统计基本概念与抽样分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数理统计的基本概念与抽样分布例:某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作第一,对生产出来的钢筋的强度进行检测,获得必要的数据。第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。§1.2总体、个体、样本•1.2.1总体与个体我们把所研究对象的全体称为总体或母体。组成总体的每个单元称为个体总体X可看作一个随机变量,称X的概率分布为总体分布,称X的数字特征为总体的数字特征,对总体进行研究就是对总体的分布或对总体的数字特征进行研究.•1.2.2样本从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量.样本具有二重性:随机性和确定性•定义1.1设总体X的样本满足⑴独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立;⑵代表性:样本中每一个个体都与总体X有相同分布。则称此样本为简单随机样本。进行有放回抽样就是简单随机样本,无放回抽样就不是简单随机样本。但N很大,n相对较小时无放回抽样得到的样本可以近似看作简单随机样本.称样本的分布为样本分布。如果为简单随机样本,为总体X的分布函数,则样本分布有比较简单的形式它完全由总体X的分布函数确定12(,,,)nXXX()Fx它完全由总体X的分布函数确定),,,(),,,221121nnnxXxXxXPxxxF(1122()()()nnPXxPXxPXx1()niiFx)(),,,(121ininxfxxxfininnpxXxXxXP12211),,,(两种形式例1.1设有一批产品,其次品率为p,如果记“”表示抽取一件产品是次品;“”表示抽取一件产品是正品;那么,产品的质量就可以用X的分布来衡量。X服从0-1分布,参数就是次品率p。如果为简单随机样本,求样本分布.解:总体X的概率分布为,)1()(1xxppxXP0X1X12(,,,)nXXX所以的概率分布为iixxninnppxXxXxXP112211)1(),,,(niiniixnxpp11)1(•例1.2设总体X服从参数为的正态分布,求样本的分布密度。解:总体X的分布密度为所以的概率分布为2,12(,,,)nXXX22)(21,21)(xexfx12(,,,)nXXX212211(,,,)()exp(())22nnifxxxx•统计量•统计量的定义定义1.2设为总体X的一个样本,为的连续函数,且不含有任何未知参数,则称T为一个统计量。注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值;2.统计量是一个随机变量,它将高维随机变量问题转化为一维随机变量来处理,但不会损失所讨论问题的信息量.12(,,,)nXXX12(,,,)nTTXXXnXXX,,21•常见的统计量1.样本均值2.样本方差3.k阶原点矩4.k阶中心矩5.顺序统计量6.样本极差与中位数(1)(n)(k)最大顺序统计量:X最小顺序统计量:X第K顺序统计量:X•例1.3设总体X为连续型的,求最大顺序统计量与最小顺序统计量的分布密度.解:最大顺序统计量的分布函数为)(nX),,()()(21)()(xXxXxXPxXPxFnnnninixFxXP)]([)(1•最小顺序统计量的分布函数为)(1)()()1()1()1(xXPxXPxF121(,,,)nPXxXxXxninixFxXP)](1[1)(11•如果总体中服从均匀分布则()00()01nnnxxFxxx(1)00()()101nnxxFxxx•其分布密度为其它00)(1)(xnxxfnnn其它00)()(1)1(xxnxfnn•充分统计量•例:某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为)外,其它都是合格品(记为)。当厂长问及检查结果时检验员可作如下两种回答:(1)10件中有两件不合格;(2)前两件不合格。这两种回答反映了检验员对样本的两种不同的加工方法。其所用的统计量分别为1,121XXniXi,,4,3,0•显然,第二种回答是不能令人满意的,因为统计量不包含样本中有关p的全部信息。而第一种回答是综合了样本中有关p的全部信息。因为样本提供了两种信息:(1)10次检验中不合格品出现了几次;(2)不合格品出现在哪几次试验上。1011;IiXT212XXT),,(1021XXX第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的.充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。或者说充分统计量包含了有关总体或有关参数的全部信息.考虑样本的分布),,(1021XXX111122101010101111010(,,)()(1)(1)(1)iiiixxiiiixxTTPXxXxXxPXxpppppp•由于且是服从二项分布故11112210101110101111010(,,,)()(1)(1)(1)iiiixxiiiixxttPXxXxXxTtPXxpppppp1T111101110()(1)tttPTtCpp它与无关p111111111112210101110101010101010(,,|)(1)/(1)(1)/(1)1iixxtttttttttPXxXxXxTtppCppppCppC定义1.3设总体X的分布为一个含未知参数的分布族,是X的一个样本。是一个统计量,对给定的t,样本在的条件下的条件分布与参数无关,则称统计量T是参数的充分统计量。:F),,(21nXXX),,(21nXXXTT),,(21nXXXtT上例的一般情况是设是来自0-1分布的一个简单随机样本,其中,则是参数的充分统计量。12(,,,)nXXXxxxXP1)1()(1,0x01niiXT1•由定义可得定理1.1设是参数的充分统计量,是单值可逆函数,则也是参数的充分统计量。),,(21nXXXTT)(ts)(Ts•当总体为连续型总体时,充分统计量要用条件分布密度来描述。奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别充分统计量的方法:因子分解定理。•定理1.2(因子分解定理)设样本的联合分布为一个含未知参数的分布族,则是一个充分统计量当且仅当存在这样的两个函数:(1)与无关的非负函数;(2)与有关,且仅与统计量T的值有关的非负函数使得其中在离散总体的情况下表示样本的分布列,在连续总体的情况下表示样本的分布密度。:),(,21nxxxf),,(21nXXXTT),,,(21nxxxh)),,,((21nxxxTg)),,,((),,,(),,,(212121nnnxxxTgxxxhxxxf),,,(21nxxxf•例设是来自分布,即它的分布密度为的一个简单随机样本,其中则分别是参数的充分统计量),,(21nXXX),(2N221()2,1()2xfxe,0x,021211,()nniiiiTXTXX2,解:样本的联合分布密度为如果令由因子分解定理知是的充分统计量。),,(21nXXX222221222,()(,,,)(2)exp()22nnTnXfxxx1),,,(21nxxxh12((,,,))ngTxxx222222()(2)exp()22nTnX),(21TT),(2•例设总体X的分布密度为是X的一个简单随机样本,试证明最小顺序统计量的充分统计量。),,(21nXXX2);(xxfx0(1)X是证:样本的联合分布密度为如果令由因子分解定理知是的充分统计量。12(,,,)nXXX1212212(,,,),0,,,()nnnnfxxxxxxxxx122121(,,,)(,,,)nnhxxxxxx12((,,,))ngTxxx(1),0nx(1)X•§1.4抽样分布我们称统计量的分布为抽样分布,不同的统计量其分布不一定相同.常见的分布类型有:正态分布伽玛分布卡方分布t分布F分布•伽玛分布定义1.4如果连续型随机变量X的密度函数为其中为函数,则称X为服从参数是的伽玛分布,记为,0,00,)()(1xxexxfx0,001)(dxexx,),(~X•伽玛分布的性质(1)由此可得10()()()()kkxkxkEXxedx2(),()EXDX•(2)如果,并且X和Y相互独立,容易求得这个性质称为可加性,即伽玛分布具有可加性.12~(,),~(,)XY),(~21YX•卡方分布用构造性的方式定义是定义1.5设为相互独立的随机变量,且均服从,则它们的平方和也是一个随机变量,它所服从的分布称为自由度为n的分布,记为12,,,nXXX)1,0(N222212nXXX)(~22n2•它的密度函数为其密度函数与参数n有关,它的图形也有一定差异.0,00,)21)(2122(2xxexxfxnnn•卡方分布的性质若,则即卡方分布是一种伽玛分布,因此具有伽玛分布的性质(1)(2)如果,并且X和Y相互独立,有卡方分布也具有可加性)(~22n)21,2(~2n2()EnnD2)(22212~(),~()XnYn)(~212nnYX•例是来自参数为的指数分布X总体,试证明:12(,,,)nXXX)2(~22nXn•总体X的密度为当时,我们有密度为说明,0(),00,0xexfxx2021)2()2(xxtedtexXPxXP0x,0,00,21)(2xxexfx2X)2(~22X•假定子样是简单随机子样,则且它们之间相互独立,故有22~(2)iX2122~(2)niinXXn•t分布构造性的方式定义定义1.6设,,且X与Y相互独立,记则T也是一个随机变量,它所服从的分布称为自由度为n的t分布,记为)1,0(~NX)(~2nYnYXT)(~ntT•它的密度函数为与参数n有关,不同的n其图形也有差异.1221()2()(1),()2nnxfxxnnn•性质若则(1)当时,t分布是柯西分布,柯西分布不存在数学期望和方差.参数为2的t分布也不存在数学期望和方差.(2)时,)(~ntT1n2n()0,()2nTDTn•(3)可以证明这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布221lim()2xnfxe•F分布构造性的方式定义定义1.7设,,且X与Y相互独立,记则F也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为2~()Xm)(~2nYXmFYn~(,)FFmn•它的密度函数为它与m,n有关,其图形也有一定差异.0,00,)1()()2()2()2()(2122xxxnmxnmnmnmxfnmmm•容易得到若

1 / 57
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功