大学课件-概率论之数理统计的基本概念

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

从本章起,我们转入课程的第二部分——数理统计学。数理统计学与概率论是两个密切联系的姊妹学科。大体上可以这样说,概率论是数理统计学的基础,而数理统计学是概率论的重要应用。第六章数理统计的基本概念数理统计是一门什么样的学科?数理统计学是这样一门学科:它使用概率论和其它数学方法,研究怎样收集(通过试验和观察)带有随机误差的数据,并在设定的模型(称为统计模型)之下,对这种数据进行分析(称为统计分析),以对所研究的问题作出推断(称为统计推断)。由于所收集的统计数据(资料)只能反映事物的局部特征,数理统计的任务就在于从统计资料所反映的局部特征以概率论作为理论基础去推断事物的整体特征。§6.1总体、样本和统计量6.1.1总体与样本•在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体.•比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X表示.•按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.•从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等(代表性),同时还要求每次的抽取是独立的(独立性),这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本•从总体X中抽取一个个体,就是对随机变量X进行一次试验.抽取n个个体就是对随机变量X进行n次试验,分别记为X1,X2,…,Xn.则样本就是n维随机变量(X1,X2,…,Xn).在一次抽样以后,(X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看成一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间.•称(X1,X2,…,Xn)为样本,n为样本容量.简单随机样本具有以下两条重要性质:(1)12,,,nXXX间相互独立;(2)12,,,nXXX与总体具有相同分布.6.1.2统计量统计量的定义设X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称g(x1,x2,...,xn)为统计量g(X1,X2,…,Xn)的观测值.统计量是处理、分析数据的主要工具.对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数.例设X1,X2,…,Xn是来自总体X的样本,X~N(,2),其中、2为未知参数,则X1,min{X1,X2,…,Xn}均为统计量,但诸如等均不是统计量,因它含有未知参数或.,312121XX,)(112niiXn1X§6.2经验分布函数对于总体X的分布函数F(x)(未知),设有它的样本12,,,nXXX,我们可以从样本出发,找到一个已知量来近似它,这就是经验分布函数)(xFn.这正是数理统计的核心任务“由局部推断总体”的一个具体应用实例.12,,,nXXX(1)(2)()nxxx设诸观察值按从小到大可排成(1)(1)(2)()(1)()0,1,(),1,定义XnkknxxxxxnFxkxxxnxx()XnFx只在()kxx,nk,,2,1处有跃度为n1的间断点,若有l个观察值相同,则()XnFx在此观察值处的跃度为nl.对于给定的x,()XnFx即表示事件{Xx}在n次试验中出现的频率,即()XnFx{落在),(x中ix的个数}/n。()()FxPXx(而是事件()Xx发生的概率.依伯努利大数定律(频率收敛于概率),有()()lim0nXnFxxPF另外,格里汶科定理指出了这一更深刻的结论,即(limsup()()0)1XnnxPFxFx§6.3抽样分布为了用概率的方法探讨一个统计量在推断总体时的性能或把握推断结论的置信程度,我们必须要知道统计量的分布或近似分布.统计量的分布,通常称为抽样分布.6.3.1样本均值和样本方差的数字特征122222*22,,,[],[],1[],[](16.)2,[]3..1设()是取自总体的一个样本,则();()[]=命题nnnXXXXEXVarXEXVarXnnESESn111222111222122221221122211111[]111[][]11(2[][)()(2)1(2)12]1nnniiiiinnniiiiinnniiiiiinniiiiniiiEXEXnnnVarXVarXnnnXXXXXXnnXXXEXVnXnXarXXXnnSXXn()证明:1n22221122122222222122222*2[][]([])11[][]1{([])}{([])}1{([])[]([])[][]}{([])}11()[][1[11]nniiiininiiniininiEXXEXEXnnEXEXESEXEXEXEXVnEXEXnnnnnnnESEnarXVarnnXnES22]nS6.3.2三种重要的概率分布1.2分布定义设X1,X2,…,Xn为相互独立的随机变量,它们都服从标准正态分布N(0,1),则称随机变量所服从的分布为自由度为n的2分布,记为X~2(n).…2222121niniXXXXX可以证明,2(n)的概率密度为其中()称为伽马函数,2122221,0(()0)20,nxnnxexfxx10(),0xxedx2分布概率密度图6.12(n)分布的概率密度曲线可以看出,随着n的增大图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动.0,00,)(21)(212222xxexxfxnnn2分布具有下面性质:22111222114[][][][][][]{([])}(1)210132[]3证(1)((,)的四阶矩为)nnniiiiiinniiiiiEXEXEXDXnVarXVarXEXnniNEX2.t分布定义设X~N(0,1),Y~2(n),X与Y独立,则称随机变量服从自由度为n的t分布,又称为学生氏分布.记为T~t(n).nYXT可以证明t(n)的概率密度为:xnxnnnxfnt,1221)(212图6.2t分布的概率密度曲线显然t分布的概率密度是x的偶函数,图6.2描绘了n=1,3,7时t(n)的概率密度曲线.作为比较,还描绘了N(0,1)的概率密度曲线.可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近.2231(),2()(0,1).()(0,1).()(1),(202[]0[]2)xttfxenntnNtnNXtnnnnEXVarXn可以证明分布具有下列性质:即当时,一般地,当时,就可以认为基本与相差无几了另外,经积分可知,若,则有:3.F分布命题6.3.4设X~2(m),Y~2(n),且X与Y独立,称随机变量服从自由度为(m,n)的F分布,记为F~F(m,n).m,n分别称为第一自由度和第二自由度.可以证明其概率密度函数为:XmFYn21222,0()1220,0mmmnFmnmxnxfxmnmxnxXmFYn由F分布的定义容易看出,若F~F(m,n)则1/F~F(n,m).图6.3F分布的概率密度曲线在统计推断(区间估计和假设检验)中,已知总体X的分布及某概率值α,需要知道X小于等于哪个数的概率为α,这个数称为X的α分位数,也就是,设X~ψ(n)(ψ为某种分布,n为有关自由度),0α1,称满足的数为分布ψ(n)的α分位数(或分位点).6.3.3分位数(())PXn()n求分位点一般采用查表的方法,这些表都是数值运算的结果.R软件中有专门的函数qnorm(α)(求标准正态分布的α分位点)、qt(α,n)(求自由度为n的t分布的α分位点)、qchisq(α,n)(求自由度为n的2分布的α分位点)和qf(α,m,n)(求第一自由度为m、第二自由度为n的F分布的α分位点).标准正态分布的α分位点用表示.标准正态分布和t分布还有双侧分位数的定义,即这是因为标准正态分布和t分布的密度函数关于y轴是对称的,图6.3.4和6.3.6所示就是双侧分位数,不难发现1/2(())1PXnu/21/2/21/2,uutt四种常用分布的分位数示意图另外,在分位点表中对于标准正态分布、t分布和F分布只能查到α1/2的分位数,需利用对称性间接查α1/2的分位数,对称性指的是以下三个关系式,根据这三个分布的定义和特点很容易得到.1111,,(,)(,)uuttFmnFnm6.3.4正态总体的抽样分布12222(,,...,)~(0,1),1~(0,)~(,1)6.3.1nnnXXXXNXNnnSnXS(抽样分布基本定理)设是来自总体的一个样本则样本均值,样本方差并且与相立.互独定理一、单个正态总体的抽样分布推论6.3.1设(X1,X2,…,Xn)是来自总体X~N(μ,σ2)的一个样本,则2*222*2221222(1);~(,)()(1)(2)~(1)nnninniXSSXNnXXnSnSn样本均值与样本方差(修正)()相互独立=-*1~(1)nnXXnntnSS2122(,,...,)~(,6.3.2),,nnXXXXNXS设是来自总体的一个样本与分别为其样本均值与样本方差推论则*2222122()~(,),~(0,1)/()(1)~(1)niniXnXXNNnnXXnSn又证明:且它们表示的随机变量是相互独立的,故**221~(1)(1)(1)nnnXXXnTnntnSSnSn例1:设总体)4,(~NX,有样本nXXX,,,21,当样本容量n为多大时,使.95.0)1.0|(|XP解:2~(,),~(0,1)2/0.10.1(||0.1)2/2/2/(0.05)(0.05)2(0.05)10.95(0.05)(10.95)/20.975XXXNNnnnXPXPnnnnnnn由于,(1.96)0.975,即96.105.0n,于是得1536.6n.1537例2:设1021,,,XXX是来自总体)4,(~NX的样本,求修正样本方差*2nS大于2.622的概率.解:*22(101)~(9)4nS*2*2*2999(2.622)2.62215.8995,444nnnPSPSPS查表得20.25(9)5.899则有*2(2.622)0.75nPS由于二、两个正态总体下的抽样分布21211221112*211212222221*2122,(,,...,)~(,):111,(),()1(,,...,)~(,),111,(),()1mmmmmmniiiiiinnniiiiniiXYXXXXNXXXXXmmmYYYYNYYYYXSSYSS

1 / 58
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功