区间估计IntervalEstimation相关数学英文词汇•点估计:PointEstimation•区间估计:IntervalEstimation•置信区间:ConfidenceInterval区间估计的思想点估计总是有误差的,但没有衡量偏差程度的量,区间估计则是按一定的可靠性程度对待估参数给出一个区间范围。置信水平、置信区间设总体的分布中含有一个参数,对给定的,如果由样本(X1,X2,…,Xn)确定两个统计量(X1,X2,…,Xn),(X1,X2,…,Xn),使得则称随机区间,()为参数的置信系数为1-的置信区间。:置信水平——置信下限——置信上限^1^21}ˆˆ{21P^1^2^1^2正态总体方差已知,对均值的区间估计如果总体X~N(,2),其中2已知,未知,则取U-统计量,对做区间估计。XUn对给定的置信水平1-,由确定临界值(X的双侧分位数)得的置信区间为21PUu22,XuXunn将观测值代入,则可得具体的区间。12,,,nxxx几点说明1、参数的置信水平为1-的置信区间(1,2)表示该区间有100(1-)%的可能性包含总体参数的真值。2、不同的置信水平,参数的置信区间不同。3、置信区间越小,估计越精确,但置信水平会降低;相反,置信水平越大,估计越可靠,但精确度会降低,置信区间会较长。一般:对于固定的样本容量,不能同时做到精确度高(置信区间小),可靠程度也高(1-大)。如果不降低可靠性,而要缩小估计范围,则必须增大样本容量,增加抽样成本。一、置信区间定义:),,,,(ˆˆ2111nXXX),,,(ˆˆ2122nXXX)ˆˆ(21满足设是一个待估参数,给定,0若由样本X1,X2,…Xn确定的两个统计量则称区间是的置信水平(置信度、置信概率)为的置信区间.分别称为置信下限和置信上限.1}ˆˆ{21P]ˆ,ˆ[21121ˆˆ和一旦有了样本,就把估计在区间内.这里有两个要求:可见,对参数作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量))ˆˆ(21(X1,…Xn)11ˆˆ22ˆˆ]ˆ,ˆ[21(X1,…Xn)2.估计的精度要尽可能的高.如要求区间1.要求以很大的可能被包含在区间即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.]ˆ,ˆ[21}ˆˆ{21P内,就是说,概率要尽可能大.12ˆˆ长度尽可能短,或能体现该要求的其它准则.~N(0,1)选的点估计为求参数的置信度为的置信区间.例1设X1,…Xn是取自的样本,,2已知),(2NnXU取二、置信区间的求法解:寻找一个待估参数和估计量的函数,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.X1,1对给定的置信水平查正态分布表得,2u对于给定的置信水平,根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.1}|{|2unXP使为什么这样取?,1对给定的置信水平查正态分布表得,2u1}{22unXunXP1}|{|2unXP使从中解得也可简记为1}{22unXunXP于是所求的置信区间为],[22unXunX2unX±n,s的作用?~N(0,1)nXU例如,由P(-1.96≤U≤1.96)=0.95)(ufu96.196.195.0我们得到均值的置信水平为的置信区间为1]96.1,96.1[nXnX由P(-1.75≤U≤2.33)=0.95这个区间比前面一个要长一些.置信区间为我们得到均值的置信水平为的)(ufu33.275.11]33.2,75.1[nXnX•例2假设某地小学五年级学生语文统考成绩服从正态分布N(m,s×s),已知s×s=14分。•现随机抽取27名五年级学生的成绩进行统计,平均分为78分。•试求该地小学五年级学生语文平均成绩的95%的置信区间.正态总体方差未知,对均值的区间估计如果总体X~N(,2),其中,均未知的1-的置信区间?正态总体方差未知,对均值的区间估计如果总体X~N(,2),其中,均未知由~(1)XtnSn构造T-统计量XTSn当置信水平为1-时,由2(1)1PTtn查t-分布表确定2(1)tn从而得的置信水平为1-的置信区间为22(1),(1)SSXtnXtnnn未知,用样本标准差近似代替.对大样本,由中心极限定理,U-统计量XUn正态总体方差已知,对均值的区间估计构造近似N(0,1)分布*S*XUnS样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布xn=165x50x5.2x当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xx中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布/2*1XPnUS/21PUU近似N(0,1)分布*XUnS**/2/21SSPXUXUnn**/2/2,SSXUXUnn**/2/21SSPXUXUnn221PXuXunn/2/2,XUXUnn**/2/2,SSXUXUnn•例3从1998年全国文科政治高考成绩中抽取样本3861人,•计算出第二大题的平均分为11.97分,•修正方差为4.469•试求全国文科考生政治科第二大题平均分的95%的置信区间.TheEnd练习:Page15414