贝叶斯估计及其在抽样调查中的应用2(Bayes,Thomas)(1702─1761)贝叶斯是英国数学家.1702年生于伦敦;1761年4月17日卒于坦布里奇韦尔斯.贝叶斯是一位自学成才的数学家.曾助理宗教事务,后来长期担任坦布里奇韦尔斯地方教堂的牧师.1742年,贝叶斯被选为英国皇家学会会员.如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计等等.3贝叶斯方法(Bayesianapproach)贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述解决统计问题的方法(SamuelKotz和吴喜之,2000)。贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数(茆诗松和王静龙等,1998年)。“贝叶斯提出了一种归纳推理的理论(贝叶斯定理),以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法.”──摘自《中国大百科全书》(数学卷)4第一章先验分布与后验分布统计学有两个主要学派:频率学派与贝叶斯学派.它们之间有异同,贝叶斯统计是在与经典统计的争论中发展起来,主要的争论有:1.未知参数可否作为随机变量?2.事件的概率是否一定的频率解释?3.概率是否可用经验来确定?……….§1.1先介绍三种信息的概念经典统计学派规定统计推断使用两种信息:总体信息样本信息而贝叶斯学派认为是三种信息:总体信息样本信息先验信息5总体信息即总体分布或总体所属分布族给我们的信息。譬如,“总体是正态分布”就给我们带来很多信息:密度函数是一条钟形曲线;一切一阶距都存在;有关正态变量(服从正态分布随机变量)的一些事件的概率可以计算;由正态分布可以导出分布,分布和分布等重要分布,还有许多成熟的点估计、区间估计和假设检验方法可供我们选用。总体信息是很重要的信息,为了获得此信息,往往耗资巨大。6样本信息从总体中抽取的样本给我们提供的信息。这是最“新鲜”的信息,并且愈多愈好。人们希望对样本的加工和处理对总体的某些特征作出较为精确的统计推断。没有样本就没有统计学可言。这是大家都理解的事实。7基于上述两种信息进行的统计推断称为经典统计学,它的基本观点是把数据(样本)看成是具有一定概率分布的总体,所研究的对象是这个总体而不局限于数据本身。这方面最早的工作是高斯(Gauss,C.F.1777~1855)和勒让德(Legendre,A.M.1752~1833)的误差分析,正态分布和最小二乘法。从十九世纪末到二十世纪上半叶,经皮尔逊(Pearson,K.1857~1936)、费歇(Fisher,R.A.1890~1962)奈曼(Neyman.J.)等人的杰出工作创立了经典统计学。随着经典统计学的持续发展与广泛的应用,它本身的缺陷也逐渐暴露出来了。8先验信息即在抽样之前有关统计问题的一些信息,一般说来,先验信息主要来源于经验和历史资料。例1:有一英国妇女,对奶茶能辨别出先倒进茶还是先倒进奶,做十次试验她都正确说出。..5.0,,,0009766.05.0)10(,5.0:010100是经验在起作用可见应拒绝小概率事件这是几乎不可能发生的那么十次猜中的概率为每次成功概率若PHPPH某学生第一次看到他的数学老师,即有反应:老师30岁到40之间,极可能35岁左右(左右可理解为正负3岁,极可能可理解为90%的可能).P(32≤X≤38)=0.909.,,,,0,...,2,1,)()(,,,:2免检产品使用单位就可以确认为的不合格率分布一致取几件产品与历史资料可见假定以后每天都抽信得过产品该产品为那么附近部分在若这个分布的概率绝大先验分布一个分布对过去的不合格率构造根据历史资料以估计不合格率品工厂每天都抽取几件产的确定免检产品例niniPi10三种信息基于上述三种信息(总体信息、样本信息和先验信息)进行的统计推断被称为贝叶斯统计学。它与经典统计学的主要差别在于是否利用先验信息。贝叶斯统计学派把任意一个未知参数都看成随机变量,应用一个概率分布去描述它的未知状况,该分布称为先验分布。11贝叶斯的信息处理路径后验信息统计推断贝叶斯定理先验信息样本信息12后验分布是三种信息的综合,先验分布反应人们在抽样前对参数的认识,后验分布反应人们在抽样后对参数的认识Bayes统计推断原则:对参数所作任何推断(参数估计,假设检验等)都必须建立在后验分布基础上.13共轭分布法后验分布和先验分布是同一个类型大家知道,在区间(0,1)上的均匀分布是贝塔分布(1,1)beta。我们从上例中看到一个有趣的现象。二项分布(,)bn中的成功概率的先验分布若取(1,1)beta,则其后验分布也是贝塔分布(1,1)betaxnx。其中x为n次独立试验中成功出现的次数。先验分布与后验分布同属于一个贝塔分布族,只是参数不同而已。这一现象不是偶然的,假如把的先验分布换成一般的贝塔分布(,)beta,其中0,0。经过类似的计算可以看出,的后验分布仍是贝塔分布(,)betaxnx,此种先验分布被称为的共轭先验分布。14定义:设是总体分布中的参数(或参数向量),是的先验密度函数,假如由抽样信息算得的后验密度函数与有相同的密度函数形式,则称是的(自然)共轭先验分布。应该着重指出,共轭先验分布是对某一分布中的参数而言的。如正态均值、正态方差、泊松均值等。离开指定参数及其所在的分布去谈论共轭先验分布是没有意义的。15正态均值(方差已知)的共轭先验分布是正态分布设1,,nxx是来自正态分布2(,)N的一个样本的观察值。其中2已知。此样本的似然函数为22111(|)exp()22nniipxx现取另一个正态分布2(,)N作为正态均值的先验分布,即221()()exp,22其中与2为已知,16由此可以写出样本x与参数的联合密度函数22221122212(,)exp2niinnxxhxk其中(1)/2111(2),nnniixkxn。17则有22121(/)(,)exp[2exp22/BAhxkABCkA其中2211exp{(/)}2kkCBA。由此容易算得样本x的边缘分布1222()(,)mxhxdka上面两式相除,即得的后验分布1222(/)(/)exp2/BAxAA这是正态分布,其均值1u与方差21分别为2201220xBA,22210111这说明了正态均值(方差已知)的共轭先验分布是正态分布。18常用共轭先验分布总体分布参数共轭先验分布二项分布成功概率贝塔分布(,)beta泊松分布均值伽玛分布(,)Ga指数分布均值的倒数伽玛分布(,)Ga正态分布(方差已知)均值正态分布2(,)N正态分布(均值已知)方差倒伽玛分布(,)IGa19共轭先验分布的优点它有两个优点1.计算方便2.后验分布中的一些参数可以得到很好的解释在“正态均值的共轭先验分布为正态分布”的例题中,其后验均值可改写为2201222200(1)xx其中22200/()是用方差倒数组成的权,于是后验均值1是样本均值x和先验均值的加权平均。这表明后验均值是在先验均值与样本均值间采取折衷方案。20贝叶斯估计在抽样推断中的应用贝叶斯估计法也是一种需要利用与调查变量相关的辅助变量(先验信息)进行估计的方法,但其方法和思路与其他方法相比有自己的特色。贝叶斯估计法的基本思路是,要对某一指标或目标进行估计,则总体以前该指标的水平,即先验指标与目前欲估计的指标(即目标量)也称后验指标有关,可以利用先验指标对后验指标进行估计。21设,欲对总体均值进行估计,根据该总体以往的资料有该指标的平均数和方差,现从总体N中抽出容量为n的样本,计算得样本平均数和该平均数的方差,则总体均值的贝叶斯估计法的估计量为:YY0y022022011ˆ11yyyyssYss20sy2ys22其中:估计量的方差为:221yfssn11niiyyn22201ˆ11ysYss22111niisyyn2220111ˆysssY23显然是相关的同一指标的两个取值水平,则上式的可以看做是以方差的倒数和为权数的加权算术平均,实际上此方差的倒数是估计精度的倒数,即方差的值越大,其倒数便越小,则相应平均数作为估计的精度就越低,通俗的讲是该平均数的代表性越差;反之,方差越小,其倒数越大,相应平均数的估计精度越高。0y与yˆY201s21ys24贝叶斯估计量方差的意义是先验指标和抽样指标精度之和的倒数。而以上估计式有非常直观的含义:贝叶斯估计量的精度为先验指标精度与抽样指标精度之和,这意味着贝叶斯估计量的精度要高于中任何一个作为估计量的估计精度,即:0y与y2220111ˆysssY或25例如,某市有居民家庭共97670户,根据上年的统计,居民人均月货币收入为2580元,其方差为5804.22,现从该总体中随机抽出100户,调查目前居民人均收入水平情况,有关调查结果和计算见表8.26表9-8人均收入(元)户数(户)f组中值iy2750500iiyyiify2iify1.500~10002750-4-8322.1000~150051250-3-15453.1500~2000121750-2-24484.2000~2500202250-1-20205.2500~30002627500006.3000~3500173250117177.3500~4000133750226528.4000~450044250312369.4500~5000147504416合计100-826627则:919180.08100iiiiifyyf有样本平均数:27505002710()yy元样本方差为:99222291111500iiiiiisfyyff2215002660.08100100670101.0128则样本平均数y的方差为:221001197670670101.016694.15100yfssn据题意,2002580,5804.22ys则根据(9.4.1)式,该市居民人均收入的贝叶斯估计为:02202201111258027105804.226694.15ˆ11115804.226694.15yyyyssYss0.849342640.39(0.0003217元)29估计量ˆY的方差,据(9.4.2)式:222011ˆ3108.7511115804.226694.15ysYssˆ3108.7555.76(sY元)30关于贝叶斯估计法概略地说要把握以下三点:(1)进行贝叶斯估计,不仅要知道与调查变量相关的原始辅助资料,如上例中的0y和20s,称为先验指标,还要知道先验指标的分布,称为先验分布,其分布规律是由调查变量的性质确定的,最常见的是正态分布,在此也只讨论正态分布下的贝叶斯估计。故在0y和20s已知的情况下,可视其为分布参数的估计值,其先验分布可记为200(,)Nys,这里0y为目标估计的一个信息来源。31(2)从总体中抽出一个随机样本,计算出样本平均数y及其方差2ys,也需样本平均数的分布,根据抽样分布理论知,样本算术平均数的分布通常也是正态分布,记2(,)yNys,样本算术平均数又构成目标量为总体平均数的一个信息来源。(3)上述的先验分布与抽样