贝叶斯非参数统计的探讨与研究14数614010648应陆峰参考文献:百度百科,中国知网杨磊博士论文贝叶斯非参数统计是一个新兴的但发展迅速的统计研究领域,不但其理论成果非常丰富,其实际应用范围也十分广泛。然而,贝叶斯非参数统计的传统研究着眼于一种纯贝叶斯的多层先验结构,其中需要事先确定先验分布。一旦不能事先容易地确定先验,特别是因为贝叶斯非参数统计通常要求一个复杂的过程先验,那么这一多层先验结构将会受到挑战和质疑。传统的贝叶斯非参数统计分析的这一缺陷促使我们采用一种更加灵活,更加稳健的统计框架—经验贝叶斯分析—来实施统计推断和统计建模。这是因为在进行经验贝叶斯分析时,人们通常基于观测数据来估计先验参数,而不是事先主观地给定。另外,众所周知,如果可识别性不成立,那么基于观测值来估计参数将会变得毫无意义,而且,可识别性也是证明参数估计或者后验分布的渐近收敛性质的前提条件之一。许多统计学家试图找出可识别性成立的条件,但据我们所知,确实存在许多关于有限混合可识别性的理论成果;但可数无穷混合的可识别性仍然很少被研究到,因此也是一个开放的问题。例如,Ferguson(1983)指出Dirichlet过程先验的混合模型,作为一个可数无穷混合的特例,其可识别性尚未解决。为了解决贝叶斯非参数统计中这些问题和挑战,基于经验贝叶斯的框架和几种不同的数据结构:一元数据,多元数据和单调缺失数据,我们尝试分别对几类过程先验中的参数进行估计。根据华东师范大学杨磊博士的论文,本博士论文的主要内容如下所述。首先,在第一章中,我们对贝叶斯非参数统计进行一个全面的回顾,包括:人们为什么使用贝叶斯非参数统计,其简要的历史发展,其丰富的理论成果和实际应用。我们以回顾一系列文献的方式,阐述了贝叶斯非参数统计中的计算问题、未来的研究方向和可能面临的挑战。在此之后,我们引入了人们所熟知的经验贝叶斯假定和几种数据结构。这些数据结构非常普遍且颇具代表性,因而能够表达对多种实际数据进行统计建模的设想。在第二章,通过引入分布集上的良序和序列的一致收敛,我们提出了一个可数无穷混合可识别性成立的充分条件,并且相信此充分条件比Tallis(1969)所提出的无穷维矩阵条件更加容易验证。然后我们运用此充分条件去重新验证了已知可识别性成立的几个例子,进而考查了几个新分布族的可数无穷混合的可识别性,其中包括:正态分布,伽玛分布,柯西分布,非中心卡方分布和广义逻辑斯蒂分布。第三章涉及单调缺失数据机制下Dirichlet过程先验中的先验参数估计问题。我们试图基于经验贝叶斯框架下的部分观测数据,来估计DP(α,α)中的未知精度参数α和未知概率测度a。我们发现,在Dirichlet过程先验的假定下,数据的缺失不影响精度参数α的估计,因其可以通过极大化某个似然函数来有效地估计。然而,对假定密度函数存在的概率测度a而言,我们必须借助于处理缺失数据的非参数密度估计方法来对其进行估计。精度参数α的估计的强相合性和渐近正态性在非常一般的条件下得到了证明,同时我们也证明了a的密度估计的L1收敛性。另外基于二维单调缺失数据,通过最小化渐近积分均方误差,我们提出了此密度估计的最优窗宽选取方法,并且发现此密度估计优于单调缺失数据下其他已有的方法。第四章涉及一元数据下Polyatree先验中的先验参数估计问题,也就是说,在事先确定好分划(?)的情况下,我们试图基于数据来估计PT(π,(?))中参数集合(?)中的参数。首先,我们回顾了Polyatree先验的基本模型和理论性质,然后定义了几类Polyatree先验,并给出了使得它们取绝对连续分布集作为支撑的充分条件。之后,我们提出了Polyatree先验中的先验参数的两种估计:矩估计和极大似然估计,并讨论了相应的理论性质,其中包括该模型与beta-binomial分布之间的联系。最后,我们提供了各种估计的数值模拟来验证各自的理论表现。在第五章中,基于经验贝叶斯框架下的多元观测数据,我们进行了多元Polyatree先验的参数估计。这一节可以视为上述一元Polyatree先验的参数估计问题的一个多元推广,而且此处的经验贝叶斯分析确实类似于一元情形下的相应的分析。首先我们给出多元Polyatree先验的定义和理论性质,然后提出相应的数据结构和模型假设。接下来,我们给出多元Polyatree先验中的先验参数的矩估计和极大似然估计,并讨论了该模型与Dirichlet-multinomial分布之间的联系。最后,我们进行了数值模拟,并通过相应的图表来说明我们所提出的经验贝叶斯估计的理论性质。