参数估计的若干方法及应用陈茜瑶2012级数学一班060112041摘要:参数估计是统计理论的一种基本形式,是数理统计学的一种重要分支,其中最常见的估计方法是点估计和区间估计。本文将对矩估计,极大似然估计,区间估计法等三种参数估计方法进行推广分析。对它们的范围进行比较讨论,最后我们对其各自的重要性及其在实际中的应用作一介绍。关键词:参数估计;矩估计;极大似然估计;区间估计引言:随着数理统计的应用更加广泛,参数估计在医疗,交通,市场消费,甚至是自然灾害的预测等实际生活中都有着举足轻重的作用,它科学且精确地让我们预测一个参数的值,以达到避免灾害或是获取利益等作用。参数估计已不知不觉渗透到生活的各个方面,它对人们的生活带来的很大的方便。但是对于参数估计方法,好多人却不是很了解,所以,为了人们能更好的利用参数估计为生产生活服务,本文将在论文中对参数估计的具体方法做一个较为系统细致的讲解。参数估计方法在人们生活中的应用,便于人们能更了解参数估计,接触参数估计,很好把它应用到生活之中。这样,就会避免不必要的盲目性,对事物的发展有个相对明确的判断和把握,为生活带来方便和效益。1.参数估计参数估计(parameterestimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。人们常常需要根据手中的数据,分析或推断数据反映的本质规律。即根据样本数据选择统计量去推断总体的分布或数字特征等。统计推断是数理统计研究的核心问题。所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断。它是统计推断的一种基本形式,它是数理统计学中的一个重要分支,分为点估计和区间估计两部分。也就是当在已知系统模型结构时,用系统的输入和输出数据计算系统模型参数的过程。18世纪末德国数学家C.F.高斯首先提出参数估计的方法,20世纪60年代,随着电子计算机的普及,参数估计有了飞速的发展。这里的参数是指如下参数.如:二点分布b(1,p)中的概率p,正态分布N(,)中的和。分布中所含的未知参数的函数。如:服从正态分布的2,N的变量X不超过某给定值a的概率()()aPXa是未知参数,的函数;分布的各种特征数也都是未知参数。如:均值()EX,方差()VarX分布位数等。一般情况下,常用表示参数,参数所有可能取值组成的集合称为称为参数空间,用表示。2.参数估计的常用方法定义2.1设1,,nxx是来自总体的一个样本,用来估计未知参数的统计量21,,nxx称为的估计量,或称为的点估计,简称估计。点估计分为矩估计和极大似然估计。点估计的优越性:无偏性——体现了一种频率思想,只有在大量重复使用时,无偏性才有意义。有效性——意义是:用ˆ估计时,除无系统偏差外,还要求估计精度更高。若有的两个无偏估计1112ˆˆ(,,,)nXXX与2212ˆˆ(,,,)nXXX,如果var(1ˆ)=var(2ˆ),则称1ˆ比2ˆ有效。相合性——和样本的容量有关,是在极限的意义下引进的,适用于大样本情形,当样本容量n越大时,总体的信息量增加,该估计也越精确越可靠,特别是当样本容量趋于无穷大时,估计值将与参数真值几乎完全一致。相合性能在兼顾无偏性和离散性(方差的大小)两者的情况下建立“最优估计量”。点估计的优点是能较准确地给出未知参数大致值,缺点是不能反映出未知参数估计值的可信程度。参数点估计常用的三种方法是:矩法、极大似然方法和最小二乘法。2.1矩估计总体X分布函数的未知参数为12(,,,),Tm如果总体的k阶原点矩12()(,,,),1,2,,kkmEXkm存在,我们设总体的k阶原点矩与它的样本的k阶原点矩相等11,1,2,,nkkiiAXkmn即1211(,,,)(),1,2,,nkkkmikiEXXAkmn从上面式子可得到关于未知量的解12ˆˆ(,,,),1,2,,inXXXim,取12ˆˆˆˆ(,,,)Tm作为12(,,,)Tm的估计,就称ˆ为的矩估计。2.2最大似然估计定义2.2.1设总体的概率函数为(;)Px,,其中是一个未知参数或几个未知参数组成的参数向量,是参数空间,1,,nxx是来自该总体的一个样本,将样本的联合概率函数看成的函数,用1(;,,)nLxx表示,简记为()L,1122()(;,,)(;)(;)(;)nLLxxpxpxpx()L称为样本的似然函数,如果某统计量1,,nxx满足3()max()LL则称是的最大似然估计,简称为MLE2.3最小二乘法最小二乘法是常用的估计方法,最用于线性模型在2(,,)nYXI中,若ˆˆ()()()()minYXYXYXYX(2-3)就称ˆ为的最小二乘估计。2.4派生估计法设12~(;,,,)xlXFx,已知X的样本为:12,,,nXXX,求参数12,,,l的派生估计量。令12(;,,,)lYgX,已知Y的常用的分布函数为12(;,,,)YlFyaaa。记12(;,,,),1,2,,iilYgXin,把12,,,nYYY看成是来自Y的样本,假设ka的某种类型估计量是:~12ˆ(;,,,),1,2,,kklaTYkl其中~12(,,,)nYYYY。再次假设12,,,laaa是已知参数,我们可以记12,,,l为对应的该种类型的派生估计量为12ˆˆˆ,,,l,那么12ˆˆˆ,,,l就是是下列方程组的解:~12ˆˆˆ(;,,,),1,2,,kklaTYkl从而我们就可以得到12ˆˆˆ,,,l的值,就可以得到12,,,l的派生估计量。在得到上面的值时,我们必须要先了解下面两条定理:定理1、~1(,,)nxxx为来自总体~1(,,)nXXX的样本观测值,若估计量ˆa以概率收敛于a;那么对nN,(,)Hxt是关于t的连续函数,那么~ˆ(,)Hxa也将以概率收敛于~(,)Hxa。定理2、总体X服从分布()XFX,,而(;)~(;)YYgXFxa,~1(,,)nxxx为来自总体~1(,,)nXXX的样本观测值,而~ˆ(;)aaTx的估计,的派生估计值ˆ满足条件~ˆ(;)aTx,通过化简可以解得~ˆ(;)Hxa存在并且关于a连续,如果原估计量ˆa以概率收敛于a,那么派生估计量ˆ也以概率收敛于。2.5参数的区间估计点估计是用一个确定的值去估计未知参数,但不知其精确程度。在实际中,我们需要求出未知参数的近似值,还要度量点估计的精确度。其方法就是给未知参数一个区间,使其盖住概率尽可能大,这就是参数区间。2.5.1置信区定义2.5.1设是总体的一个参数,其参数空间为,1,,nxx是来自该总体的样本,对给定的一个(01),假设有两个统计量1,,LLnxx和1,,uunxx,若对任意的,有()1Lup4则称随机区间[,]Lu是的1的置信区间,L和u分别称为1的置信下限和置信上限。3.参数估计的应用3.1.矩法估计的应用例1母体均值E与方差D为矩法估计。解:设1,2,…,n是母体的子样。母体具有均值E和方差D=E2-(E2)按照(*)式得方程式组1=E=2=E2=(E2)+D=2解这一方程组得E和D的矩法估计Eˆniin11Dˆ22)(注基于矩估计的特点,日常生活中大多在样本量大的情况下,使用矩估计。3.2最大似然估计的应用例8基因问题,一个基因有两个不同的染色体,一个给定的总体中的每个个体都必须有三个可能基因类型中的一种,如果从父母那里继承染色体是独立的,且每对父母将第一染色体传给子女的概率是相同的,那么三种不同的基因概率12,pp和3p可以用以下形式表示:22123,2(1),(1)ppp,其中,01,为未知参数,而123,,0ppp,且1231ppp.(1)基于一个随机样本中拥有每种基因个体的观察数值123,,NNN求的MLE;(2)特别当1N=10,2N=53,3N=46时,求的MLE。解(1)其似然函数为:31222()()[2(1)][(1)]NNNL12223ln()2lnln2lnln(1)2ln(1)LNNNNN21223ln2(2)ln(2)ln(1)NNNNN231222ln()1NNNNdLd令ln()0dLd,的如下方程:23122201NNNN从中解得:1222NNn其中31iinN为样本容量,又2231222222ln()|0(1)NNNNdLd由此参数的MLE为:1222NNn(2)特别地,当12310,53,46NNN时,109,n此时20530.335218。53.3区间估计法的应用区间估计同样应用广泛,以下介绍其在为社会保险的评估,日常花费的评估,销售业绩的评估等方面的应用实例。例9假设参加某种寿险投保人的年龄服从正态分布,标准差为σ=7.77岁。从中抽取36人组成一个简单随机样本(重复抽样),其平均年龄为39.5岁,试建立投保人平均年龄μ的90%的置信区间。解:假设用随机变量X表示某种寿险投保人的年龄,则由已知条件有2~(,7.77),39.5XNX,n=36。与置信度90%相对应的α=0.10,查表,得到0.100.0521.645ZZ由公式,2XZn得,总体均值μ的置信度为90%的置信区间为27.7739.51.645(37.37,41.63)36XZn于是可以说,我们有90%的把握确信,寿险投保人总体的平均年龄介于37.37到41.63岁之间。结束语:通过这次论题的研究除了让我复习并巩固了以前的知识,对其进行查缺补漏,研究的过程中遇到不少的困难,但通老师的指导和查阅相关的文献很多问题都渐渐地明朗起来。通过深入学习,我才认识到参数估计这方面的知识还很博大精深,这次我仅是在较为简单通俗的方面对参数估计有关问题进行了讨论。通过这次论文的撰写,希望能引起大家对参数估计更多的了解和更大的兴趣。这次研究也培养了我自学的能力,认识到交流的重要性。我觉得在学习新知识的过程中,遇到很多困难是很常见的事情,但重要的是摆正心态去看待问题,然后迎刃而上,去解决问题,不论是自己想办法查阅资料还是向老师讨问,都要实际行动起来,去解决问题,千万不敢拖沓。【参考文献】[1]茆诗松、程依明、濮晓龙主编,概率论与数理统计教程,高等教育出版社,2010年,第二版.[2]王容华等主编,概率论与数理统计教程(习题精选),北京大学出版社,2010年3月,第一版.[3]苏军和主编,概率论与数理统计教程,上海财经大学出版社,1991年,第一版.[4]唐生强主编:概率论与数理统计复习指导,科学出版社.1999年,第一版.[5]魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社.1983年,第一版.[6]孙祝岭.点估计的一种新方法.统计与决策[J].2010,11:163-164[7]茅宁.Bootstrap方法及其应用[J].国防科技大学学报.1985,(4):1-66[8]陈峰,陆守曾,杨珉.Bootstrap估计及其应用[J].中国卫生统计.1997,14(5):5-7[9]何明星,李春,赵茂.非正态总体均值区间估计方法的模拟比较[J].云南师范大学数学学院