第六章-参数估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

end1南昌航空大学end2某快餐店需要确定每份快餐的销售价格以及快餐原材料的采购成本,这需要估计每位顾客午餐的平均花费金额。假设该快餐店在为期3周的时间里选取49名顾客组成了一个简单随机样本,通过调查获取了每一个顾客的午餐花费金额,假定该样本的标准差为5元,样本均值为20元,试以95%的把握程度估计该店所有顾客午餐的平均花费金额所在的范围。思考题ThinkingChallengeend3第一节参数估计的一般问题第三节样本容量的确定第二节参数的区间估计第六章参数估计end4第一节参数估计的一般问题一、参数估计的概念参数估计(parameterestimation)就是用样本统计量去估计总体参数。估计量:用于估计总体参数的统计量。如样本均值,样本比例,样本方差等,样本均值就是总体均值的一个估计量。估计值:根据一个具体样本计算出来的估计量的具体值end5二、点估计与区间估计(一)点估计也叫定值估计,它是以样本统计量作为总体参数的估计量,并以样本指标的实际值直接作为总体未知参数估计值的一种推断方法。例如:用样本均值直接作为总体均值的估计。点估计的方法主要有矩估计法、极大似然估计法、最小二乘法和顺序统计量法等。end6矩一般分为原点矩和中心矩两种:矩估计法:用样本矩去估计总体矩。就是用样本均值去估计总体均值,用样本方差去估计总体方差。假设X是随机变量,若E(Xk),(k=1,2,…n)存在,则称E(Xk)为X的k阶原点矩;显然,当k=1时,一阶原点矩就是数学期望;假设随机变量X的函数[X-E(X)]k,(k=1,2,…n)的数学期望存在,则称E{[X-E(X)]k}为X的k阶中心矩;当k=2时,很明显能够看出,二阶中心矩就是方差.end7【例】已知某种灯泡的寿命X~N,2其中,2都是未知的,今随机取得4只灯泡,测得寿命(单位:小时)为1502,1453,1367,1650。试估计和end8【解】1493165013671453150241x故和的估计值分别是1493和118.61小时。140691493165014931367149314531493150214122222s61.11814069send9点估计的缺点是无法控制误差。从一个样本得到的估计值往往不会恰好等于总体实际值,总有一定的估计误差。点估计无法说明估计误差的大小,也无法说明估计结果有多大的把握程度。仅适用于对推断的准确程度与可靠程度要求不高的情况点估计的优点是简单,具体明确,给出确定的估计值。end10的抽样分布x1x3x2xx例如由样本均值估计总体均值,根据中心极限定理大样本条件下,N(,)x2xend11(二)区间估计(intervalestimate)在点估计的基础上,给出总体参数的一个估计区间,该区间由样本统计量(点估计量)加减估计误差而得到根据样本统计量的抽样分布能够给出总体参数落在该区间的可靠程度(置信水平)比如,某班级平均分数在75~85之间,置信水平是95%样本统计量(点估计)置信区间置信下限置信上限最大估计误差end12区间估计的图示xnx-1.65x+1.65x90%的样本xx65.190%的样本均值满足:xxxx65.165.1即的总体均值的置信区间这就是置信度为%90以总体均值区间估计为例由样本均值抽样分布可知(正态总体或大样本)xixx65.1即end13区间估计的图示x95%的样本-1.96xx+1.96xxx96.195%的样本均值满足:xxxx96.196.1即的总体均值的置信区间这就是置信度为%95xiend14区间估计的图示x99%的样本x-2.58x+2.58xxx58.299%的样本均值满足:xxxx58.258.2即的总体均值的置信区间这就是置信度为%99由以上情况可知其他条件不变,置信水平越高,置信区间就越宽。xiend15三、评价估计量的标准无偏性(unbiasedness)•无偏性:估计量抽样分布的数学期望等于被估计的总体参数P()BA无偏有偏ˆˆend16一致性(consistency)•一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本量较大的样本量P()ˆˆend17有效性(efficiency)有效性:对同一总体参数的两个无偏点估计量,标准差更小的估计量更有效AB的抽样分布的抽样分布1ˆ2ˆP()ˆˆend18第二节参数的区间估计一、总体均值的区间估计要考虑以下三个问题:1.总体是否服从正态分布2.总体方差是否已知3.样本容量的大小end19一总体服从正态分布X~N,2,总体方差已知或总体不管服从何种分布大样本设x1,x2,…xn是一个简单随机样本,则样本均值服从或近似服从正态分布),(~2nNxend20对于给定的置信概率即区间估计的可靠程度1-,查标准正态分布表,可得相应的临界值Z/2(标准正态分布上侧面积为/2时的Z值)可以得出总体均值在置信概率为1-的置信区间为:是总体标准差,若是未知的,在大样本情况下,常用样本标准差S代替。),(2/2/nZxnZx简记为:nZx2/估计误差end21【例】某企业从长期实践中得知,其产品直径X是一随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。【解】1-=0.95,查标准正态分布表得Z/2=Z0.025=1.96样本均值15690nxxi样本均值的标准误差02.0605.0nxend22估计误差:04.002.096.12/xZ所求的95%置信水平下的置信区间为:cm04.1596.1404.01504.015,即end23【例】某企业生产某种产品的工人有1000人,某日采用重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的置信区间。end24【解】S=4.5,n=100,属大样本。故件45.01005.4nsx已知1-=0.9545,查标准正态分布表得Z/2=2件9.045.022/xZ总体人均产量的置信区间为:35-0.9≤≤35+0.9即在34.1至35.9件之间end25(二)总体方差未知时,正态总体均值的区间估计小样本设总体X~N,2,x1,x2,…xn是一个简单随机样本,样本均值为,样本标准差为S,则统计量~tn-1xnsxt/nxxSnxxSii22,1大样本时,近似用end26对于给定的置信概率即区间估计的可靠程度1-,查t分布表,可得相应的临界值t/2n-1(t分布上侧面积为/2时的t值)可以得出总体均值在置信概率为1-的置信区间为:))1(,)1((2/2/nsntxnsntx简记为:nsntx)1(2/end27【例】某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围。【解】样本平均数克1.791107911nxxi样本标准差克136.171109.264212nxxSiend28已知1-=0.95,查t分布表得,t/2n-1=t0.0259=2.2622,故估计误差为:克26.1210136.172622.22/nst总体平均重量的置信区间为:791.1±12.26克,即778.84~803.36克。end29二、总体比例的区间估计在大样本下,样本比例的概率分布趋近于均值为总体比例P,方差为P1-P/n的正态分布。服从标准正态分布nPPPp/1给定置信度1-,由标准正态分布表查得临界值Z/2,估计误差为Z/2p,所以总体比例P的置信度为1-的置信区间为p-Z/2p≤P≤p+Z/2p。end30【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机抽选了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。end31【解】已知n=200,p=0.7,1-=0.95,Z/2=1.96故该企业职工由于同管理人员不能融洽相处而离开的比例为0.7-0.0635~0.7+0.0635,即63.7%~76.4%。0324.02007.017.01nppp0635.00324.096.12/pZend32三、总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差2的点估计量为s2,且4.总体方差在1-置信水平下的置信区间为1~1222nsn111122122222nsnnsnend33总体方差的区间估计(图示)2n-1)212≤2≤222值的1置信区间222221sn由2值的1置信区间求2的置信区间111122122222nsnnsnend34【例6.13】已知大学新入学的男生身高服从正态分布,随机抽取某大学新入学的男生30名,测试其身高数据见下表6—8所示:表6—830名男生的身高(cm)180175176182172173170166174175181180179178173170172174178176178172182180179175174176173185要求以95%的置信水平估计该校新入学男生身高方差的置信区间。end352置信度为95%的置信区间为047.16)29()1(2975.022/1n722.45)29()1(2025.022n34.3235.11047.1623.4130722.4523.41302222即因此可知该校新入学男生身高方差的置信区间为11.35cm~32.34cm。解:已知n=30,1-=95%,根据样本数据计算得s2=(4.23)2end36以简单随机抽样来说明(一)重复抽样条件下样本容量的确定总体均值的置信区间是由下式确定的:一、估计总体均值时样本容量的确定nZx2/其中nZ2/为允许误差用表示。即nZ2/可得样本容量2222/Zn第三节样本容量的确定end37【例6.14】某工厂要估计本月生产的5000袋产品的平均重量,已知这种产品每袋重量的标准差为10克。要求在90%的概率保证程度下,平均每袋重量的允许误差不超过5克。那么在重复抽样条件下应抽取多大的样本容量来估计?end38解:已知1-=90%,Z/2=1.645,=10,=5。所以2222/Zn1182.10510645.1222)(因此在重复抽样条件下应当抽取11袋产品来做检验,可以保证在90%的概率程度下,平均每袋重量的允许误差不超过5克。end39(二)不重复抽样条件下样本容量的确定在不重复抽样条件下,因为NnnZ12/所以可求得222/2222/)()(ZNZNnend40二、估计总体比例时样本容量的确定(一)重复抽样条件下样本容量的确定222)1()(PPZn(二)不重复抽样条件下样本容量的确定)1()()1()

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功