第七章__参数估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章参数估计点估计、区间估计与标准误总体平均数的估计标准差与方差的区间估计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计什么是参数估计当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。参数估计可分为点估计和区间估计两种。统计推断的过程样本总体样本统计量如:样本均值、比例、方差第一节点估计、区间估计与标准误一、点估计的定义点估计是指在进行参数估计时,直接用一个特定点值作为总体参数的估计值。二、良好估计量的标准⑴无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。⑵有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。⑶一致性:当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。⑷充分性:指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。三、区间估计与标准误㈠区间估计的定义是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。㈡置信区间与显著性水平⑴置信区间:也称置信间距,指在一定可靠程度上,总体参数所在的区域距离或区域长度。⑵置信界限(临界值):置信区间的上下两端点值。⑶显著性水平:指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。有时也称为意义阶段、信任系数等。⑷置信度(置信水平):。-1区间估计时,某一概率下,总体参数所在的区间称为置信区间,区间的端点值称为临界值,这个概率称为置信度,以概率表示,α又称显著性水平,表示该区间估计的不可靠程度。1三、区间估计与标准误㈢区间估计的原理与标准误⑴区间估计是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。⑵区间估计存在成功估计的概率大小及估计范围大小两个问题。妥协办法:在保证置信度的前提下,尽可能提高精确度。规定正确估计的概率即置信度为0.95和0.99,则显著性水平为0.05和0.01。小概率事件在一次抽样中不可能出现。⑶区间估计的原理是样本分布理论。在计算区间估计值解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。。之间正确的概率为在或者说之间,数被包含在任何一个平均的机会有,也就是说体参数这一间距之内将包含总的平均数那么所有平均数中有之间,落在的推理:所有平均数中有。的之间包含所有或者说之间,落在的有根据正态分布:。或标准误,写作称均数分布的标准差(简平均数的离散程度即平,样本平均数的平均数渐近正态分布,此时,分布或本平均数的分布为正态当总体方差已知时,样95%96.196.195%96.195%96.195%95%96.196.195%)XXXXXXXXXXSEXuSEXuuSEXSEuXXSEuSEuXnSESEuu区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x68%的样本-1x+1xxxzx2置信区间与置信水平均值的抽样分布(1-)区间包含了的区间未包含x1–/2/2xx置信度和置信区间的意义:..,1.,计不准的概率表示参数估估计的可靠概率是参数参数估计的把握性给出了置信度也是随机的置信区间由于样本的随机性..1的估计值区间估计没有给出参数.,,,.,,,.2置信度越低越小但是包含参数的概率也差可能会越小误置信区间越短但误差越大的概率越大包含参数置信度越大置信区间越长两点说明:.,,立尽可能小的置信区间建条件下要在保证一定置信度的因此第二节总体平均数的估计一、总体平均数估计的计算步骤:⒈利用抽样的方法抽取样本,计算出样本的平均值和标准差S。⒉计算样本平均数的标准误:①当总体方差已知时,样本平均数的标准误的计算为:②当总体方差未知时,样本平均数的标准误的计算为:XXSEnSEX1nSSEnX一、总体平均数估计的计算步骤:⒊确定显著性水平和置信水平⒋根据样本平均数的抽样分布确定查何种分布表,确定理论值。⒌确定置信区间:⒍解释总体平均数的置信区间。XXXXXXXXSEtXSEtXSEtXSEtXtSEZXSEZXSEZXSEZXZ2222222222,::,,::,记为置信区间为时当理论值为记为置信区间为时当理论值为二、总体方差已知时,对总体平均数的估计⒈当总体分布为正态分布时,(无论样本容量n的大小,从该总体抽取的样本分布均成正态分布。)对总体平均数的估计可以依正态分布进行估计。例1已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取15名6岁男童,其平均体重为20.4公斤,试求该市6岁男童平均体重的95%和99%的置信区间。例1的计算解:95%的置信区间的显著性水平α=0.05,因此,μ的95%的置信区间为:即:μ的99%的置信区间为:即:故该市6岁男童平均体重μ的95%的置信区间为[19.11,21.69];99%的置信区间为[18.7,22.1]。66.087.356.21555.6nSEX96.12Z66.096.14.2066.096.14.2069.2111.1966.058.24.2066.058.24.201.227.18二、总体方差已知时,对总体平均数的估计⒉当总体为非正态分布时(只有当样本容量n30时,此时样本抽样分布渐近正态分布。这时可依正态分布进行估计,否则不能对总体平均数进行估计。)例2已知某区15岁男生立定跳远的方差为,现从该区抽取58名15岁男生,测得该组男生立定跳远的平均数为198.4cm,试求该区15岁男生立定跳远平均成绩的95%和99%的置信区间。cm8.436例2解:由题意知:由于样本容量(n=58)大于30,该样本的抽样分布为渐进正态分布。因此,μ的95%的置信区间为:198.4-1.96×2.75≤μ≤198.4+1.96×2.75即193.01≤μ≤203.79μ的99%的置信区间为:198.4-2.58×2.75≤μ≤198.4+2.58×2.75即191.3≤μ≤205.5故该区15岁男生立定跳远的平均成绩有95%的可能落入[193.01,203.79]内,有99%的可能落入[191.3,205.5]内。75.26.79.20588.436nSEX三、总体方差未知,对总体平均数的估计1.假定条件总体服从正态分布,且方差(2)未知2.使用t分布统计量3.总体均值在1-置信水平下的置信区间为)1(~1ntnsxt12nstxt分布t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z三、总体方差未知,对总体平均数的估计⒈当总体分布为正态分布时(无论样本容量n的大小,从该总体抽取的样本所形成的分布均服从自由度为n-1的t分布,对总体平均数的估计可依t分布进行估计)例3从某市抽取20名7岁女童,经测量,这20名女童的平均身高为116cm,标准差为5cm,试求该市7岁女童总平均身高的95%和99%的置信区间。例4从某市抽取36名7岁女童,经测量,这36名女童的平均身高为115.8cm,标准差为4.8cm,试求该市7岁女童总平均身高的95%和99%的置信区间。例3解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高μ进行估计。29.11971.11215.1861.211615.1861.2116:%9941.11859.11315.1093.211615.1093.2116:%95861.2;093.2:191201;15.1195119201.019205.0即的置信区间为的即的置信区间为的因此,值表可知查tttndfnSSEX例4解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高μ进行估计。03.11857.11381.075.28.11581.075.28.115:%9945.11715.11481.0042.28.11581.0042.28.115:%95,75.2;042.2:351361;81.0358.4130201.030205.0即的置信区间为的即的置信区间为的因此值表可知查tttndfnSSEX三、总体方差未知,对总体平均数的估计⒉当总体为非正态分布时(只有当样本容量n30时,此时样本抽样分布服从自由度为n-1的t分布,这时可依t分布对总体平均数进行估计,否则不能对总体平均数进行估计。)例5某校进行一次数学考试,从中抽取40名考生,经计算,这40名考生的平均成绩为82分,标准差为7分,试求全体考生平均成绩的95%和99%的置信区间。例5解:由题意知,其总体方差未知,其总体分布也未知,但n=4030,因此可以依t分布对全体考生平均成绩μ进行估计。03.8597.7812.1704.28212.1704.282:%9926.8474.7912.1021.28212.1021.282:%95,704.2;021.2:391401;12.1397140201.040205.0即的置信区间为的即的置信区间为的因此值表可知查tttndfnSSEX第三节总体标准差与总体方差的估计一、总体标准差的区间估计估计总体标准差的步骤与估计总体平均数的步骤大致相同。但有两点需要说明:⒈从抽样分布的讨论已知,样本标准差的抽样分布在n30时为渐近正态分布,总体标准差可依正态分布来估计。当n30时,总体标准差则无法估计。⒉从理论上讲,样本标准差分布的标准差—标准误可由来计算,但由于总体标准差未知,可用总体标准差的无偏估计量Sn-1作为替代来计算标准误。即nSES2nSSEnS21标准差的区间估计1.假定条件样本容量大于30,样本标准差分布近似服从正态分布。2、总体标准差在1-置信水平下的置信区间为nSZsnn2121例7某区一次英语统考中,随机抽取40名考生,计算其英语成绩的标准差为15.6,试求该区英语统考成绩总标准差的95%和99%的置信区间。解:由题意知,由样本标准差估计总体标准差,且n30,可依正态分布估计。17.2003.11:77.158.26.1577.158.26.15:%9905.1915.12:77.196.16.1577.196.16.15:%95,77.194.88.158039406.152121即的置信区间为的即的置信区间为的因此nnnSnSSEnS二、总体方差的估计根据对抽样分布的讨论可知,分布的特征之一是从正态分布总体中,随机抽取容量为n的样本,其样本方差与总体方差比值的分布为分布。即:22681158:48)48(1221212222122122222222122222nnnnSnSnnSnSSnnSXX或间确定总体方差的置信区值与样本方差来,我们可利用理论由公式总体方差的

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功