沈阳理工大学徐静霞版统计学--(12)第5章-参数估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

LOGO第5章参数估计5.1抽样与抽样分布5.2参数估计的基本原理5.3总体均值的区间估计5.4总体比例的区间估计5.5样本量的确定导入案例:大学生每天花多少时间上网某大学经济管理学院为了解学生每天上网的时间,在全院1500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):根据上表的计算,样本的平均上网时间为3.317小时,标准差为1.609小时。根据这些资料,该如何推断全院学生每天的平均上网时间呢?每天上网时间超过4小时的学生比例又应该是多少?本章将对这些问题进行阐述。3.33.16.25.82.34.15.44.53.24.425.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5学习目标1.抽样与抽样分布。了解概率抽样的方法,熟悉常见的随机变量概率分布,掌握样本均值和样本比例的抽样分布。2.参数估计的基本原理。熟悉参数估计的数理统计基础,重点掌握点估计和区间估计的原理。学习目标3.总体均值的区间估计。重点掌握在大样本条件下总体均值的区间估计,以及正态总体方差未知和小样本下总体均值的区间估计。4.总体比例的估计。重点掌握大样本下总体比例的区间估计。5.样本量的确定。重点掌握估计总体均值和估计总体比例时样本量的确定方法。5.1抽样与抽样分布5.1.1概率抽样的方法5.1.2几种重要的随机变量分布5.1.3抽样分布5.1.4统计量的标准误5.1.1概率抽样的方法概率抽样:是根据一个已知的概率来抽取样本单位,总体中哪一个单位会被抽中,并不取决于研究人员的主观意愿,而是取决于客观的机会——概率。特点:单位被抽中完全是随机的。一般的抽样推断都是建立在概率抽样的基础之上的。常见的概率抽样方法有:简单随机抽样,分层抽样,系统抽样,整群抽样等。5.1.1.1简单随机抽样简单随机抽样:又称纯随机抽样,它是按随机原则直接从总体N中抽取样本单位n。特点:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。适用的条件:通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。简单随机抽样方法简便,易于掌握。分类:重复抽样和不重复抽样。重复抽样重复抽样也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。重复抽样可能的样本数为:不重复抽样不重复抽样也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。不重复抽样可能的样本数为:nNm重)!(!!!)1()3)(2)(1(nNnNnnNNNNNCmnN不重5.1.1.2分层抽样分层抽样:是常用的一种抽样方式,它是先将总体各单位划分成若干类(或层),然后在各组内按随机原则抽取若干单位,将所有组抽样的样本单位组成一个样本。特点:1.将总体内性质比较接近的单位分在一组,然后在每一组内抽样;2.除了可以对总体进行估计外,还可以对各层的子总体进行估计;3.分层抽样可以按自然区域或行政区域进行分层,使抽样组织和实施都比较方便。适用范围:总体情况复杂,各单位之间差异较大,单位较多的情况。5.1.1.3系统抽样系统抽样:是将总体各单位按某种顺序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:1、抽取方式简单,容易实施2、样本在总体中分布较为均匀例如:对某市的工业企业做调查,就可以按照相关部门的习惯顺序排列,直接利用这些顺序进行等距抽样。5.1.1.4整群抽样整群抽样:它是将研究对象的总体划分为若干群(或称为组),然后按照随机的原则抽取若干个群(或组),对抽中的群(或组)内所有单位都进行调查的一种抽样组织形式。特点是:研究的单位比较集中,工作的组织和进行比较方便,可以节省人力、物力和财力,尤其是当总体中包括的单位数很多,且缺乏可靠的登记资料时经常采用。适用范围:群间差异性不大或者不适宜单个地抽选样本的情况。1.在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布2.是一种理论分布。3.随机变量是样本统计量样本均值,样本比例,样本方差等4.结果来自容量相同的所有可能样本5.提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布(samplingdistribution)5.1.2几种重要的随机变量分布二项分布、正态分布、分布、t分布、F分布25.1.2.1二项分布二项分布是离散型随机变量概率分布的一种,是建立在贝努力实验的基础上的。n重贝努力实验满足下列条件:1.一次实验只有两个可能,即“成功”和“失败”。2.一次实验“成功”的概率为,“失败”的概率为而且概率对每次试验都是相同的。3.实验是相互独立的,且可以重复进行n次。在n次实验中,“成功”的次数的概率分布就是二项分布记为。n次实验中成功次数为x的概率可表示为:二项分布的期望值和方差分别为:ppq1pnBX,~xnxxnqpCxXPnx,,2,1,0npXE)(npqXD2某电子元件厂,已知其一批产品的合格率为95%,从中有放回的抽取10个,求10个产品中:(1)全部合格的概率;(2)有一个不合格产品的概率;(3)有2个以下不合格产品的概率。【例5.1】【例5.1】解:每取一个产品就是一次独立实验,n=10,由于是有放回的抽取,因此每次试验是独立的,每次抽取不合格率为5%。设X为抽取的不合格产品数,显然pnBX,~598736939.0)0(XP315124705.0)1(XP998971502.0)3(XP概率分布分别为(1)(2)(3)5.1.2.2正态分布特点:在总体平均数及其附近,总体单位数最多;相反地,越远离总体平均数,总体单位数越少。若随机变量服从正态分布,记为~,其概率密度函数所对应的曲线如图所示。X),(2N)xf(不同的值和值,对应的正态分布就不同。)xf(0aa图2不同的的正态分布曲线图不同的值和值,对应的正态分布就不同。)xf(=0.5=2=1a图3不同的正态分布曲线图我们把参数时的正态分布称为标准正态分布(standardnormalditribution),如果随机变量X服从正态分布,其数学期望值(均值)为方差为,若令则Z就服从标准正态分布,通常用记为Z~N(0,1)表示。10,2XZ10,)(1zz)()()a(abbZP1)(2aaZP(1)(2)(3)某厂生产一批小型装置,其寿命X服从均值为8,标准差为2(单位:年)的正态分布。(1)求整批小型装置中寿命大于7的比率;(2)求整批小型装置中寿命介于7-9年的比率;(3)如果工厂规定在保用期间遇有故障可免费换新,将要求免费换新的比率定为3%,求保用年限。【例5.2】解:22,8N~X6914625.03085375.01)7(1)7(XPXP382925.07)P(X-9)P(X9)XP(7(1)利用【NORMDIST】函数:(2)利用【NORMDIST】函数:(3)利用【NORMINV】函数得:MORMINV(0.03)=4.2384128即工厂应将保用年限定为4年。5.1.2.3分布(适用于方差的估计与检验)222)(n2分布具有如下的特征:1.分布的变量值始终为正值;2.分布的形状取决于自由度n的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称,如图4所示.n=4n=20n=10n=1图4不同自由度的分布25.1.2.4t分布t分布是类似正态分布的一种对称分布,当随机变量X服从标准正态分布N(0,1),Y服从分布,X,Y相互独立,则)(n2nYXt分布称为t分布,记为t(n),其中n为自由度。t分布通常比标准正态分布要分散和平坦一些,如下图5所示。N(0,1)t(4)图5t分布的分布曲线示意图5.1.2.5F分布2F分布(F-distribution)是两个分布的比。设随机变量Y和Z相互独立,且Y和Z分别服从自由度为m和n的分布,则随机变量X,2nZmYX服从第一自由度为m,第二自由度为n的F分布,记为F(m,n)。F分布的图形与分布类似,其形状取决于两个自由度,如图6所示。2(3,5)(5,15)(40,25)图6不同自由度的F分布1.在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布2.是一种理论分布。3.随机变量是样本统计量样本均值,样本比例,样本方差等4.结果来自容量相同的所有可能样本5.提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布(samplingdistribution)【例5.3】已知总体有4名学生A,B,C,D,他们的年龄分别为岁,岁,岁,岁,从中抽取2人调查平均年龄。此时样本均值的抽样分布是所有的样本均值形成的相对频数分布,即的概率分布。5.1.3.1样本均值的抽样分布x201x222x243x264x543113)(22224122Nxii总体平均年龄总体标准差样本序号样本单位名称样本单位标志值样本平均数12345678910111213141516AAABACADBABBBCBDCACBCCCDDADBDCDD20,2020,2220,2420,2622,2022,2222,2422,2624,2024,2224,2424,2626,2026,2226,2426,2620212223212223242223242523242526合计————23表2重复抽样且考虑抽样顺序样本及其均值计算表xxx样本平均数的个数取值的概率2021222324252612343211/162/163/164/163/162/161/16表3样本平均数分布xxxx)(xP262524232221200.10.20.30x)(xP图7样本均值的抽样分布样本均值的分布与总体分布的比较(例题分析)=23σ2=5总体分布样本均值分布23x5.22x00.050.10.150.20.250.31234x的取值P(x)样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布Xn=165x50x5.2x当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布xn中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xX中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程总体分布正态分布非正态分布正态分布非正态分布正态分布大样本小样本大样本小样本样本均值抽样分布与正态分布的关系1.样本均值的数学期望2.样本均值的方差重复抽样不重复抽样样本均值的抽样分布(数学期望与方差))(XEnX22122NnNnX通过计算,可知样本平均数的标准差和总体标准差之间存在一定的对应关系,即nnxiix216122251640)(xx2316368nxxx以上的结论,我们可以通过例6-6计算证明。可知样本平均数的平均数等于总体平均数,即:xx1.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为

1 / 84
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功