《统计学》-单薇主编-第5章抽样与抽样分布.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学STATISTICS第5章抽样与抽样分布统计学STATISTICS1-2学习目标理解随机试验和随机事件的概念,了解事件之间的关系;理解概率的定义,掌握概率的运算法则;理解随机变量和概率分布的概念;掌握二项分布的主要特征及其应用;掌握正态分布的主要特征及其应用;了解随机抽样方法;了解抽样分布的形成过程,理解抽样分布的意义,掌握抽样分布的性质;理解大数定律和中心极限定理。统计学STATISTICS1-3目录抽样调查概述抽样估计的原理抽样分布SPSS在概率论中的应用统计学STATISTICS5.1抽样调查概述统计学STATISTICS1-5抽样调查:按照一定的规则从总体中取出一部分单元组成一个样本,并收集样本的数据资料的过程,简称为抽样。样本:按照一定的抽样规则从总体中抽取的一部分单位组成的集合。根据抽样的原则不同,抽样方法有随机抽样和非随机抽样两种。随机抽样:根据一个已知的概率来抽取样本单位,也称随机抽样非随机抽样:研究人员有意识地选取样本单位,样本单位的选取不是随机的。统计学STATISTICS1-6随机抽样的特点:1.按一定的概率以随机原则抽取样本;•抽取样本时,使每个单位都有一定的机会被抽中。2.每个单位被抽中的概率是已知的,或是可以计算出来的;3.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。统计学STATISTICS1-75.1.1简单随机抽样简单随机抽样:从总体N个单位中抽取n个单位作为样本时,使得每一个总体单位都有相同的机会(概率)被抽中也称纯随机抽样是抽样调查中应用最多的方法之一也是最基本的抽样方法之一统计学STATISTICS1-8简单随机抽样抽取元素的具体方法有:重复抽样:从总体中抽取一个单位并加以计量后,把这个单位放回到总体中再抽取第二个单位,直到抽取n个单位为止;不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止。统计学STATISTICS1-9特点:①简单、直观,在抽样框完整时,可直接从中抽取样本;②用样本统计量对目标量进行估计比较方便。局限性:①当N很大时,不易构造抽样框;②抽出的单位很分散,给实施调查增加了困难;③没有利用其他辅助信息以提高估计的效率。统计学STATISTICS1-105.1.2分层抽样分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为若干层(类),然后从不同的层中独立、随机地抽取一定数量的单位组成一个样本,也称分类抽样(stratifiedsampling)。在分层或分类时,应使层内各单位的差异尽可能小,而使层与层之间的差异尽可能大。统计学STATISTICS1-11分层抽样的优点:既可以对总体进行估计,也可以对各层的子总体进行估计;抽样的组织和实施都比较方便;分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀;估计的精度高。统计学STATISTICS1-125.1.3系统抽样系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则在一定的范围内随机确定一个起点,然后每隔一定的间隔抽取一个单位,直到抽取n个单位为止,也称等距抽样或机械抽样。从数字1到k之间随机抽取一个数字r作为初始单位,然后依次取r+k,r+2k,…,r+(n-1)k优点:简便易行;系统抽样的样本在总体中的分布一般比较均匀,由此抽样误差通常要小于简单随机抽样。缺点:对估计量方差的估计比较困难。统计学STATISTICS1-135.1.4整群抽样整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查和观察。特点:抽样时只需群的抽样框,可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估计的精度较差。统计学STATISTICS5.2抽样估计的原理统计学STATISTICS1-15抽样估计:在抽样调查的基础上,利用样本的数据资料计算样本指标,以样本特征值对总体特征值做出具有一定可靠程度的估计和判断。是由部分推断总体的一种认识方法,建立在随机取样的基础上,主要运用不确定的概率估计方法(分布理论、大数定律、中心极限定理和抽样分布理论),其误差可以事先计算并加以控制。其目的是用样本统计量来推断总体参数。统计学STATISTICS1-16在简单随机重复抽样中,每次抽样都是独立的。如果从总体N个单元中抽取容量为n的样本,随机变量Xi表示第i次抽样的结果,则Xi服从在总体N个单元上均匀取值的多项分布,所以为独立同分布随机变量序列X1,X2,…,Xn和的一个取值,其中12.nxxxxnnx统计学STATISTICS1-17如果总体中具有性质的A单元的比率为π,随机变量Yi=1表示第i次抽样取得的样本单元具有性质A,否则Yi=0,则Yi服从概率为π的两点分布,所以np为独立同分布随机变量序列Y1,Y2,…,Yn和的一个取值,其中关于独立同分布随机变量和的概率分布,大数定律和中心极限定理给出了很好的解释。12.nAyyynpnn统计学STATISTICS1-185.2.1抽样估计的基本理论概率与概率分布必然现象(确定性现象)•变化结果是事先可以确定的,一定的条件必然导致某一结果;•这种关系通常可以用公式或定律来表示。随机现象(不确定现象)•在一定条件下可能发生也可能不发生的现象;•个别观察的结果完全是偶然的、随机会而定;•大量观察的结果会呈现出某种规律性(随机性中寓含着规律性)——统计规律性。十五的夜晚能看见月亮?十五的月亮比初十圆!统计学STATISTICS1-191.随机试验严格意义上的随机试验满足三个条件:试验可以在系统条件下重复进行;试验的所有可能结果是明确可知的;每次试验前不能肯定哪一个结果会出现。广义的随机试验是指对随机现象的观察(或实验)实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。统计学STATISTICS1-202.随机事件随机事件(简称事件):随机试验的某一个可能结果,常用大写英文字母A、B、……来表示。基本事件(样本点):不可能再分成为两个或更多事件的事件。复合事件:由简单事件组合而成的事件。样本空间():基本事件的全体(全集)。统计学STATISTICS1-21两个特例必然事件:在一定条件下,每次试验都必然发生的事件。只有样本空间才是必然事件不可能事件:在一定条件下,每次试验都必然不会发生的事件。不可能事件是一个空集(Φ)统计学STATISTICS1-223.随机事件的概率概率:用来度量随机事件发生可能性大小的数值。必然事件的概率为1,表示为P()=1不可能事件发生的可能性是零,P()=0随机事件A的概率介于0和1之间,0≤P(A)≤1概率的三种定义,给出了确定随机事件概率的三条途经。统计学STATISTICS1-23概率的古典定义前提:古典概型定义(公式)【例】设有50件产品,其中有5件次品,现从这50件中任取2件,求抽到的两件产品均为合格品的概率是多少?抽到的两件产品均为次品的概率又是多少?()AmPAn=事件中包含的基本事件数=样本空间中基本事件总数统计学STATISTICS1-24概率的统计定义若在相同的条件下重复进行的n次试验中,事件A发生了m次,当试验次数n很大时,事件A发生频率m/n稳定地在某一常数p上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义p为事件A发生的概率当n相当大时,可用事件发生的频率m/n作为其概率的一个近似值——计算概率的统计方法(频率方法)().PApmn=?统计学STATISTICS1-25【例】根据古典概率定义可算出,抛一枚质地均匀的硬币,出现正面与出现反面的概率都是0.5。历史上有很多人都曾经做过抛硬币试验。试验者试验次数正面出现的频率蒲丰40400.5069K.皮尔逊120000.5016K.皮尔逊240000.5005罗曼诺夫斯基806400.4979统计学STATISTICS1-26【例】某地区几年来新生儿性别的统计资料如下表所示,由此可判断该地区新生儿为男婴的概率是多少?观察年份新生儿数(个)男婴数(个)男婴比例(%)200016248270.509200112056220.516200215127740.512200314077150.508统计学STATISTICS1-27主观概率有些随机事件发生的可能性,既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来近似。主观概率——依据人们的主观判断而估计的随机事件发生的可能性大小。例如某经理认为新产品畅销的可能性是80%人们的经验、专业知识、对事件发生的众多条件或影响因素的分析等等,都是确定主观概率的依据。统计学STATISTICS1-284.概率的性质非负性:对任意事件A,有P(A)≥0规范性:必然事件的概率为1,即:P()=1可加性:若A与B互斥,则P(A∪B)=P(A)+P(B)上述三条基本性质,也称为概率的三条公理。统计学STATISTICS1-29概率的公理化定义概率的以上三种定义,各有其特定的应用范围,也存在局限性,都缺乏严密性古典定义要求试验的基本事件有限且具有等可能性统计定义要求试验次数充分大,但试验次数究竟应该取多大、频率与概率有多么接近都没有确切说明主观概率的确定又具有主观随意性苏联数学家柯尔莫哥洛夫于1933年提出了概率的公理化定义通过规定应具备的基本性质来定义概率公理化定义为概率论严谨的逻辑推理打下了坚实的基础统计学STATISTICS1-305.条件概率条件概率:在某些附加条件下计算的概率在已知事件B已经发生的条件下A发生的条件概率——P(A|B)条件概率的一般公式:其中P(B)0。乘法公式:P(AB)=P(A)·P(B|A)或P(AB)=P(B)·P(A|B)()(|)()PABPABPB=统计学STATISTICS1-31P(A|B)=在B发生的所有可能结果中AB发生的概率。即在样本空间Ω中考虑的条件概率P(A|B),就变成在新的样本空间B中计算事件AB的概率问题了。一旦事件B已发生ABΩABBAB统计学STATISTICS1-32【例】某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为280件;乙厂生产600件,其中一级品有360件。若要从该厂的全部产品中任意抽取一件,试求:①已知抽出产品为一级品的条件下该产品出自甲厂的概率;②已知抽出产品出自甲厂的条件下该产品为一级品的概率。解:设A=“甲厂产品”,B=“一级品”,则:P(A)=0.4,P(B)=0.64,P(AB)=0.28①所求概率为事件B发生条件下A发生的条件概率P(A|B)=0.28/0.64②所求概率为事件A发生条件下B发生的条件概率P(B|A)=0.28/0.4统计学STATISTICS1-33【例】对例3-1中的问题(从这50件中任取2件产品,可以看成是分两次抽取,每次只抽取一件,不放回抽样)解:A1=第一次抽到合格品A2=第二次抽到合格品A1A2=抽到两件产品均为合格品12121()()()454419800.808250492450PAAPAPAA==??统计学STATISTICS1-346.事件的独立性两个事件独立一个事件的发生与否并不影响另一个事件发生的概率P(A|B)=P(A),或P(B|A)=P(B)独立事件的乘法公式:P(AB)=P(A)·P(B)推广到n个独立事件,有:P(A1…An)=P(A1)P(A2)…P(An)统计学STATISTICS1-357.随机变量随机变量——表示随机试验结果的变量取值是随机的,事先不能确定取哪一个值一个取值对应随机试验的一个可能结果用大写字母如X、Y、Z...来表示,具体取值则用相应的小写字母如x、y、z…来表示根据取值特点的不同,可分为:离散型随机变量—

1 / 108
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功