第三四章抽样与抽样分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11※※※※※※※※※※※●正态分布及其应用:◎引言:无论是二项分布还是泊松分布,它们都有一个共同的特点,即当n逐渐增大时,都将趋近于对称分布,进而趋近于正态分布,因此,二项分布和泊松分布的概率表,通常只列出n=20的概率,当n≥30时,两个分布都趋近于正态分布。◎正态分布(高斯分布),是一种常用的典型的概率分布。18世纪德国的数学家和天文学家高斯在正态分布理论发展过程中做过突出贡献,因此也被称作“高斯分布”。※正态分布的重要地位:1、在实际观察到社会、经济、自然现象的数据表现上,其频率分布与正态分布十分接近;2、正态分布的固有性质,给抽样推断理论提供了必要的基础,使它在抽样分布、区间估计、假设检验中被广泛应用。●正态分布的概率密度函数:222/)(221)(xex式中:x在正负无穷之间;μ、σ2为参数;e=2.7183;π=3.14159;可记为X~N(μ,σ2)。◎1、正态分布曲线特征:22(1)曲线为对称分布,在X=μ处达到极大值;(2)曲线两尾端趋向无穷小,但永不与横轴相交;(3)曲线的形状取决于标准差的大小;(4)曲线的位置取决于平均数的大小;(5)曲线的平均数、中位数、众数相等;(6)曲线下全部面积为1,并在一定标准差倍数范围内,所含的概率比重是相同的。◎2、数理统计证明:1)、平均数加减一个标准差(μ±σ1)的范围,包含总体全面积的68.26%;2)、平均数加减一个标准差(μ±σ2)的范围,包含总体全面积的95.44%;3)、平均数加减一个标准差(μ±σ3)的范围,包含总体全面积的99.74%。☆正态分布曲线族有两类:平均数相等标准差不等平均数不等标准差相等◎3、标准正态分布表的使用:☆怎样将各种形状的正态分布转换为标准正态分布呢?标准正态分布要求:。;;-xz10Z值为从随机变量X到该分布平均数的距离,相当于σxff((xx))CAB33的倍数。Z值可以看成是σ的标准单位。μ=60σ=204080原始分布:μ=60,σ=20μ=60Z分布:μ=0σ=1-3-2-10123▲例题:已知某总体服从平均数为10,标准差为2.5的正态分布。求任意值大于或等于15的概率。解:Z=(15-10)/2.5=20.97725与Z=2对应的概率为0.97725P(x≥15)=1-0.977251015=0.02275◆习题1、假如某一学院的入学考试分数是服从平均数为450,标准差为100的正态分布,求:(1)有多少学生比率的得分在400—500之间?(2)若某一学生得分是630分,则比他更好和更差的学生其比率各为多少?解:(1)Z1=(400-450)/100=-0.544Z2=(500-450)/100=0.5与Z=0.5对应的概率为0.691462400450500则:P(400≥x<500=0.691462-0.5=0.191462×2=0.382924(2)Z=(630-450)/100=1.8则:P(x<630==0.9641P(x≥630)=1-0.9641=0.0359◆习题2、教材P101,11(1)95.254%95254.0)6667.1()30200150()150(zpzpxp150[-Z]200(2)90%35.49,645.130,95.0)30(9.0)3030200()200(kkkzpkxzpkxp即:-Z200Z◆习题3、美国某大型商场牙膏销量,据信是服从每周平均数为10000盒,标准差为1500盒的正态分布。问:(1)任意一周牙膏销量超过12000盒的概率是多少?(2)为使公司库存充裕,以满足每周需求高达95%的概率,问库存应备多少盒牙膏?55解:(1)Z=(12000-10000)/1500=1.33,与1.33对应的概率=0.4082,超过12000盒的1000012000概率=1-0.908241=0.091759(9.176%)。0.95(2)与0.95概率对应的Z值为1.645,(X-10000)/15000=1.645,X=12468(盒)。◆习题4、某一出口产品(容器),技术资料显示,其填装量为服从标准差为0.6盎司的正态分布。若填装重量少于18盎司的比率为2%,问其平均填装重量为多少?解:与比率1-0.02=0.98,对应的Z=-2.05,0.02(18-μ)/0.6=-2.05,μ=19.23(盎司)18◆习题5、已知某加工厂工人日包装量为平均每人25件,从中抽取一人,其日包装量小于10件的概率为7.78%,问工人日包装量的标准差是多少?7.78%解;因为:1-0.0778=0.9222,对应的Z=1.42所以:与0.0778对应的Z=-1.421025则;(10-25)/σ=-1.42-Zσ=10.56(件)绿绿色色健健康康饮饮品品66第四章抽样与抽样分布抽样调查的必要性告诉人们,在许多情况下不必要或不可能进行全面调查,这时,要了解总体的情况,只能由样本统计量估计总体参数。※常用的抽样方法※1、简单随机抽样重复抽样等概率(纯随机抽样)不重复抽样等可能2、分层抽样先分组,后抽样。(分类抽样)4个优点P106(3)3、系统抽样:有序排列确定起点间隔抽取(机械抽样、等距抽样)随机性4、整群抽样:简便。前提是总体分布均匀。〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖*〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗◎抽样分布与中心极限定理●1、抽样分布:全部可能样本统计量的概率分布叫做抽样分布。(总体分布、样本分布)◎x的抽样形式与特征:以下是一个极端的例子:假定一个实验小组有四人N=4,其写作成绩分别为:21、20、19、18(分)(25为满分)。若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、准正态分布是推断统计的基石77差如下表:样本容量n=2,则全部可能样本(重复抽样)是16个:x频数频率(%)18.010.0618.520.1319.030.1919.540.2520.030.1920.520.1321.010.06合计161.00x=?x=?对比不重复抽样的x、x有何启示?1.118)(645.0)5.19418192021(5.195.18x)18,19(n19x)18,20(n7071.0s5.19x)19,20(n1213.2s5.19x)18,21(n4142.1s20x)19,21(n0.7071s5.20x)20,21(n6655444333222111xxnxnx88平均数抽样分布图:接近正态分布。1818.51919.52020.521xx=19.5;x=0.79;x=79.02118.1=n重复抽样●2、中心极限定理:数理统计证明:(1)当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布,必定趋近于正态分布;(2)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n≥30,其抽样分布必定趋近于正态分布;见书P111图4.5(3)抽样分布的平均数等于总体平均数:x=;99(4)抽样分布的标准差总体标准差小,且随着样本容量的增加,x随之减小:x=n;★x也称为“抽样平均误差”。在区间估计中,样本容量n越大,样本平均数围绕总体平均数摆动的幅度越小,样本平均数的分布曲线变得又窄又高,它意味着样本平均数落在总体平均数附近的概率也相应增大。◆极限定理在区间估计中的作用:可以确定从总体中抽取一个随机样本,其平均数出现在一个指定值域内的概率。●3、平均数的抽样分布及应用:(见PPT)▲例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?图1:总体分布:σ=2000图2:抽样分布P?15000X15000X解:由于n≥30,是容量为30的所有可能样本之一,15750是所有样本平均数随机变量之一,见图2。根据中心极限定理作适当变换,下列关系式成立:1010。该公式引入了样本概念修改后:x-xz15000nxxzxxxx所以:Z=2.05,查表,对应概率为0.4798,故大于15750元的概率为0.5-0.4798=0.02。▲教材P117,1617▲教材P118,18(1)20;2;(2)正态;(3)-2.25;(4)1.5▲教材P118,18(1)1-0.97725=0.02275;(2)1-0.933193=0.0668;(3)1-0.99379=0.00621;(4)(0.97725-0.5)+(0.841345-0.5)=0.818595;(5)1-0.99865=0.00135。▲教材P118,19(1)0.8944;(2)0.0228;(3)0.1292;(4)0.9699。※教材P118,20(1)),(;;;991011100x333333.03100x390010100xz1111(2)1;(3)不一定。▲教材P118,22趋于正态分布※教材P118,23(1)n=49≥30,正态分布;x=213(美元);2x=224915x4.5918(2)0.5;大于217的概率是1-0.969258=0.030742;在P(209—217)=(0.969258-0.5)×2=0.938516※教材P119,(1)x=406克;x=1.68333;正态分布。(2)1-0.998999=0.001001(3)是。因为Z=-3.09,超出了±3Z,出现了小概率。▲教材P18(1)增加;(2)减少。※教材P119(1)n=50≥30,正态。(2)P(X≤830)≈0;(因为Z=-4.7);(3)生产过程不正常;1212(4)仍是正态;P(X≤830)=0.0582),(Z=1.57)。※教材P119,0027.02)99865.01()33(:)2(015.04%13:)1(xxxxp(3)由(1)可知【【【【【【【【【【【【【【【【【【【【【【◎】】】】】】】】】】】】】】】】】】】】】】●4、有限总体(或不重复抽样)修正系数:◎问题的提出:用样本估计总体时比较下列误差谁大?无限总体有限总体重复抽样不重复抽样有限总体修正系数为:1NnN它永远小于1。※当抽样比例n/N≤0.05时,可以省略修正系数;当抽样比例n/N>0.05时,一般需要使用修正系数,原平均误差公式修正为:1NnNnx;▲案例:从阿根廷、加拿大、美国到货三批玉米,分别为600包、6000包、60000包。合同规定三批玉米平均每包重量都是80公斤,标准差都是4公斤。要求:(1)若从每批玉米中都抽取300包为样本,分别计算它们的平均误差。1313有何启示?(要求都使用修正系数)23.099.032.174160000300600003004225.097.032.1741600030060003004163.071.032.17416003006003004)1(MxJxAx◎三批玉米的抽样比例n/N分别为:阿300/600=0.5;加300/6000=0.05;美300/60000=0.005〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖〖※〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗〗▲习题1:某地有200家外贸企业,年平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率为多少?解:007143.0992857.01)100(;45.2085.490100085.49078.06271200362003627118.0200/36/,30

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功