社会统计学(卢淑华)-第五章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第五讲正态分布、常用统计分布和极限定理第一节正态分布一、中心极限定理对于任何变量,不管其分布如何,如果把它们几个加在一起,当n大于一定数之后,那么其和的分布必然接近正态分布。二、正态分布(常态分布、高斯分布)1、分布密度曲线特征:1)曲线是单峰,有一个最高点2)曲线在高峰处有一个对称轴。在轴的左右两边是对称的。(对称轴x=µ)3)曲线无论是向左或向右延伸,都会愈来愈接近横轴,但不会和横轴相交,以横轴为渐进线。2、正态分布的众值、中位值和均值三者是重叠的。x3、正态分布的概率密度22212xe(µ和σ为两个变量)一定:µ增大,图形右移;µ减小,图形左µ不变,值改变:σ越小,图形越尖瘦。4、两个参数µ不σ对曲线形态的影响2移。但形状不变。2µ的影响µ增大,图形右移;µ减小,图形左移。但形状不变。σ的影响σ越小,图形越尖瘦Exxdx(数学期望)D5、µ不σ的含义µσx2xdx(标准差)三、正态曲线下的面积我们把正太曲线看做是一种极限的直方图。它的组距甚小,以至中心值顶点的连线已是一条平滑的曲线。而正太曲线下的面积,实际就是由这无数个小直方形拼接而成的。每小块面积=长×宽=xixiPxixi面积的概率分析2xi2xi因此任意两点x1x2曲线下的概率,就是把从x1到x2点所有这些小块面积加起来:x2ix1当xi0,任意两点之间的概率为x2x1取值区间的概率值任意两点x1x2间的概率为:x2x1正态分布的几个典型取值区间的概率值:,之间:0.68272,2之间:0.95453,3之间:0.9973(σ为组距)zzxex第二节标准正态分布xz一、标准分——Z值:Zx2概率密度:122当0,1时e22212因此,标准正态分布可以看作一般正态分布的一个特例。当0,1时,记做N0,1一般正态分布记做N,2,标准分以均值基点,以标准差为度量例某地家庭平均娱乐费支出为120元,标准差为5元,如果某家庭的娱乐费支出为130元,标准分为多少?二、正态分布N,2和标准正态分布N0,1面积乊间的对应关系二者分布图的区别只在于对称轴不同,前者以µ为轴,后者以0为轴。几个典型取值区间P1z10.6827P2z20.9546P3z30.9973例:例1:σ相同而µ不同。学习成绩:甲位于一班,乙位于二班。一班平均成绩80分,二班平均成绩60分,甲成绩80分,乙成绩80分。σ相同,为10,比较二者在班上的成绩。例二:µ相同而σ不同:如果1260110,220,比较甲、乙的成绩。ztd第三节标准正态分布表的使用一、查表方法:附表4,1、3、5、7列z的不同取值,2、4、6、8列给出的是对应式的面积zet2212图示例:1、已知ξ服从标准正态分布N0,1,求1)P1.32)P1.33)P1.32.32、ξ满足N0,1,P0.05,求λ值。3、ξ满足N50,52,求P612将其称为自由度为K的X2分布,记做X2(k)第四节常用统计分布一、X2分布(卡方分布)1、设随机变量1,2,k相互独立,且都服从N(0,1),其平方和:x21222k2的分布密度为:22k20kxk21ek1k2x当x0当x0卡方分布图分布图形:偏左侧分布,随自由度的增加,图形渐趋对称。xi1k量:仍然服从自由度为k的X2的平方分布。卡方分布性质性质1如果随机变量1,2,……k相互独立,2i1222性质2:从自由度为K1与K2的X2分布,则其和服从自由度为K1+K2的X2分布。如果随机变量和独立,并且分别服例题已知:k=10,a=0.05,求X20.05(10)=?已知:k=9,a=0.025,求满足p(X2<X21-a)=a中的X21-a1kk122zk二、t分布(学生分布)的分布密度为:称之为:自由度为k的t分布1、设随机变量与独立,且服从标准正态分布,服从自由度为K的X2的分布,则随机变k量tk12k2tzt分布图2、性质:t分布的分布曲线是关于z=0对称的,当k=时,t分布将趋于标准正态分布(当k30时,分布曲线就差不多相同了)。正态分布是其极限分布。3、查表,对不同自由度k及不同的数α(0α1)给出满足等式t的tα值例题已知:k=10,a=0.05,求t0.05(10)=则随机变量Fk的分布密度为:k1k2k1k2k1k222zk1zk2zk2三:F分布,k1为第一自由度(分子),k2为第二自由度(分母)。1、设随机变量与独立,且都服从X2分布,自由度分别为k1及k2。k12Fzk12k1122k1k2220当Z0当z0Fk1,k2dxxFFpF2、F分布的性质:为非对称分布。3、查附表,对不同自由度(k1,k2)及不同的数α(0α1),给出了满足等式F的Fα值另一性质已知:a=0.05,求:F0.95(1015)1Fk2,k1F1k1,k2第五节大数定理不中心极限定理1、大数定理:研究在什么条件下,随机事件可以转化为不可能事件或必然事件,即阐明大量随机现象平均结果稳定性的一系列定理。2、中心极限定理:研究在什么条件下,随机变量之和的分布可以近似为正态分布,称中心极限定理。一、切贝谢夫丌等式:定义:如果随机变量,有数学期望E和D方差,则不论的分布如何,对于任何数,都可以断言,和E的绝对离差大于等于的概率,不超过D2,即D2PED2或PE1limpp1二、贝努里大数定理1、定义:设m是n次独立观察中事件A出现的次数,而p是事件A在每次观察中出现的概率。那么,对于任何一个正数,有mnn2、含义:在相同条件下进行多次观察时,随机事件的频率mn有接近其概率的趋势。意义:为用抽样成数来估计总体成数p奠定了理论基础。p1有:limn三、切贝谢夫大数定理3、实际:意义可以用抽样的均值做为总体均n1、定义:设随机变量1,2…是相互独立服从同一分布,并且有数学期望Ei及方差Di2,那么对于任何一个正数,nn为1,2…n个随即变量的平均值2、含义:当实验次数n足够大时,n个随机变量的平均值n与单个随机变量的数学期望的差可以任意的小,这个事实以接近于1的很大概率来说是正确的,即n趋近于数学期望量,不管其分布如何,只要DlimPnx2ted四、中心极限定理1、表述方式:设1,2,…,k为独立同分布的随机变2ii存在,则对x有xtn22n12、中心极限定理的意义1)对随机变量的原有分布不做要求,因此,从理论上说明了正态分布的重要性2)它为样本容量的确定和大样本(n大于等于50)情况下的统计推论提供了理论依据。3)在社会调查中使用价值广。4)在抽样调查中有着重要意义。

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功