第七讲正态分布最常用的连续分布--正态分布(高斯分布)•中心极限定理表明:一个变量如果是由大量微小的、独立的随机因素叠加的结果,那么这个变量一定是正态变量。如:测量误差、产品重量、人的身高、年降雨量等。样本均值与正态分布1.从正态总体N(μ,σ2)取出样本,则样本均值服从正态分布N(μ,σ2/n)•为什么重复测量同一个零件多次,再取其读数的均值能够起到减少误差的作用2.从一个分布未知的总体中抽取样本,但已知总体均值为μ,方差为σ2,则当样本容量充分大时,样本均值近似服从正态分布N(μ,σ2/n)正态分布的概念和特征•变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。从理论上说,若随机变量x的概率密度函数为:222/)(21)(xexf则称x服从均数为μ,方差为σ2的正态分布正态分布的特征均数处最高以均数为中心,两端对称永远不与x轴相交的钟型曲线有两个参数:均数——位置参数,标准差——形状(变异度)参数1.510.5-0.5-1-1.5-2-3-2-1123均数决定正态分布的位置123标准差相同、均数不同的三个正态分布曲线标准差决定正态分布的“体型”均数相同、标准差不同的三条正态分布曲线正态分布曲线下的面积μ±σ范围内的面积为68.27%μ±1.96σ范围内的面积为95%μ±2.58σ范围内的面积占99%两个样本的样本点落入均数加减一个标准差区间的百分比上、下界已拉到最远正态分布由均值和标准差确定•正态曲线下的面积总和是1,正态曲线下一定区间内的面积代表变量值落在该区间的概率•求概率→求正态曲线下区间内的面积→求定积分或者转化为标准正态分布再求uΦ(u)正态分布的标准化•标准正态分布:指均数为0,标准差为1的正态分布•正态分布的标准化:Xz若x服从正态分布N(μ,σ2),则z就服从均数为0,标准差为1的正态分布正态分布的数学期望和方差dxxex2221).()(),,(~2XDXEσμNX和求设的期望和方差先求XZ)(ZEdxxx)(0)(ZDdxexx22221dxexexx222221|21110)(2ZE),1,0(~NZ2221xxde!),(2由期望和方差完全确定正态分布N,ZX因)(XE所以)(ZE)(2ZD)()(ZDXD2如何检验数据是否服从正态分布?•经验法:如画出数据频数(频率)条形图、茎叶图,看其分布形态•正态性检验:Matlab、SPSS等软件、正态概率纸横坐标等间隔,纵坐标按标准正态分布函数值给出。ninixi,,2,1),25.0375.0,(逐一点在正态概率纸上,若它们在一条直线附近,则认为该批数据来自正态总体一个均值为μ,标准差为σ的正态分布的图像是一条通过点(μ,0.5)而斜率为1/σ的直线累积分布函数•设X是一个随机变量,对任意实数x,则称为随机变量X的累积分布函数(cdf)xaxydttfyXPxXPxF)()()()(X离散X连续正态分布的分布函数tσxFxσμtdeπ21)(222)(求cdf1.抛掷2枚硬币,随机变量X是掷得正面的个数,求X的累积分布函数。1)2()2()10()1()1()0()0()0(.2,1,04341XPForXPXPFXPXPFX321-1-2-3-6-4-2246求cdf2.二项分布的概率密度函数是随机变量X是服从二项分布的,求X的累积分布函数。xrrnrrnnnnnppCxXPxFppCporXPXPFpXPXPFnX011)1()()()1()1()10()1()1()1()0()0()0(.,1,0一般地xnxxnppCxX)1()(Pp=cdf('bino',0:5,5,0.3)p=0.16810.52820.83690.96920.99761.00008642-2-4-6-8-15-10-551015•向半径为r的圆内随机抛一点,求此点到圆心之距离X的累积分布函数,并求P(X2r/3)95941)32(1)32()()()()(222rXPrXPrxrxxXPxF设X服从区间(a,b)上的均匀分布,求E(X).•先求密度函数pdf:–先求分布函数cdf:1)(,)(,0)(xFbxabaxxFbxaxFax时,当时,当时,当其他可取任意值,于是处,和在时,当时,或当,0,,1)()(,1)(')(,0)(')(bxaabxpxpbxaxabxFxpbxaxFxpbxax2|211)(2baxabdxabxXEbaba一家麦片生成厂家生产小包装和大包装两种规格的麦片,每袋麦片的重量互相独立,符合如下正态分布。均值(g)方差(g2)小包装3154大包装95025离散程度哪个大?950531521)两种包装各随机选一包,求大包装比小包装3倍少的概率P(e3s)2)随机地选一大包装和三个小包装,求大包装比3包小包装总和轻的概率P(es1+s2+s3)N(315,4)N(950,25)E-3S服从什么分布呢?E(E-3S)=E(E)-3E(S)=950-3×315=5Var(E-3S)=Var(E)+9Var(S)=25+9×4=61∴E-3S~N(5,61)P(e-3s0)≈0.261E-(S1+S2+S3)服从什么分布呢?E(E-(S1+S2+S3))=E(E)-3E(S)=950-3×315=5Var(E-(S1+S2+S3))=Var(E)+3Var(S)=25+3×4=37∴E-(S1+S2+S3)~N(5,37)P(e-s1-s2-s30)≈0.206和差还是正态分布一个个案----日产与美产的SONY彩电20世纪70年代后期,有人发现日产与美产的SONY彩电在美国市场受欢迎的程度不同,按说两地工厂按统一设计方案同一生产线生产同一牌号的电视机不应受到消费者的不同待遇,于是,就此展开了调查,其报告刊登在日本1979年4月17日的《朝日新闻》上。调查发现,日产SONY电视机彩色浓度的分布曲线是一条以彩色浓度目标值m为中心的正态分布曲线;而美产SONY电视机彩色浓度的分布曲线是一条在区间[m-5,m+5]上是常数,在此区间外为0的一条均匀分布曲线。看来它们的确像来自两个不同分布的总体,因此在市场上受到了不同的待遇。一个个案----日产与美产的SONY彩电某厂准备实行计件超产奖,为此需要对生产定额做出新规定。根据以往的记录,可知各个工人每月装配的产品数服从正态分布。假定车间希望有10%的工人能拿到超产奖,试问工人每月需完成多少件产品才能获得奖金?解:设X为工人每月装配的产品数,设C是能拿到超产奖的工人完成定额。根据题意,有)3600,4000(N%10)(cXp%10)604000604000(cXp28.1604000c%90)604000604000(cXp40006028.1c4077c能拿到超产奖的工人完成定额4077件。用Excel计算已知累计概率求相对应的x:fx/统计/Norminv计算正态分布的概率:fx/常用函数/NormdistC作业1.一家银行的男员工体重服从miu=71.5kg,sigma=7.3kg的正态分布。该银行准备购买新电梯,一种规格的电梯的最大载重量为444kg。问6个男员工进入电梯,他们总重超出额定载重量的概率是多少?如果要求同时进入电梯的男员工总重不超过额定载重量的概率至少为99.9%,那么应建议最大的乘坐人数为多少?作业2.抛掷骰子10次为一组,共试验12组,计算每组骰子点数的平均值,验证样本均值近似服从正态分布。请说明一个均值为μ,标准差为σ的正态分布的图像为什么是一条通过点(μ,0.5)而斜率为1/σ的直线,并据此估计该正态分布的参数μ,σ2.