指数分布3.指数分布用以下指数函数表示的概率密度函数称为指数分布。其中的称为指数分布函数的参数,常记为Exp()。其概率密度函数的图形如图1.2-27所示。事件X在区间(a,b)上取值的概率为图1.2-27上阴影的面积,它的计算公式为:指数分布的参数Exp()的均值、方差与标准差分别为:[例1.2-17]某种热水器首次发生故障的时间T(单位:小时)服从参数=0.002的指数分布,它的概率密度函数与分布函数分别为:则该种热水器在300到500小时内需要维修的概率为:该种热水器首次发生故障的时间的均值与方差分别为:现将上述常用分布总结在表1.2-1常用分布表中心极限定理五、中心极限定理中心极限定理叙述了统计中的一个重要结论:多个相互独立随机变量的平均值(仍然是一个随机变量)服从或近似服从正态分布。为介绍这个定理先要作一项准备。(一)随机变量的独立性两个随机变量X1与X2相互独立是指其中一个的取值不影响另一个的取值,或者说是指两个随机变量独立地取值。比如,抛两颗骰子出现的点数记为X1与X2,则X1与X2是相互独立的随机变量。随机变量的相互独立性可以推广到三个或更多个随机变量上去。以下要用到一个假定:几是n个相互独立且服从相同分布的随机变量。这个假定有两个含义:(1)是n个相互独立的随机变量,如在生产线上随机取n个产品,它们的质量特性用表示,那么可认为是n个相互独立的随机变量。(2)有相同的分布,且分布中所含的参数也都相同,比如,都为正态分布,且都有相同均值和相同方差。又如,若都为指数分布,那么其中的参数也都相同。今后,把n个相互独立且服从相同分布的随机变量的均值称为样本均值,并记为,即:(二)正态样本均值的分布定理1设是n个相互独立同分布的随机变量,假如其共同分布为正态分布,则样本均值仍为正态分布,其均值不变仍为,方差。这个定理表明:在定理1的条件下,正态样本均值服从正态分布。[例1.2-18]设是相互独立同分布的随机变量,共同分布为正态分布N(10,52),则其样本均值:服从。这表明:的均值仍为10,方差为25/9=2.78,的标准差为:非正态样本均值的分布(三)非正态样本均值的分布定理2(中心极限定理)设为n个相互独立同分布的随机变量,其共同分布不为正态或未知,但其均值和方差都存在,则在n相当大时,样本均值近似服从正态分布。这个定理表明:无论共同的分布是什么(离散分布或连续分布,正态分布或非正态分布),只要独立同分布随机变量的个数n相当大时,的分布总近似于正态分布,这一结论是深刻的,也是重要的,这说明平均值运算常可从非正态分布获得正态分布。[例1.2-19}图1.2-28中我们选了三个不同的共同分布:Ⅰ均匀分布(无峰)Ⅱ双单分布Ⅲ指数分布(高度偏斜)假如,n=2,那么在Ⅰ的场合,2个均匀分布的变量之均值的分布呈三角形,在Ⅱ的场合,的分布出现中间高,在Ⅲ的场合的分布的峰开始偏离原点。在n=5时,三种场合都呈现单峰状,并且前两个还有很好的对称性。在n=30时,三种场合下的分布几乎完全相同,只在位置上有些差别,这个差别是由原始共同分布的均值不同而引起的,另外,这时正态分布的峰都很高,那是因为平均后的标准差为:图1.2-28有很强的直观性和说服力,这就是中心极限定理的魅力。在统计中一个统计量的标准差,称为标准误差,或简称为标准误。特别地,样本均值的标准误,无论是正态样本均值或非正态样本均值都有或近似有:它随着n的增加而减少。图1.2-29表明这种关系,注意到在n10时,下降较快,而当n10时,下降渐趋缓慢。[例1.2-20]我们常常对一个零件的质量特性只测一次读数,并用这个读数去估计过程输出的质量特性,一个很容易减少测量系统误差的方法是:对同一个零件的质量特性作两次或更多次重复测量,并用其均值去估计过程输出的质量特性,这就可以减少标准差,从而测量系统的精度就自动增加。当然这不是回避使用更精密量具的理由,而是提高现有量具精度的简易方法,多次测量的平均值要比单次测量值更具有稳定性。