第三章概率分布第一节随机事件与概率几种重要分布的特点、相互关系为以后统计分析做准备确定性现象/必然现象随机现象随机事件:随机现象至少有两个以上可能出现的结果,通常称每一个可能的结果为随机事件,简称事件。:是随机事件发生可能性大小的客观度量指标,随机事件A的概率记为P(A),0≤P(A)≤1。频率概率:若随机事件A,在n次试验中出现f次,则称为随机事件A在n次试验中出现的频率。:通常称概率P≤0.05随机事件为“小概率事件”,因为“小概率事件”在一次观察或试验中发生的可能性很小,可认为其不发生的。小概率事件随机变量随机变量离散型随机变量:可能的取值为有限个或无限可列个实数。比如:一个家庭的人口数X等连续型随机变量:可能的取值充满一个区间或在整个实数轴,无法一一列举。比如:正常成年人的身高X等:表示随机现象观察结果的变量为随机变量。随机变量的概率分布:即确定随机变量的取值和相应取值的概率。(1)离散型随机变量:通常用概率分布描述其取值和相应取值的概率。(2)连续型随机变量:通常用概率密度函数和概率分布函数描述其在一个区间上取值的概率。表离散型随机变量X的概率分布表X的取值123456Pi1/61/61/61/61/61/6例如记X为抛掷1次均匀的骰子出现的点数,则可将所有可能的结果及其各结果出现的概率列成下表的形式:连续型随机变量的概率密度函数与分布函数:概率密度函数具有下列两个重要的性质:①对于任意实数X,都有;②,即概率密度函数曲线下的面积恒等于1。(a)(b)连续型随机变量的概率密度函数图(a)与概率分布函数图(b)及其联系F(x)F(c)cdxf(x)dcxF(d)-F(c)F(c)第二节正态分布一、正态分布概念和特征正态分布(normaldistribution)也叫高斯分布,是最常见、最重要的一种连续型分布。1.正态分布概念81名健康成年男子血清总胆固醇值的频数分布051015202590~110~130~150~170~190~210~230~250~270~290频数正态分布的引入观测人数增加,分割密度Xf(X)m如果连续型随机变量X在实数范围内取值,且具有如下的概率密度函数称连续型随机变量X服从正态分布,记为X~其中表示X的均数,表示X的方差。1.正态分布概念00.10.20.30.40.5-4-3-2-10123400.10.20.30.40.50.60.70.80.9-6-5-4-3-2-10123456σ=0.5σ=1σ=2⑴曲线呈钟型,以为对称轴左右对称。⑵在处,取最大值,即曲线最高。⑶正态分布有两个参数,即位置参数和形态参数。⑷正态分布的标准化变换2.正态分布特征ueuNuXuu,21)()1,0(~22m),(~2mNX一般正态分布为一个分布族:N(m,2);标准正态分布只有一个N(0,1),这样简化了应用。标准正态分布(standardnormaldistribution)0.00.10.20.30.40.5-4-3-2-101234Xf(X)dueuuu2221)(u-∞α界值:α界值:u小(大)于uα的概率=α(1)服从标准正态分布的随机变量在一区间上曲线下的面积与服从标准正态分布的随机变量在其上取值的概率相等。(2)X轴上与正态曲线下所夹面积恒等于1。(3)如果u,欲求服从标准正态分布的随机变量在区间(-∞,u)(u≤0)上曲线下的面积,可直接查附表2。(4)在区间,正态曲线下面积为68.27%;在区间,正态曲线下面积为95.00%;在区间,正态曲线下面积为99.00%。3.正态曲线下面积的分布规律正态曲线下面积的分布规律——一般正态分布μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%图正态曲线面积分布示意图正态曲线下面积的分布规律——标准正态分布0-11-1.961.96-2.582.5868.27%95.00%99.00%计算正态曲线下面积实例)8.4,6.122(~2NX75.08.46.1221191u例5-13由160名7岁男孩身高测量的数据算得,,已知身高数据服从正态分布。试估计该地当年7岁男孩身高界于119cm到125cm范围所占的比例。6.122X8.4S5.08.46.1221252u近似看作该地当年7岁男孩身高界于119cm到125cm范围所占的比例为46.49%。122.61191250-0.750.5相当于t分布X~N(m,2)~第三节2分布、t分布、F分布•英国统计学家W.S.Gosset(1908)给出了统计量t的分布规律,并称统计量的分布规律为t分布,自由度为v,记为t(v)分布。由于每个自由度v对应一个分布,因此t分布是一簇分布。自由度不同的三条t分布密度曲线v=1v=5v=∞v=1•分布特征:t分布曲线是单峰的,且以t=0左右对称。•t分布是随自由度v而变化的一簇分布。•t分布与正态分布的关系:自由度v较小时,t分布与标准正态分布相差较大,随着自由度v的增大,t分布曲线越来越接近于标准正态分布曲线。•当时,t分布的极限分布就是标准正态分布。•t分布的界值:t分布的图形特征和t界值双侧单侧-t/2,vt/2,vt界值示意图:2分布设为相互独立的服从标准正态总体的随机变量,统计量为一随机变量,且其密度函数为称所服从的分布为自由度为v的分布(Chi-squaredistribution),记作。2分布曲线2()f图5-8不同自由度的分布密度曲线图1.2分布是一种连续型分布,2取值范围为(0,+)。2.2分布的曲线形状依赖于自由度v的大小。当自由度v≤2时,曲线呈L型,随着自由度v的增加,2分布趋向对称。3.当自由度v趋于无穷大时,2分布则趋于正态分布。2分布的特征设随机变量X,Y分别服从分布,即,且X与Y独立,则统计量为一连续型随机变量,其服从的分布称为F分布,记为,它有2个自由度为v1和v2。F分布F分布的曲线形状图5-10不同自由度F分布密度函数曲线图00.511.522.501234v1=2v2=2v1=15v2=10v1=50v2=30v1=100v2=100Ff(F)