第一章概率统计基础知识(中级)上海质量教育培训中心2005年第一节概率基础知识一、事件与概率(一)随机现象随机现象在一定条件下,并不总是出现相同结果的现象。特点——随机现象的结果至少有两个——至于哪一个出现,人们事先并不知道样本点认识一个随机现象,首要的是能罗列出它的一切可能发生的基本结果。这里的基本结果是今后的抽样单元即样本点。样本空间:记为Ω随机现象可能样本点的全部称为这个随机现象的样本空间。(二)随机事件事件(随机事件):随机现象的某些样本点组成的集合。用大写英文字母A、B、C……表示。随机事件的特征——任一事件A是相应样本空间Ω中的一个子集。——事件A发生当且仅当()A中某一样本点发生。——事件A的表示可用集合,也可用语言,但所用语言要大家明白无误。——任一样本空间Ω有一个最大子集即Ω;它对应的事件称为必然事件,仍用Ω表示。——任一样本空间Ω都有一个最小子集即空集,它对应的事件称为不可能事件,记为Φ随机事件的关系——包含:AB或BA在一个随机现象中有两个事件A与B,若事件A中任一个样本点必在B中,则称A被包含在B中,或B包含A。——互不相容在一个随机现象中有两个事件A与B,若事件A与B没有相同的样本点,则称A与B互不相容。可推广到三个或更多个事件间的互不相容——相等:A=B即AB且BA在一个随机现象中有两个事件A与B,若样本A与B含有相同的样本点,则称事件A与B相等。例:A={(x,y):x+y=奇数}B={(x,y):x与y的奇偶性不同}A=B=(1,2),(1,4),(1,6),(2.1),(2,3),(2,5)(3,2),(3,4),(3,6)…则:(三)事件的运算事件运算——对立事件:A→A在一个随机现象中,Ω是样本空间,A为事件,则由在Ω中而不在A中的样本点组成的事件称为A的对立事件,记。A则AA,,——事件A与B的并:AB由事件A与B中所有样本点(相同的只计入一次)组成的新事件。称为A与B的并,发生意味着“事件A与B至少一个发生”BA——事件A与B的交:AB或AB由事件A与B中公共的样本点组成的新事件称为事件A与B的交。发生意味着“事件A与B同时发生”BA事件的并和交可推广到更多个事件上去。——事件A对B的差:A-B由在事件A中而不在B中的样本点组成的新事件,称为A对B的差。(a)A-B(b)A-B()BA事件运算性质:——交换律:,ABBAABBA——结合律:CBACBACBACBA——分配律:CABACBACABACBA——对偶律:BABABABA可用维恩图验证,可推广到三个或三个以上事件的运算。(四)事件的概率概率——事件发生可能性大小的度量在一个随机现象中,用来表示任一随机事件A发生可能性大小的实数称为该事件的概率,记为P(A)。概率是一个介于0和1之间的数,即0≤P(A)≤1;必然事件的概率等于1,即P(Ω)=1;不可能事件的概率等于0,即P(Φ)=0。二、概率的古典定义与统计定义(一)古典定义——所涉及的随机现象只有有限个样本点。如共有n个样本点;——每个样本点出现的可能性是相同的(等可能性);——假如被考察事件A含有K个样本点,则事件A的概率定义为中样本点的总数中含样本点的个数AnK)A(P(二)统计定义——与考察事件A有关的随机现象是可以大量重复试验的;——若在n次重复试验中,事件A发生Kn次,则事件A发生的频率为:重复试验数发生次数事件AnK)A(fnn——fn(A)将会随着重复试验次数不断增加而趋于稳定,这个频率的稳定值就是事件A的概率。一般用重复次数n较大时的频率去近似概率。三、概率的性质及其运算法则概率的性质:(可由概率的定义看出)——性质1:对任意事件A,有0≤P(A)≤1;——性质2:)(1)(APAP——性质3:若AB则P(A-B)=P(A)-P(B)——性质4:P(A∪B)=P(A)+P(B)-P(AB)若A与B互不相容P(A∪B)=P(A)+P(B)——性质5:对于多个互不相容事件A1,A2,……,有P(A1∪A2∪A3∪……)=P(A1)+P()+p(A3)+……;四、条件概率与概率的乘法法则(1)条件概率两个事件A与B,在事件B已发生的条件下,事件A再发生的概率称为条件概率,记P(A/B)。计算公式:))B(P()B(P)AB(P)BA(P0性质6:对任意二个事件A与B,有P(AB)=P(AB)P(B)=P(BA)P(A)P(B)0P(A)0(2)独立性和独立事件的概率相互独立:设有两个事件A与B,假如其中一个事件的发生不影响另一个事件的发生与否,则称A事件与B事件相互独立。性质7:假如二个事件A与B相互独立,则A与B同时发生的概率为P(AB)=P(A)P(B)性质8:假如二个事件A与B相互独立,则在事件B发生条件下,事件A的条件概率P(AB)等于事件A的(无条件)概率p(A)∵)()()()()()()(APBPBPAPBPABPBAP事件的相互独立可推广到三个或更多的事件上去。第二节随机变量及其分布一、随机变量随机变量用来表示随机现象结果的变量称为随机变量。常用大写字母X、Y、Z……表示。随机变量类型——离散随机变量一个随机变量仅取数轴上有限个点或可列个点,则此随机变量为离散(型)随机变量。——连续随机变量如一个随机变量的所有可能取值充满数轴上一个范围(a,b)或整个数轴,则此随机变量为连续(型)随机变量。二、随机变量的分布随机变量的分布随机变量取值的统计规律性。随机变量X的分布内容:——X可能取哪些值或在哪个区间上取值——X取这些值的概率各是多少?或X在任一小区间上取值的概率是多少?(一)离散随机变量的分布离散随机变量的分布可用分布列表示(离散分布)分布列或用数学式表达:P(X=Xi)=pii=1,2……n(p1+…+pn=1)pi也称为分布的概率函数XX1X2……XnPp1p2……pn(二)连续随机变量的分布用概率密度函数表示(简称分布)条件:①p(x)≥0②1)(dxxp概率密度函数p(x)的各种形式——位置不同——散布不同——形状不同其中p(x)在x0点的值p(x)不是概率,是高度。注:纵轴原为“单位长度上的频率”,由频率的稳定性,可用概率代替频率,纵轴就成为“单位长度上的概率”即概率密度的概念,故最后形成的曲线称为概率密度曲线。p(x)x重要结论:1.X在区间(a,b)上取值的概率p(a<X<b)为概率密度曲线以下区间(a,b)上的面积,即P(a<Χ<b)=badxxp)(2.X在一点取值的概率为零,即P(X=a)=0故:P(a<x<b)=P(a≤x≤b)=P(a≤X<b)=P(a<X≤b)三、随机变量分布的均值、方差与标准差均值:用来表示分布的中心位置,用E(X)表示X是离散随机变量X是连续随机变量)(XEiipxdxxxp)(方差:用来表示分布的散布大小,用Var(x)表示)(XVarX是离散随机变量X是连续随机变量iiPxEx2)]([dxxPxEx)()]([2标准差:用σ表示)()(XVarX表示分布散布大小。均值与方差的运算性质——对任意二个随机变量X1和X2,有E(X1+X2)=E(X1)+E(X2)——设X为随机变量,a与b为任意常数,有E(ax+b)=aE(x)+b)()(2XVarabaXVar——设X1与X2相互独立)()()(2121XVarXVarXXVar(和的方差等于方差之和)这个性质可推广到三个或更多个相互独立随机变量场合——方差的这个性质不能推广到标准差场合,对任意两个相互独立的随机变量X1与X2,σ(X1+X2)≠σ(X1)+σ(X2)而应为:)X(Var)X(Var)XX(2121方差具有可加性,标准差不具有可加性。四、常用分布(一)常用的离散分布二项分布xnxnx)p(p)xX(P1x=0,1,……,n其中表示从n个不同元素取出x个的组合数。)!xn(!x!nnx记为b(n,p)二项分布均值、方差和标准差——均值E(x)=np——方差:Var(x)=np(1-p)——标准差:)p(np1泊松分布:(常用于计点过程)e!x)xX(PXx=0,1,2,……记为P(λ)其中e=2.71828泊松分布均值、方差和标准差——均值:E(X)=λ——方差:)X(Var——标准差:超几何分布:(不放回抽样)NnMNxnMx)xX(Px=1,2……,r式中r=min(n,M)M为N中所含不合格品数n为样本量记为h(n,N,M)超几何分布均值、方差、标准差——均值:NnM)X(E——方差:MNNMN)nN(n)X(Var11(二)连续型随机变量的分布正态分布:能描述很多质量特性X随机取值的统计规律性。正态分布概率密度函数:(-∞<x<+∞)正态分布含两个参数μ和σ,常记:N(μ,σ2)。其中μ为分布均值(即分布中心);σ2为分布方差;σ﹥0为分布标准差。222)(21)(xexp正态分布概率密度函数图形分析标准正态分布:μ=0且σ=1的正态分布,称为标准正态分布,记N(0,1),其变量记为U,概率密度函数记为(u)2221ue)u(标准正态分布表及其应用——标准正态分布表可用于计算形如“U≤u”随机事件发生的概率。如:查附表得0.93575).().U(P521521——U(p)aU(P)a()a<——U(P)a()a1>——)a()a(1——)a()b()bUa(P——12)a()aU(P)aUa(P)aU(P)()(aa)(1)(aa1)(2a标准正态分布N(0,1)的分位数——分位数(为0~1间实数)指它的左侧面积恰好为,右侧面积恰好为1-,即用概率表达)uU(P当=0.5时,称为中位数,N(0,1)分布中u0.5≡0<0.5时,如=0.25则u0.25=-u0.75——查附表u0.75=0.675,故u0.25=-0.6751u正态分布的计算性质1:设,则),(N~X2),(N~XU10性质2:设,则对任意实数a,b有),(N~X2——b)bX(P——a)aX(P1——ab)bXa(P不合格品率为产品质量特性X超出规范限(TL,TU)的概率——X超出TU(上规范限)的概率记PUpU=P(XTU)——X超出TL(下规范限)的概率记PLpL=P(XTL)——X的不合格品率P=PU+PL正态分布中心计算不合格品率要知道两件事:——质量特性X的分布,在过程受控情况下,常为正态分布N(μ,σ2)——产品规范限,是对产品质量特性所作的要求,这些要求可能是顾客要求;可能是标准;可能是企业规定的技术要求。则:)(1)(UUUTTXPp)()(LLLTTXPp其中可查标准正态分布函数表)(TLTu当正态分布中心μ=规范中心时产品质量特性X超出规范μ±3σ的不合格率2ULTTMpL=P(x﹤μ-3σ)=Ф(-3)=1-Ф(3)=1-0.99865=0.00135=1350PPmpU=P(x﹤μ+3σ)=1-Ф(3)=0.00135=1350PPmp=pL+pU=0.00135+0.00135=0.0027=2700PPm-6σ-5σ-4σ-3σ-2σ-σμσ2σ3σ4σ5σ6σ规范限±1σ±2σ±3σ±4σ±5σ±6σ合格品率(%)68.2795.4599.7399.993799.99994399.9999998不