质量专业理论与实务讲师:张宝山第一章概率统计基础知识(中级)农民歌手—朱之文1.概率基础知识2.随机变量及其分布3.统计基础知识4.参数估计5.假设检验培训主要内容第一节概率基础知识一、事件与概率(一)随机现象随机现象在一定条件下,并不总是出现相同结果的现象。特点——随机现象的结果至少有两个——至于哪一个出现,人们事先并不知道【例1.1-1】以下是随机现象的另外一些例子(1)一天内进入某超市的顾客数;(2)一顾客在超市中购买的商品数;(3)一顾客在超市排队等候付款的时间;(4)一颗麦穗上长着的麦粒数;样本点认识一个随机现象,首要的是能罗列出它的一切可能发生的基本结果。这里的基本结果是今后的抽样单元即样本点。样本空间:记为Ω随机现象可能样本点的全部称为这个随机现象的样本空间。“抛一枚硬币”的样本空间Ω正面,反面}“抛一颗骰子”的样本空间Ω={1,2,3,4,5,6}(二)随机事件事件(随机事件):随机现象的某些样本点组成的集合。用大写英文字母A、B、C……表示。1.随机事件的特征——任一事件A是相应样本空间Ω中的一个子集。——事件A发生当且仅当()A中某一样本点发生。——事件A的表示可用集合,也可用语言,但所用语言要大家明白无误。——任一样本空间Ω有一个最大子集即Ω;它对应的事件称为必然事件,仍用Ω表示。——任一样本空间Ω都有一个最小子集即空集,它对应的事件称为不可能事件,记为Φ【例1.1-2】若产品只区分合格与不合格,并记合格品为“0”,不合格品为“1”。则检查两件产品的样本空间Ω由下列四个样本点组成。其中样本点(0,1)表示第一件产品为合格品,第二件产品为不合格品,其他样本点可类似解释。Ω={(0,0),(0,1),(1,0),(1,1)}2.随机事件的关系——包含:AB或BA在一个随机现象中有两个事件A与B,若事件A中任一个样本点必在B中,则称A被包含在B中,或B包含A。——互不相容在一个随机现象中有两个事件A与B,若事件A与B没有相同的样本点,则称A与B互不相容。可推广到三个或更多个事件间的互不相容——相等:A=B即AB且AB在一个随机现象中有两个事件A与B,若样本A与B含有相同的样本点,则称事件A与B相等。例:A={(x,y):x+y=奇数}B={(x,y):x与y的奇偶性不同}A=B=(1,2),(1,4),(1,6),(2.1),(2,3),(2,5)(3,2),(3,4),(3,6)…则:(三)事件的运算事件运算——对立事件:A→A在一个随机现象中,Ω是样本空间,A为事件,则由在Ω中而不在A中的样本点组成的事件称为A的对立事件,记。A则AA,,——事件A与B的并:AB由事件A与B中所有样本点(相同的只计入一次)组成的新事件。称为A与B的并,发生意味着“事件A与B至少一个发生”BA——事件A与B的交:AB或AB由事件A与B中公共的样本点组成的新事件称为事件A与B的交。发生意味着“事件A与B同时发生”BA事件的并和交可推广到更多个事件上去。——事件A对B的差:A-B由在事件A中而不在B中的样本点组成的新事件,称为A对B的差。(a)A-B(b)A-B()BA事件运算性质:——交换律:,ABBAABBA——结合律:CBACBACBACBA——分配律:CABACBACABACBA——对偶律:BABABABA可用维恩图验证,可推广到三个或三个以上事件的运算。(四)事件的概率概率——事件发生可能性大小的度量在一个随机现象中,用来表示任一随机事件A发生可能性大小的实数称为该事件的概率,记为P(A)。概率是一个介于0和1之间的数,即0≤P(A)≤1;必然事件的概率等于1,即P(Ω)=1;不可能事件的概率等于0,即P(Φ)=0。二、概率的古典定义与统计定义(一)古典定义——所涉及的随机现象只有有限个样本点。如共有n个样本点;——每个样本点出现的可能性是相同的(等可能性);——假如被考察事件A含有K个样本点,则事件A的概率定义为中样本点的总数中含样本点的个数AnK)A(P例1.1-3掷两颗骰子,其样本点可用数对(x,y)表示,其中x与y分别表示第一与第二颗骰子出现的点数。这一随机现象的样本空间为:Ω={(x,y),x,y=1,2…6}它共含36个样本点,并且每个样本点出现的可能性都相同。(1)定义事件A=“点数之和为2”={(1,1)},它只含一个样本点,故P(A)=1/36(2)定义事件B=“点数之和为5”={(1,4),(2,3),(3,2),(4,1)},它含有4个样本点,故P(B)=4/36=1/9(3)定义事件C=“点数之和超过9”={(4,6),(5,5),(6,4),(5,6),(6,5),(6,6)},它含有6个样本点,故P(C)=6/36=1/6。用古典方法获得概率常需要用排列与组合的公式。现概要介绍如下:排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。(1)乘法原理:如果做某件事需经k步才能完成,其中做第一步有种方法,做第二步有种方法做第k步有种方法,那么完成这件事共有种方法。2m1mkm12kmmm(2)加法原理:如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有种完成方法,在第二类方法中又有种方法在第k类方法中又有种完成方法,那么完成这件事共有种方法。1m2mkm12kmmm(1)排列:从n个不同元素中任取个元素排成一列称为一个排列。按乘法原理有(2)重复排列:从n个不同元素中每次取出一个做记录后放回,再取下一个,如此连续取r次所得的排列称为重复排列。按乘法原理,此种重复排列有个。()rrn(1)(1),!rnnPnnnrPnrn(3)组合:从n个不同元素中任取个元素并成一组(不考虑其中的顺序)称为一个组合,此种组合为(1)(1)!!rnnPnnnrrrr()rrn(二)概率的统计定义——与考察事件A有关的随机现象是可以大量重复试验的;——若在n次重复试验中,事件A发生Kn次,则事件A发生的频率为:重复试验数发生次数事件AnK)A(fnn——fn(A)将会随着重复试验次数不断增加而趋于稳定,这个频率的稳定值就是事件A的概率。一般用重复次数n较大时的频率去近似概率。三、概率的性质及其运算法则(一)概率的性质:(可由概率的定义看出)——性质1:对任意事件A,有0≤P(A)≤1;——性质2:)(1)(APAP——性质3:若AB则P(A-B)=P(A)-P(B)——性质4:P(A∪B)=P(A)+P(B)-P(AB)若A与B互不相容P(A∪B)=P(A)+P(B)——性质5:对于多个互不相容事件A1,A2,……,有P(A1∪A2∪A3∪……)=P(A1)+P(A2)+p(A3)+……;【例1.1-7】抛三枚硬币,至少一个正面出现(记为事件)的概率是多少?【例1.1-8】一批产品共100件,其中5件不合格品,现从中随机抽出10件,其中最多有两件不合格的概率是多少?【例1.1-8】某足球队在未来一周中有两场比赛,在第一场比赛中获胜概率为1/2,在第二场比赛中获胜概率为1/3,如果在两场比赛中都获胜的概率是1/6,那么该队在这两场比赛中至少有一场获胜的概率是多少?(二)条件概率与概率的乘法法则条件概率两个事件A与B,在事件B已发生的条件下,事件A再发生的概率称为条件概率,记P(A/B)。计算公式:))B(P()B(P)AB(P)BA(P0性质6:对任意二个事件A与B,有P(AB)=P(AB)P(B)=P(BA)P(A)P(B)0P(A)0(三)独立性和独立事件的概率相互独立:设有两个事件A与B,假如其中一个事件的发生不影响另一个事件的发生与否,则称A事件与B事件相互独立。性质7:假如二个事件A与B相互独立,则A与B同时发生的概率为P(AB)=P(A)P(B)性质8:假如二个事件A与B相互独立,则在事件B发生条件下,事件A的条件概率P(AB)等于事件A的(无条件)概率p(A)∵)()()()()()()(APBPBPAPBPABPBAP事件的相互独立可推广到三个或更多的事件上去。【例1.1-10】设某样本空间含有25个等可能的样本点,又设事件A含有15个样本点,事件B含有7个样本点,交事件AB含有5个样本点。由古典定义可知1575(),(),(),25257()5/255(|)()7/257PAPBPABPABPABPB第二节随机变量及其分布一、随机变量随机变量用来表示随机现象结果的变量称为随机变量。常用大写字母X、Y、Z……表示。随机变量类型——离散随机变量一个随机变量仅取数轴上有限个点或可列个点,则此随机变量为离散(型)随机变量。——连续随机变量如一个随机变量的所有可能取值充满数轴上一个范围(a,b)或整个数轴,则此随机变量为连续(型)随机变量。二、随机变量的分布随机变量的分布随机变量取值的统计规律性。随机变量X的分布内容:——X可能取哪些值或在哪个区间上取值——X取这些值的概率各是多少?或X在任一小区间上取值的概率是多少?(一)离散随机变量的分布离散随机变量的分布可用分布列表示(离散分布)分布列或用数学式表达:P(X=Xi)=pii=1,2……n(p1+…+pn=1)pi也称为分布的概率函数XX1X2……XnPp1p2……pn(二)连续随机变量的分布用概率密度函数表示(简称分布)条件:①p(x)≥0②1)(dxxp概率密度函数p(x)的各种形式——位置不同——散布不同——形状不同其中p(x)在x0点的值p(x)不是概率,是高度。注:纵轴原为“单位长度上的频率”,由频率的稳定性,可用概率代替频率,纵轴就成为“单位长度上的概率”即概率密度的概念,故最后形成的曲线称为概率密度曲线。p(x)x重要结论:1.X在区间(a,b)上取值的概率p(a<X<b)为概率密度曲线以下区间(a,b)上的面积,即P(a<Χ<b)=badxxp)(2.X在一点取值的概率为零,即P(X=a)=0故:P(a<x<b)=P(a≤x≤b)=P(a≤X<b)=P(a<X≤b)三、随机变量分布的均值、方差与标准差均值:用来表示分布的中心位置,用E(X)表示X是离散随机变量X是连续随机变量)(XEiipxdxxxp)(方差:用来表示分布的散布大小,用Var(x)表示)(XVarX是离散随机变量X是连续随机变量iiPxEx2)]([dxxPxEx)()]([2标准差:用σ表示)()(XVarX表示分布散布大小。均值与方差的运算性质——对任意二个随机变量X1和X2,有E(X1+X2)=E(X1)+E(X2)——设X为随机变量,a与b为任意常数,有E(ax+b)=aE(x)+b)()(2XVarabaXVar——设X1与X2相互独立)()()(2121XVarXVarXXVar(和的方差等于方差之和)这个性质可推广到三个或更多个相互独立随机变量场合——方差的这个性质不能推广到标准差场合,对任意两个相互独立的随机变量X1与X2,σ(X1+X2)≠σ(X1)+σ(X2)而应为:)X(Var)X(Var)XX(2121方差具有可加性,标准差不具有可加性。四、常用分布(一)常用的离散分布1.二项分布xnxnx)p(p)xX(P1x=0,1,……,n其中表示从n个不同元素取出x个的组合数。)!xn(!x!nnx记为b(n,p)二项分布均值、方差和标准差——均值E(x)=np——方差:Var(x)=np(1-p)——标准差:)p(np1特别,当n=1的二项分布称为二点分布2.泊松分布:(常用于计点过程)e!x)xX(PXx=0,1,2,……记为P(λ)其中e=2.71828泊松分布均值、方差和标准差——均值:E