考研数学知识点-概率统计Editedby杨凯钧2005年10月1一.随机事件和概率1、概率的定义和性质(1)概率的公理化定义设Ω为样本空间,A为事件,对每一个事件A都有一个实数P(A),若满足下列三个条件:1°0≤P(A)≤1,2°P(Ω)=13°对于两两互不相容的事件1A,2A,…有∑∞=∞==⎟⎟⎠⎞⎜⎜⎝⎛11)(iiiiAPAPΥ常称为可列(完全)可加性。则称P(A)为事件A的概率。(2)古典概型(等可能概型)1°{}nωωωΛ21,=Ω,2°nPPPn1)()()(21===ωωωΛ。设任一事件A,它是由mωωωΛ21,组成的,则有P(A)={})()()(21mωωωΥΛΥΥ=)()()(21mPPPωωω+++Λnm=基本事件总数所包含的基本事件数A=2、五大公式(加法、减法、乘法、全概、贝叶斯)(1)加法公式P(A+B)=P(A)+P(B)-P(AB)当P(AB)=0时,P(A+B)=P(A)+P(B)(2)减法公式P(A-B)=P(A)-P(AB)当B⊂A时,P(A-B)=P(A)-P(B)当A=Ω时,P(B)=1-P(B)(3)条件概率和乘法公式定义设A、B是两个事件,且P(A)0,则称)()(APABP为事件A发生条件下,事件B发生的条件概率,记为=)/(ABP)()(APABP。条件概率是概率的一种,所有概率的性质都适合于条件概率。(4)全概公式设事件nBBB,,,21Λ满足1°nBBB,,,21Λ两两互不相容,),,2,1(0)(niBPiΛ=,2°ΥniiBA1=⊂,则有)|()()|()()|()()(2211nnBAPBPBAPBPBAPBPAP+++=Λ。此公式即为全概率公式。(5)贝叶斯公式设事件1B,2B,…,nB及A满足1°1B,2B,…,nB两两互不相容,)(BiP0,=i1,2,…,n,2°ΥniiBA1=⊂,0)(AP,则∑==njjjiiiBAPBPBAPBPABP1)/()()/()()/(,i=1,2,…n。此公式即为贝叶斯公式。)(iBP,(1=i,2,…,n),通常叫先验概率。)/(ABPi,(1=i,2,…,n),通常称为后验概率。如果我们把A当作观察的“结果”,而1B,2B,…,nB理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。3、事件的独立性和伯努利试验(1)两个事件的独立性设事件A、B满足)()()(BPAPABP=,则称事件A、B是相互独立的(这个性质不是想当然成立的)。若事件A、B相互独立,且0)(AP,则有)()()()()()()|(BPAPBPAPAPABPABP===所以这与我们所理解的独立性是一致的。若事件A、B相互独立,则可得到A与B、A与B、A与B也都相互独立。(证明)由定义,我们可知必然事件Ω和不可能事件Ø与任何事件都相互独立。(证明)同时,Ø与任何事件都互斥。(2)多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,考研数学知识点-概率统计Editedby杨凯钧2005年10月2P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。两两互斥→互相互斥。两两独立→互相独立?(3)伯努利试验定义我们作了n次试验,且满足每次试验只有两种可能结果,A发生或A不发生;n次试验是重复进行的,即A发生的概率每次均一样;每次试验是独立的,即每次试验A发生与否与其他次试验A发生与否是互不影响的。这种试验称为伯努利概型,或称为n重伯努利试验。用p表示每次试验A发生的概率,则A发生的概率为qp=−1,用)(kPn表示n重伯努利试验中A出现)0(nkk≤≤次的概率,二.随机变量及其分布1、随机变量的分布函数(1)离散型随机变量的分布率设离散型随机变量X的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为P(X=xk)=pk,k=1,2,…,则称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式给出:ΛΛΛΛ,,,,,,,,|)(2121kkkpppxxxxXPX=。显然分布律应满足下列条件:(1)0≥kp,Λ,2,1=k,(2)∑∞==11kkp。(2)分布函数对于非离散型随机变量,通常有0)(==xXP,不可能用分布率表达。例如日光灯管的寿命X,0)(0==xXP。所以我们考虑用X落在某个区间],(ba内的概率表示。定义设X为随机变量,x是任意实数,则函数)()(xXPxF≤=称为随机变量X的分布函数。)()()(aFbFbXaP−=≤可以得到X落入区间],(ba的概率。也就是说,分布函数完整地描述了随机变量X随机取值的统计规律性。分布函数)(xF是一个普通的函数,它表示随机变量落入区间(–∞,x]内的概率。)(xF的图形是阶梯图形,Λ,,21xx是第一类间断点,随机变量X在kx处的概率就是)(xF在kx处的跃度。分布函数具有如下性质:1°,1)(0≤≤xF+∞∞−x;2°)(xF是单调不减的函数,即21xx时,有≤)(1xF)(2xF;3°0)(lim)(==−∞−∞→xFFx,1)(lim)(==+∞+∞→xFFx;4°)()0(xFxF=+,即)(xF是右连续的;5°)0()()(−−==xFxFxXP。(3)连续型随机变量的密度函数定义设)(xF是随机变量X的分布函数,若存在非负函数)(xf,对任意实数x,有∫∞−=xdxxfxF)()(,则称X为连续型随机变量。)(xf称为X的概率密度函数或密度函数,简称概率密度。)(xf的图形是一条曲线,称为密度(分布)曲线。由上式可知,连续型随机变量的分布函数)(xF是连续函数。所以,)()()()()()(1221212121xFxFxXxPxXxPxXxPxXxP−==≤=≤=≤≤密度函数具有下面4个性质:1°0)(≥xf。2°∫+∞∞−=1)(dxxf。考研数学知识点-概率统计Editedby杨凯钧2005年10月31)()(==+∞∫+∞∞−dxxfF的几何意义;在横轴上面、密度曲线下面的全部面积等于1。如果一个函数)(xf满足1°、2°,则它一定是某个随机变量的密度函数。3°)(21xXxP≤=)()(12xFxF−=∫21)(xxdxxf。4°若)(xf在x处连续,则有)()(xfxF=′。dxxfdxxXxP)()(≈+≤它在连续型随机变量理论中所起的作用与kkpxXP==)(在离散型随机变量理论中所起的作用相类似。)(),(,独立性古典概型,五大公式,APAE→→Ω→ω)()()()(xXPxFxXX≤=→≤→ωω对于连续型随机变量X,虽然有0)(==xXP,但事件)(xX=并非是不可能事件Ø。∫+=+≤≤=hxxdxxfhxXxPxXP)()()(令0→h,则右端为零,而概率0)(≥=xXP,故得0)(==xXP。不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。2、常见分布①0-1分布P(X=1)=p,P(X=0)=q②二项分布在n重贝努里试验中,设事件A发生的概率为p。事件A发生的次数是随机变量,设为X,则X可能取值为n,,2,1,0Λ。knkknnqpkPkXPC−===)()(,其中nkppq,,2,1,0,10,1Λ=−=,则称随机变量X服从参数为n,p的二项分布。记为),(~pnBX。nknkknnnnnpqpqpnpqqkXPXCC,,,,,,|)(2221ΛΛ−−−=容易验证,满足离散型分布率的条件。当1=n时,kkqpkXP−==1)(,1.0=k,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。③泊松分布设随机变量X的分布律为λλ−==ekkXPk!)(,0λ,Λ2,1,0=k,则称随机变量X服从参数为λ的泊松分布,记为)(~λπX或者P(λ)。泊松分布为二项分布的极限分布(np=λ,n→∞)。④超几何分布),min(,2,1,0,)(nMllkCCCkXPnNknMNkM==•==−−Λ随机变量X服从参数为n,N,M的超几何分布。⑤几何分布Λ,3,2,1,)(1===−kpqkXPk,其中p≥0,q=1-p。随机变量X服从参数为p的几何分布。⑥均匀分布设随机变量X的值只落在[a,b]内,其密度函数)(xf在[a,b]上为常数k,即⎩⎨⎧=,0,)(kxf其他,其中k=ab−1,则称随机变量X在[a,b]上服从均匀分布,记为X~U(a,b)。分布函数为0,xa,,abax−−a≤x≤ba≤x≤b考研数学知识点-概率统计Editedby杨凯钧2005年10月4∫∞−==xdxxfxF)()(当a≤x1x2≤b时,X落在区间(21,xx)内的概率为P(∫∫−==21211)()21xxxxabdxxfxXxabxxdx−−=12。⑦指数分布设随机变量X的密度函数为其中0λ,则称随机变量X服从参数为λ的指数分布。X的分布函数为记住几个积分:,10=∫+∞−dxxex,202=∫+∞−dxexx)!1(01−=∫+∞−−ndxexxn∫+∞−−=Γ01)(dxexxαα,)()1(αααΓ=+Γ⑧正态分布设随机变量X的密度函数为222)(21)(σµσπ−−=xexf,+∞∞−x,其中µ、0σ为常数,则称随机变量X服从参数为µ、σ的正态分布或高斯(Gauss)分布,记为),(~2σµNX。)(xf具有如下性质:1°)(xf的图形是关于µ=x对称的;2°当µ=x时,σπµ21)(=f为昀大值;3°)(xf以ox轴为渐近线。特别当σ固定、改变µ时,)(xf的图形形状不变,只是集体沿ox轴平行移动,所以µ又称为位置参数。当µ固定、改变σ时,)(xf的图形形状要发生变化,随σ变大,)(xf图形的形状变得平坦,所以又称σ为形状参数。若),(~2σµNX,则X的分布函数为dtexFxt∫∞−−−=222)(21)(σµπσ。。参数0=µ、1=σ时的正态分布称为标准正态分布,记为)1,0(~NX,其密度函数记为2221)(xex−=πϕ,+∞∞−x,分布函数为dtexxt∫∞−−Φ2221)(π。)(xΦ是不可求积函数,其函数值,已编制成表可供查用。φ(x)和Φ(x)的性质如下:1°φ(x)是偶函数,φ(x)=φ(-x);2°当x=0时,φ(x)=π21为昀大值;3°Φ(-x)=1-Φ(x)且Φ(0)=21。如果X~),(2σµN,则σµ−X~)1,0(N。所以我们可以通过变换将)(xF的计算转化为)(xΦ的计算,而)(xΦ的值是可以通过查表得到的。⎟⎠⎞⎜⎝⎛−Φ−⎟⎠⎞⎜⎝⎛−Φ=≤σµσµ1221)(xxxXxP。分位数的定义3、随机变量函数的分布随机变量Y是随机变量X的函数)(XgY=,若X的分布函数)(xFX或密度函数)(xfX知道,则如何求出)(XgY=的分布函数)(yFY或密度函数)(yfY。(1)X是离散型随机变量已知X的分布列为ΛΛΛΛ,,,,,,,,)(2121nnipppxxxxXPX=,显然,)(XgY=的取值只可能是ΛΛ),(,),(),(21nxgxgxg,若)(ixg互不相等,则Y的分布列如下:ΛΛΛΛ,,,,),(,),(),()(2121nnipppxgxgxgyYPY=,1,xb。=)(xf,xeλλ−0≥x,0,0x,=)(xF,1xeλ−−0≥x,,0x0。考研数学知识点-概率统计Editedby杨凯钧2005年10月5若有某些)(ixg相等,则应将对应的iP相加作为)(ixg的概率。(2)X是连续型随机变量先利用X的概率密度fX(x)写出Y的分布函数FY(y),再利用变上下限积分的求导公式求出fY(y)。三.二维随机变量及其分布1、二维随机变量的基本概念(1)二维连续型随机向量联合分布密度及边缘分布对于二维随机向量),(YX=ξ,如果存在非负函数),)(,(+∞−∞+∞−∞y