随机变量及其分布§2.1随机变量一、概念对于随机试验:E甲,乙两人同时向某目标射击一次中靶情况,,BABAABBA,E:},,,{ABBABABAS,X表示射击中靶的次数,对应的取值为;0,1,2。定义:随机变量是定义在样本空间S={ω}上的一个单值实函数,记作X=X(ω),简记为X。二、分类1、离散型随机变量2、非离散型随机变量§2.2离散型随机变量一离散型随机变量的分布设离散型随机变量可能取的值为:,,,21xx取这些值的概率为P(X=xi)=pi,i=1,2,...(2.1)称(2.1)式为离散型随机变量X的分布律。(2.1)式也可以用表格的形式表示如下:X1x2x…ix…P1p2p…ip…上述表格称为离散型随机变量X的分布列,分布列也可以表示成下列矩阵的形式:iipppxxx2121离散型随机变量的分布律,分布列(以及下一节介绍的分布函数)统称为离散型随机变量的概率分布,简称为离散型随机变量的分布。根据概率的性质,可知离散型随机变量的分布律具有下列性质(1)pi0,i=1,2,...(2)1iip常见的几种分布1、单点分布例:若随机变量X只取一个常数值C,即P(X=C)=1,则称X服从单点分布。(也叫退化分布。)2、0-1分布例:若随机变量X只能取两个数值0或1,其分布为X01Pqp0p1,q=1-p,或记为P(kX)=pkq1-k,k=0,1则称X服从参数为p的两点分布或参数为p的0-1分布。3、几何分布例:一射手每次打靶射击一发子弹,打中的概率为p(0p1),不中的概率为q=1-p.今向靶作独立重复射击,直到中靶为止,则消耗的子弹数X是一个离散型随机变量,其分布为X123…k…Ppqpq2p…qk-1p…或记为P(kX)=pqk1,k=1,2,...则称X服从参数为p的几何分布。4、超几何分布例:设一批同类型的产品共有N件,其中次品有M件。今从中任取n(假定nN-M)件,则这n件中所含的次品数X是一个离散型随机变量,其分布为nNmnMNmMCCCmXP)(,m=0,1…,k,k=min(M,n)则称X服从超几何分布。(二)二项分布在n重伯努利试验中,事件A发生的次数X是一个离散型随机变量,其分布为P(X=k)=knkknqpC,k=0,1,2,,n,称X服从参数为n,p的二项分布。记为),(~pnBX。例2:P39.例3:P40.在电脑上,应用相应的数学或统计分析软件,这些概率是很容易计算出来的,所以,还有必要用逼近的方法吗?泊松分布1.定义若离散型随机变量X的分布为ekkXPk!)(,k=0,1,2,其中常数0,则称X服从参数为的泊松分布,记为)(~X。2.泊松Poisson定理P41,设有一列二项分布Xn~B(npn,),n=1,2,...,如果nnnplim,为与n无关的正常数,则对任意固定的非负整数k,均有ekppCkXPkknnknknnnn!)1(limlim证略。例5:P43.例6:P44,自学。§2.3随机变量的分布函数一、概念定义2.1设X是一随机变量(不论是离散型还是非离散型),对任意的实数x,令)()(xXPxF(2.11)则称F(x)为X的分布函数。例1:(书上例2.8)设X服从参数为p的(0-1)分布,即:kqpkXPk1)(,k=0,1,其中0p1,q=1-p.求X的分布函数F(x).例:设R.V.X的分布函数为31318.0114.010)(xxxxxF求X的概率分布。二、性质性质1若x1x2,则F(x1)F(x2).即F(x)是x的单调不减函数。性质2对任意的实数x,均有0F(x)1(2.15)且0)(limxFx(2.16)1)(limxFx(2.17)性质3对任意的实数x0,有)()(0lim0xFxFxx(2.18)即F(x)在x轴上处处右连续。证明见P-44.性质4若F(x)在X=x0处连续,则P(X=x0)=0性质5P(aXb)=F(b)-F(a)例:设R.V.X的分布为0,00,)(3xxeAxFx确定A,且求P(-1x2)§2.4连续型随机变量一、定义2.2设随机变量X的分布函数为F(x),如果存在一个非负可积函数f(x),使对任意的实数x,均有F(x)=xdttf)((2.20)则称X是连续型随机变量,称f(x)是X的概率密度或密度函数,简称密度。二、图形例如:正态分布密度函数222)(21)(xexf图形:datanormal;doi=-3to3by0.01;z0=exp(-i**2/2)/sqrt(2*(3.1415926));output;end;run;procgplotdata=normal;plotz0*i=1;symbol1v=nonei=joinr=1c=black;run;分布函数dtexFtx222)(21)(图形:datanormal;dox=-3to5by0.01;y=PROBNORM(x);output;end;run;procgplotdata=normal;ploty*x=1;symbol1v=nonei=joinr=1c=black;run;三、性质性质1f(x)0(2.21)性质21)()(Fdxxf(2.22)性质3P(aXb)=F(b)-F(a)=badxxf)((2.23)性质4在f(x)的连续点x处,有)(xf=)(xF(2.24)性质5在f(x)的连续点x处,当x0,且很小时,有P(xX)=x+xxxxxxfdttf)()(几点说明:1.由5可以看出f(x)值的大(小)反映R.V.X在x邻域概率的大(小)。2.连续型随机变量X取任一点x0的概率为零。即:P(X=x0)=0。3.连续型随机变量X的密度函数为f(x),则它取值于区间(a,b)、(a,b]、[a,b)、[a,b]上的概率都相等,即)()()()(bXaPbXaPbxaPbXaPabdxxfaFbF)()()(同理,adxxfaFaXPaXPaXP)(1)(1)(1)()(。4.连续型R.V.X的F(x)是连续函数。但f(x)不一定是连续的。例1:(P51)设计R.V.X具有概率密度0,00,3)(xxxKexf确定常数K,并求P{X0.1}指数分布:0,00,/1)(xxxexf例:(第一版)设R.V.0013110)(~xAexxxfXx(1)确定常数A;(2)写出X的分布函数F(x);(3)P21X。例:(第一版)已知随机变量0,210,21)(~xeBxeAxFXxx(1)确定A和B;(2)求)(xf;(3)求)21(XP二、均匀分布例:设R.V.其它,0,)(~bxakxfX,称X在[a,b]上服从均匀分布。(1)确定k。(2)求P(X+s)(a+sb)。(3)写出X的分布函数F(x)。定义:若随机变量X的概率密度为其他01)(bxaabxf则称X在[ba,]上服从均匀分布,记为X~U[a,b]*,相应的分布函数为xbbxaabaxaxxF10)(一般地,设D是轴上一些不相交的区间之和,若X的概率密度为DxDDxf01)(的长度则称X在D上服从均匀分布。如果],[~baUX,则对于满足bdca的任意的dc,,有dxabdXcPdc1)(=)(1cdab(2.32)三、指数分布若随机变量X的概率密度为000)(xxexfx(2.33)其中常数0,则称X服从参数为的指数分布,相应的分布函数为0001)(xxexFx(2.34)例:(第一版书上例2.12)经过长期的观测,对某些电子元件的寿命可作如下假定:在已使用了th的条件下,在以后的th内损坏的概率为)(0tt,其中是不依赖于t的常数;电子元件寿命为零的概率是零,求电子元件在内损坏的概率。略四、正态分布1、定义:若随机变量X的概率密度为222)(21)(xexf,x(2.35)其中,都为常数且0,则称X服从参数为,的正态分布,记为),(~2NX,有时也简称X为正态随机变量。X的分布函数为dtexFtx222)(21)((2.36)2、验证dtetxdxeFtx22)(2222121)(令12212122dtet3、作出)(xf的图形010)(21)('222)(3xexxf,得驻点x,0201)(21)(''222)(223xexxf得0x,03limx0)(xf作图SAS程序:datanormal;doi=-3to3by0.01;z0=exp(-i**2/2)/sqrt(2*(3.1415926));output;end;run;procgplotdata=normal;plotz0*i=1;symbol1v=nonei=joinr=1c=black;run;注意:一定要和由正态随机数区别开来。如下面产生的是正态随机数。datanormal;retain_seed_0;do_i_=1to1000;z=0+1*rannor(_seed_);output;end;drop_seed_;run;procgplotdata=normal;plotz*_i_=1;symbol1v=nonei=joinr=1c=black;run;4、性质:(1)f(x)的图形是关于直线x=对称的曲线(2)21)(f为最大值,当x远离时,f(x)0(3)当固定而变化时对图形的影响,小)(xf大,分布曲线在x形成陡峭的高峰。大)(xf小,分布曲线在x变成缓峰。=2,=0.5,1,2datanormal;doi=-2to6by0.01;z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926)));z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926)));output;end;procgplotdata=normal;plotz0*i=1z1*i=1z2*i=1/overlay;symbol1v=nonei=joinr=1c=black;run;=2,=0.5,1,2,5,10图形:datanormal;doi=-5to9by0.01;z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926)));z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926)));z3=exp(-(i-2)**2/(2*25))/(5*sqrt(2*(3.1415926)));z4=exp(-(i-2)**2/(2*100))/(10*sqrt(2*(3.1415926)));output;end;run;procgplotdata=normal;plotz0*i=1z1*i=1z2*i=1z3*i=1z4*i=1/overlay;symbol1v=nonei=joinr=1c=black;run;(4)当固定而当变化时对图形的影响是分布曲