第四章随机变量及其分布第一节随机变量及其分布函数一、随机变量用数量来表示试验的基本事件定义1设试验的基本空间为,,如果对试验的每一个基本事件,规定一个实数记作与之对应,这样就得到一个定义在基本空间上的一个单值实函数,称变量为随机变量.E}{E)(X)(XX)(XX随机变量常用字母、、等表示.或用、等表示.XYZ所谓随机变量,不过是随机试验的试验结果和实数之间的一个对应关系.引例1投掷一枚硬币,观察出现正反面的情形。试验有两个可能结果:我们引入一个变量如下:1—出现正面2—出现反面21,0,1)(XX这个变量可以看作是定义在样本空间21,上的函数,称其为随机变量。实际上此变量是依试验结果的不同而随机地取值1或0。引例2掷一枚骰子面上出现的点数。6,5,4,3,2,1这个试验结果本身就是一个数.(与数值有关),)(kXX当时,kkXX,这里是随机变量,我们引入一个变量X它是依试验结果的不同而随机地取值1,2,3,4,5,6。昆虫的产卵数;每天从太原站下火车的人数;类似的例子:七月份太原的最高温度;在奥尼尔的一次罚篮中,可能出现罚中、罚不中这两种情况,这个随机试验的结果不具备数量性质,我们仍可以用数量来表示它。例如:用变量来表示这个随机试验的结果:ξ=0,表示没罚中;ξ=1,表示罚中。而表示随机变量所取的值时,一般采用小写字母x,y,z等.随机变量通常用大写字母X,Y,Z或希腊字母ζ,η等表示例如,从某一学校随机选一学生,测量他的身高.我们可以把可能的身高看作随机变量X,然后我们可以提出关于X的各种问题.如P(X1.7)=?P(X≤1.5)=?P(1.5X1.7)=?2、随机变量的分类通常分为两类:随机变量离散型随机变量连续型随机变量所有取值可以逐个一一列举全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间.这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处,但因其取值方式不同,又有其各自的特点。学习时请注意它们各自的特点和描述方法。随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究。注:1°随机变量是基本事件的函数,具体问题里具体规定.2°对于不同的基本事件,的取值亦要不同.3°每一基本事件都可用随机变量的取值来表示.如,则.4°当时,事件与互不相容.5°表示取小于等于的每一个值所对应的基本事件的和事件)(XXXkkxX)(}{kkxXrkxx}{kxX}{rxX}{xXXx二、随机变量的分布函数定义2设是一个随机变量,对任意实数,令Xx)(},{)(xxXPxF称为随机变量的分布函数.)(xFX),(分布函数是定义在上的函数.具有如下性质:1°≤≤1且,.2°是单调不减函数.3°是右连续的.0)(xF0)(F1)(F)(xF)(xF4°对任意,有ba}.{)()(}{}.{)()(}{).()(}{aXPaFbFbXaPbXPaFbFbXaPaFbFbXaP第二节离散型随机变量及其概率分布定义3设E是一个试验,X为E中的随机变量,如果X只取有限个数值或可数无穷多个数值,则称X为离散型随机变量.一、离散型随机变量及其分布律定义4分布律:P{X=xk}=pk,k=1,2,…,即X1x2xkxP1p2pkp…………例如抛硬币的试验XP1/21/210掷骰子的试验XP1/61/61/61/61/61/6123456分布律的性质:1°≥0,=1,2,…;kpk2°.11kkp例1某人射击命中率为,不断地独立射击目标,直到命中为止,求发射子弹数的分布律(概率分布).pX解可取值为1,2,…,,…,表示事件“前次不中,第次击中”,则.,因此Xk}{kX1kkpqppkXPpkkk11)1(}{)1(pqXkPpqppq2pqk1123…………例2设P1/21/2X10,求为分布函数.X)(xF解1,110,2/10,0)(xxxxF··)(xFx211·。1o例3,1234561/61/61/61/61/61/6XP求分布函数.)(xF解6,165,6/554,6/443,6/332,6/221,6/11,0)(xxxxxxxxF·······yx11o23456。。。。。。对离散型随机变量,.XxxkkpxF)(书中例五:袋中有5个球,分别编号为1,2,……,5,从中同时取出3个球,以X表示取出的球的最小号码,求X的分布律与分布函数。解:由于X表示取出的3个球中的最小号码,因此X的可能值为1,2,3。{X=1}表示3个球中的最小号码为1,则另两个球可在2,3,4,5中产生,取法有种;{X=2}的取法有种;{X=3}的取法有一种。则24C23C53)1(3524CCXP103)2(3523CCXP1011)3(35CXP因此,所求的分布律为X概率1230.60.30.1,1,9.0,6.0,0)(xF332211xxxx二、几种常用的离散型随机变量及其概率分布1.(0-1)分布若随机变量只取0与1两个值,其概率分布为X10,}1{,1}0{ppXPpXP或写成1,0,)1(}{1xppxXPxx则称服从参数为的(0-1)分布或两点分布.Xp分布函数1,110,10,0)(xxpxxF.X01P1-pp2.二项分布如果随机变量的取值为0,1,2,…其分布律为Xn,0,1,2,…,;knkppknkXP)1(}{kn10p.则称服从参数为,的二项分布,证作~(或).XnpX),(pnb),(pnB当=1时,二项分布就是(0-1)分布.在重贝努利概型中,事件发生的次数就服从,.n),1(pBnAX),(pnB)(APp3.泊松分布如果随机变量可能取值为0,1,2,…,,…,并且Xk,0,1,2,…e!}{kkXPkk其中为常数,则称服从参数为的泊松分布,记作~.0XX)(显然,0,1,2,…0e!}{kkXPpkkk.1eee!00kkkkkp泊松定理设为一常数,为任意正整数,,则对于任一固定的非负整数,有0nnnpk!e)1(limkppknkknnknn.证由,有npnknkknkknnknnnnknknnkknnnppkn1111111!1!)1()1()1()(,e!1e1!nkkkk由泊松定理可知,当很大,很小时有近似公式:np)(npknkppkn)1(ekk!即二项分布近似于泊松分布,而泊松分布有表可查.例4一部电话交换台每分钟接到的呼叫次数服从参数为4的泊松分布,求:(1)每分钟恰有6次呼叫的概率;(2)每分钟的呼叫次数大于5的概率.解以表示每分钟呼叫的次数,则.X)4(~X,0,1,2,…4e!4}{kkXPkk(1).1042.0e!64}6{46XP(2)}5{1}5{XPXP)1563.01954.01954.01465.00733.00183.0(1}]5{}1{}0{[1XPXPXP2148.0.例5某人进行射击,每次命中率为0.02,独立射击400次,求至少击中两次的概率解(400,0.02)BX~,,400kkkkXP400)02.01(02.0400}{,2,1,0k8,!8!8npekkekk所求概率为.88e8e1}1{}0{1}2{XPXpXPp997.0Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数例如:1.放射性物质在单位时间内的放射次数;2.在单位容积充分摇匀的水中的细菌数;3.野外单位空间中的某种昆虫数等。变量的取值充满整个数值区间,无法一一列出其每一个可能值。一般将连续型随机变量整理成频数表,对频数作直方图,直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。第三节连续型随机变量及其概率密度一、连续型随机变量的概率密度及其性质图2-1表2-4数据的直方图051015202530352.7~3.1~3.5~3.9~4.3~4.7~5.1~5.5~5.9~6.3血清总胆固醇(mmol/L)人数表2.4150名成年男子血清胆固醇的频数与频率组段划记频数(f)频率(P)%(1)(2)(3)(4)2.7~正-64.003.1~正正T128.003.5~正正正正正2516.673.9~正正正正正T2818.674.3~正正正正正正-3120.674.7~正正正止1912.675.1~正正正1510.005.5~正上85.335.9~6.3正-64.00如果样本量很大,组段很多,矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。大多数情况下,可采用一个函数拟合这一光滑曲线。这种函数称为概率密度函数(probabilitydensityfunction)定义4设随机变量的分布函数为,如果存在一个非负函数,使对于任意实数,有X)(xF)(xfx,xxxfxFd)()(x则称为连续型随机变量,其中称为的概率密度.X)(xfX性质:1°≥0.2°.)(xf1d)(xxf3°连续.4°.5°.)(xF0}{aXP)()(}{}{122121xFxFxXxPxXxP21d)(xxxxf6°.)()(xFxf.0,0,0,e)(3xxkxfx例1设的概率密度为X(1)求;(2)求;(3).k}1.0{XP)(xF解(1)由,有.(2).(3)1d)(xxf3k7408.0d)(}1.0{1.0xxfXP.0,0,0,e1)(3xxxFx·)(xfx3)(xf0·x1)(xF0)(xF例2设连续型随机变量的概率密度为X.,0,20),38()(2其它xxxAxf(1)求,(2)求;(3)分布函数.A}1{XP)(xF解(1)由,而.有.1d)(xxfAxxxAxxf8d)38(d)(20281A(2).85d)38(81d)(}1{2121xxxxxfXP(3)当时,,当≤时,0x0d)()(xxxfxF02x)4(81d)38(81d)()(3202xxxxxxxfxFxx.当≥2时,.所以x1d)(d)()(20xxfxxfxFx.2,120),4(810,0)(32xxxxxxF二、几种常见的连续型随机变量及其概率密度(一)均匀分布若连续型随机变量具有概率密度X,,0,,1)(其它bxaabxf则称在区间上服从均匀分布.其分布函数为X),(ba.,1,,,0)(bxbxaabaxaxxF·x0)(xfab1ab··x0)(xFab·1··对于任意,若,则有),(,21baxx21xxabxxxabxxfxXxPxxxx12212121d1d)(}{.这说明取值落在内任一子区间内的概率,只依赖于子区间的长度,而与子区间位置无关.X),(ba),(21xx12xx例3设连续型随机变量的分布函数