离散型随机变量及其分布知识点一:离散型随机变量的相关概念;随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母、等表示离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。若是随机变量,ab,其中a、b是常数,则也是随机变量连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量离散型随机变量与连续型随机变量的区别与联系:离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出离散型随机变量的分布列:设离散型随机变量可能取的值为12ixxx、取每一个值1,2,ixi的概率为()iiPxp,则称表1x2x…ix…P1p2p…ip…为随机变量的概率分布,简称的分布列知识点二:离散型随机变量分布列的两个性质;任何随机事件发生的概率都满足:0()1PA,并且不可能事件的概率为0,必然事件的概率为1.由此你可以得出离散型随机变量的分布列都具有下面两个性质:(1)01,2,ipi,;12(2)1PP特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率的和即1()()()kkkPxPxPx知识点二:两点分布:若随机变量X的分布列:则称X的分布列为两点分布列.特别提醒:(1)若随机变量X的分布列为两点分布,则称X服从两点分布,而称P(X=1)为成功率.(2)两点分布又称为0-1分布或伯努利分布(3)两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列来研究.知识点三:超几何分布:一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则X01P1PP(),0,1,,min{,},,,.knkMNMnNCCPXkkmmMnnNMNC其中称超几何分布列.为超几何分布列,知识点四:离散型随机变量的二项分布;在一次随机试验中,某事件可能发生也可能不发生,在n次独立重复试验中这个事件发生的次数是一个随机变量.如果在一次试验中某事件发生的概率是p,那么在n次独立重复试验中这个事件恰好发生k次的概率是knkknnqpCkP)(,(0,1,2,3,k…,pq1)于是得到随机变量的概率分布如下:01…k…nPnnqpC00111nnqpC…knkknqpC…0qpCnnn由于kknknCpq恰好是二项式展开式:001110()nnnkknknnnnnnpqCpqCpqCpqCpq中的各项的值,所以称这样的随机变量服从二项分布,记作(,)Bnp,其中n,p为参数,并记(,,)kknknCpqbknp知识点五:离散型随机变量的几何分布:在独立重复试验中,某事件第一次发生时,所作试验的次数也是一个正整数的离散型随机变量.“k”表示在第k次独立重复试验时事件第一次发生.如果把k次试验时事件A发生记为kA、事件A不发生记为kA,()kpAp,(),(1)kpAqqp,那么112311231()()()()()()()kkkkkPkPAAAAAPAPAPAPAPAqp(0,1,2,k…,pq1)于是得到随机变量的概率分布如下:123…k…Pppq2qp…1kqp…称这样的随机变量服从几何分布,记作1(,),0,1,2,,1.kgkpqpkqp其中知识点六:求离散型随机变量分布列的步骤;(1)要确定随机变量的可能取值有哪些.明确取每个值所表示的意义;(2)分清概率类型,计算取得每一个值时的概率(取球、抽取产品等问题还要注意是放回抽样还是不放回抽样;(3)列表对应,给出分布列,并用分布列的性质验证.X01mPnNnMNMCCC00nNmnMNmMCCC几种常见的分布列的求法:(1)取球、投骰子、抽取产品等问题的概率分布,关键是概率的计算.所用方法主要有划归法、数形结合法、对应法等对于取球、抽取产品等问题,还要注意是放回抽样还是不放回抽样.(2)射击问题:若是一人连续射击,且限制在n次射击中发生k次,则往往与二项分布联系起来;若是首次命中所需射击的次数,则它服从几何分布,若是多人射击问题,一般利用相互独立事件同时发生的概率进行计算.(3)对于有些问题,它的随机变量的选取与所问问题的关系不是很清楚,此时要仔细审题,明确题中的含义,恰当地选取随机变量,构造模型,进行求解.知识点六:期望数学期望:一般地,若离散型随机变量ξ的概率分布为x1x2…xn…Pp1p2…pn…则称E11px22px…nnpx…为的数学期望,简称期望数学期望的意义:数学期望离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平。平均数与均值:一般地,在有限取值离散型随机变量ξ的概率分布中,令1p2p…np,则有1p2p…1nnp,E1(x2x…1)nnx,所以的数学期望又称为平均数、均值。期望的一个性质:若ba,则baEbaE)(知识点七:方差;方差:对于离散型随机变量,如果它所有可能取的值是1x,2x,…,nx,…,且取这些值的概率分别是1p,2p,…,np,…,那么,D=121)(pEx+222)(pEx+…+nnpEx2)(+…称为随机变量的均方差,简称为方差,式中的E是随机变量的期望.标准差:D的算术平方根D叫做随机变量ξ的标准差,记作方差的性质:①DabaD2)(;②22)(EED.方差的意义:(1)随机变量的方差的定义与一组数据的方差的定义式是相同的;(2)随机变量的方差、标准差也是随机变量的特征数,它们都反映了随机变量取值的稳定与波动、集中与离散的程度;(3)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛.二项分布的期望与方差:若,Bnp,则Enp,1Dnpp几何分布的期望和方差:若,gkp1kqp,其中0,1,2k,…,pq1.则1Ep,21pDp.知识点八:正态分布;(1)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.(2)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.(3)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.总体密度曲线b单位O频率/组距a(4)总体分布密度密度曲线函数()yfx的两条基本性质:①()fx≥0(xR);②由曲线()yfx与x轴围成面积为1.(5)解决总体分布估计问题的一般程序如下:①先确定分组的组数(最大数据与最小数据之差除以组距得组数);②分别计算各组的频数及频率(频率总数频数);③画出频率分布直方图,并作出相应的估计.(6)条形图是用其高度表示取各值的频率;直方图是用图形面积的大小表示在各区间内取值的频率;累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样本数据在这两点值之间的频率.(7)正态分布密度函数:简称正态曲线22()2,1(),(,),((0))2xxex函数式中的实数、是参数,,()(),bxaXPaXbxdX随机变量满足:则称的分布为正态分布其中是圆周率;e是自然对数的底;x是随机变量的取值;为正态分布的均值;是正态分布的标准差.正态分布一般记为),(2N。即若2,N,则E,2D(8)正态分布),(2N是由均值和标准差唯一决定的分布通过固定其中一个值,讨论均值与标准差对于正态曲线的影响,它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间,ab内取值的概率等于该区间上总体密度曲线与x轴、直线xa、xb所围成曲边梯形的面积.