概率与统计复习随机变量离散型随机变量12,,,ixxxξx1x2…xi…Pp1p2…pi…称为随机变量ξ的概率分布,简称ξ的分布列。(1,2,)ixi()iiPxpξ取每一个值的概率则表设离散型随机变量ξ可能取的值为离散型随机变量的分布列(1)0,123ipi,,,123(2)1ppp离散型随机变量的分布列具有下述两个性质一般地,若离散型随机变量ξ的概率分布为……pn……p3p2p1p……xn……x3x2x1ξ称Eξ=x1p1+x2p2+…+xnpn+…为ξ的数学期望或平均数、均值,数学期望又简称为期望。5离散型随机变量的期望它体现了离散型随机变量取值的平均水平。()EabaEb若离散型随机变量ξ的概率分布为ξx1x2…xi…Pp1p2…pi…2221122()()()iiDxEpxEpxEp叫做随机变量ξ的均方差,简称方差D标准差离散型随机变量的方差随机变量的方差与标准差都反映了随机变量取值的稳定与波动,和期望的相对集中与分散的程度。2()DEED(aξ+b)=a2·Dξ一组数据的方差(x1–x)2+(x2–x)2+…+(xn–x)2nS2=在一组数:x1,x2,…xn中,各数据的平均数为则这组数据的方差为121()nxxxxn()(1)kknknPkCppξ01…k…nP……00(1)nnCpp111(1)nnCpp(1)kknknCpp0(1)nnnCpp~(,)Bnp我们称这样的随机变量ξ服从二项分布,记作在一次试验中某事件发生的概率是p,在n次独立重复试验中,试验中该事件发生的次数为ξ二项分布于是得到随机变量ξ的概率分布如下:0,1,2,,n,(1)EnpDnpp几何分布于是得到随机变量ξ的概率分布如下:1()(1)kPkpp在独立重复试验中,某事件第一次发生时所作的试验次数ξ1,2,3.ξ123…k…Pp(1-p)p(1-p)2p…(1-p)k-1p…称ξ服从几何分布,并记1(,)(1)kgkppp211,pEDpp统计复习统计学的基本思想:用样本去估计总体设一个总体含有有限个个体,并记其个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样抽样方法:简单随机抽样如果用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的概率都等于n/N简单随机抽样体现了抽样的公平性简单随机抽样的方法:抽签法1)编号:先将总体中的所有个体编号2)作标签:并把号码写在形状、大小相同的号签上;3)然后将这些号签放在同一个箱子里,进行均匀搅拌。4)抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。简单随机抽样的方法:用随机数表法进行抽取第一步,编号第二步,确定起始位置和读数方向第三步,读数,抽取的样本号码构成样本系统抽样当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤①采用随机的方式将总体中的个体编号②为将整个的编号分段(即分成几个部分),要确定分段的间隔k,当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N‘能被n整除,这时k=N’/n③在第一段用简单随机抽样确定起始的个体编号④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去直到获取整个样本)当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,分层抽样总体分布的估计样本的频率分布估计总体的概率分布离散型总体分布估计连续型总体分布估计0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记为1频率分布条形图1频率/组距25.23525.29525.35525.41525.47525.565频率分布直方图1、计算极差:随机变量最大值与最小值的差2、决定组距与组数(组距=极差/组数)3、决定分点4、列出频率分布表5、画频率分布直方图总体分布的估计的解题步骤22()21(),(,)2xfxex式中的实数、是参数,分别表示总体的平均数与标准差,其分布叫做正态分布,图象被称为正态曲线)0(正态分布),(2N正态分布常记作标准正态分布221(),R2xfxex相应的密度函数表示式是当时正态总体称为标准正态总体,记0,1(0,1)N正态曲线的性质1)xx曲线在轴的上方,与轴不相交4xxx)当时,曲线上升;当时,曲线下降并且当曲线向左、右两边无限延伸时,以轴为渐进线.x2)曲线关于直线对称3)x在时位于最高点22()21(),(,)2xfxex()0fx()()fxfxmax1()()2fxf5)一定时,曲线的形状由确定越大,曲线越“矮胖”,总体分布越分散;越小.曲线越“瘦高”,总体分布越集中在标准正态分布表中相应于的值是指总体取值小于的概率,即0x)(0x0x000()()(0)xPxxx标准正态分布表0000()1()1()1()PxxPxxPxxx0000()()1()(0)xPxxxx00()()1xx00()()1PxxPxx正态总体在任一区间取值概率。一般的正态总体,均可以化为标准正态总体来研究。2,N0,1N.xFx