第4章学习目标1.掌握随机试验、事件和概率的概念及性质2.理解随机变量及其分布,计算各种分布的概率3.理解抽样分布与总体分布的关系4.掌握总体均值、总体比例和总体方差的区间估计第一节概率与概率分布概率基础随机变量及其分布随机事件的基本概念•1.随即试验:•在相同条件下,对事物或现象所进行的观察•2.事件:•随机试验的每一个可能结果(任何样本点集合)事件与样本空间1.基本事件–一个不可能再分的随机事件–例如:掷一枚骰子出现的点数2.样本空间–一个试验中所有基本事件的集合,用表示–例如:在掷枚骰子的试验中,{1,2,3,4,5,6}–在投掷硬币的试验中,{正面,反面}事件的关系和运算1.事件的包含2.事件的并或和3.事件的交或积4.互斥事件5.事件的逆6.事件的差事件的关系和运算(事件的性质)•设A、B、C为三个事件,则有1.交换律:A∪B=B∪A2.A∩B=B∩A2.结合律:A∪(B∪C)=(A∪B)∪C•A(BC)=(AB)C3.分配律:A∪(B∩C)=(A∪B)∩(A∪C)•A∩(B∪C)=(A∩B)∪(A∩C)事件的概率1.事件A的概率是对事件A在试验中出现的可能性大小的一种度量2.表示事件A出现可能性大小的数值3.事件A的概率表示为P(A)4.概率的定义有:古典定义、统计定义和主观概率定义事件的概率•例如,投掷一枚硬币,出现正面和反面的频率,•随着投掷次数n的增大,出现正面和反面的频率•稳定在1/2左右试验的次数正面/试验次数1.000.000.250.500.750255075100125概率的古典定义•如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为nmAAP=事件个数样本空间所包含的基本所包含的基本事件个数事件)(概率的古典定义(实例)•【例】某钢铁公司所属三个工厂的职工人数如下表。从•该公司中随机抽取1人,问:•(1)该职工为男性的概率•(2)该职工为炼钢厂职工的概率某钢铁公司所属企业职工人数工厂男职工女职工合计炼钢厂炼铁厂轧钢厂4000320090018001600600620048001500合计8500400012500概率的古典定义(计算结果)•解:(1)用A表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则68.0125008500)(全公司职工总人数全公司男性职工人数AP(2)用B表示“抽中的职工为炼钢厂职工”;B为炼钢厂全体职工的集合;基本空间为全体职工的集合。则384.0125004800)(全公司职工总人数炼钢厂职工人数BP概率的统计定义•在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为pnmAP)(概率的统计定义(实例)•【例】:某工厂为节约用电,规定每天的用电量指标•为1000度。按照上个月的用电记录,30天中有12天的•用电量超过规定指标,若第二个月仍没有具体的节电•措施,试问该厂第一天用电量超过指标的概率。•解:上个月30天的记录可以看作是重复进行了30次•试验,试验A表示用电超过指标出现了12次。根据概•率的统计定义有4.03012)(试验的天数超过用电指标天数AP主观概率定义1.对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定2.概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断3.例如,我认为2001年的中国股市是一个盘整年概率的性质1.非负性–对任意事件A,有0P12.规范性–必然事件的概率为1;不可能事件的概率为0。即P()=1;P()=03.可加性–若A与B互斥,则P(A∪B)=P(A)+P(B)–推广到多个两两互斥事件A1,A2,…,An,有P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)随机变量及其分布一.随机变量的概念二.离散型随机变量的概率分布三.连续型随机变量的概率分布随机变量的概念1.一次试验的结果的数值性描述2.一般用X、Y、Z来表示3.例如:投掷两枚硬币出现正面的数量4.根据取值情况的不同分为离散型随机变量和连续型随机变量离散型随机变量1.随机变量X取有限个值或所有取值都可以逐个列举出来X1,X2,…2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1连续型随机变量1.随机变量X取无限个值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00X100X0离散型随机变量的概率分布离散型随机变量的概率分布1.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X=xix1,x2,…,xnP(X=xi)=pip1,p2,…,pn4.P(X=xi)=pi称为离散型随机变量的概率函数pi0011niip离散型随机变量的概率分布(实例)【例】如规定打靶中域Ⅰ得3分,中域Ⅱ得2分,中域Ⅲ得1分,中域外得0分。今某射手每100次射击,平均有30次中域Ⅰ,55次中域Ⅱ,10次中Ⅲ,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为X=xi0123P(X=xi)pi0.050.100.550.30离散型随机变量的概率分布(0—1分布)1.一个离散型随机变量X只取两个可能的值–例如,男性用1表示,女性用0表示;合格品用1表示,不合格品用0表示2.列出随机变量取这两个值的概率离散型随机变量的概率分布(0—1分布实例)【例】已知一批产品的次品率为p=0.05,合格率为q=1-p=1-0.5=0.95。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为X=xi01P(X=xi)=pi0.050.950.5011xP(x)离散型随机变量的概率分布(均匀分布)1.一个离散型随机变量取各个值的概率相同2.列出随机变量取值及其取值的概率3.例如,投掷一枚骰子,出现的点数及其出现各点的概率离散型随机变量的概率分布(均匀分布实例)【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为X=xi123456P(X=xi)=pi1/61/61/61/61/61/601/6P(x)1x23456离散型随机变量的数学期望1.在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和2.描述离散型随机变量取值的集中程度3.计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()(()(11离散型随机变量的方差1.随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)2.描述离散型随机变量取值的分散程度3.计算公式为122)()()]([)(iiipXExXDXXEXEXD是离散型随机变量,则若离散型随机变量的方差(实例)【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。计算数学期望和方差X=xi123456P(X=xi)=pi1/61/61/61/61/61/6解:数学期望为:5.3616611)(61iiipxXE方差为:9167.261)5.36(61)5.31()()(22612iiipXExXD常见的离散型概率分布超几何分布离散型随机变量的概率分布泊松分布二项分布连续型随机变量的概率分布连续型随机变量的概率分布指数分布连续型随机变量的概率分布正态分布均匀分布其他分布连续型随机变量的概率分布1.连续型随机变量可以取某一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率5.用数学函数的形式和分布函数的形式来描述概率密度函数1.设X为一连续型随机变量,x为任意实数,X的概率密度函数记为f(x),它满足条件1d)()2(0)()1(xxfxf2.f(x)不是概率概率密度函数•密度函数f(x)表示X的所有取值x及其频数f(x)值(值,频数)频数f(x)abx概率密度函数•在平面直角坐标系中画出f(x)的图形,则对于任何实数x1x2,P(x1Xx2)是该曲线下从x1到x2的面积baxxfbXaPd)()(f(x)xab概率是曲线下的面积分布函数1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分布函数定义为)(d)()()(xxttfxXPxF3.根据分布函数,P(aXb)可以写为)()(d)()(aFbFxxfbXaPba分布函数与密度函数的图示1.密度函数曲线下的面积等于12.分布函数是曲线下小于x0的面积f(x)xx0F(x0)连续型随机变量的期望和方差1.连续型随机变量的数学期望为2.方差为xxxfXEd)()(2d)()()(xxfXExXD正态分布正态分布的重要性•1.描述连续型随机变量的最重要的分布•2.可用于近似离散型随机变量的分布–例如:二项分布•3.经典统计推断的基础xf(x)概率密度函数xxfx,e21)(2221•f(x)=随机变量X的频数•2=总体方差•=3.14159;e=2.71828•x=随机变量的取值(-x)•=总体均值正态分布函数的性质1.概率密度函数在x的上方,即f(x)02.正态曲线的最高点在均值,它也是分布的中位数和众数3.正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。决定曲线的高度,决定曲线的平缓程度,即宽度4.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总面积等于16.随机变量的概率由曲线下的面积给出和对正态曲线的影响xf(x)CAB正态分布的概率概率是曲线下的面积!abxf(x)?d)()(baxxfbxaP标准正态分布的重要性1.一般的正态分布取决于均值和标准差2.计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数xxx,e21)(222.标准正态分布的概率密度函数1.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布)1,0(~NXZ3.标准正态分布的分布函数xtxttxxde21d)()(2-2标准正态分布x一般正态分布XZ1Z标准正态分布0标准正态分布表的使用1.将一个一般的转换为标准正态分布2.计算概率时,查标准正态概率分布表3.对于负的x,可由(-x)1x得到4.对于标准正态分布,即X~N(0,1),有–P(aXb)ba–P(|X|a)2a15.对于一般正态分布,即X~N(,),有abbXaP)(标准化的例子P(5X6.2)12.01052.6XZx510一般正态分布6.21Z标准正态分布00.12.0478标准化的例子P(2.9X7.1)5=102.97.1X一般正态分布21.1051.721.1059.2