4-1统计学STATISTICSJuly31,2010数学定律不能百分之百确切地用在现实生活里;能百分之百确切地用数学定律描述的,就不是现实生活——AlberEinstein统计名言第4章概率分布4.1度量事件发生的可能性3.2随机变量概率分布3.3由正态分布导出的几个重要分布3.4样本统计量的概率分布4-3统计学STATISTICSJuly31,2010学习目标度量事件发生的可能性—概率离散型概率分布二项分布,泊松分布,超几何分布连续型概率分布正态分布由正态分布导出的几个重要分布c2-分布,t-分布,F-分布样本统计量的概率分布4-4统计学STATISTICSJuly31,2010中奖的可能性有多大?很多想在彩票市场上赚大钱,这可以理解,但赢得大奖的人总是少数。山东的一打工者为了碰运气,半个小时花去了1000元钱,买了500张即开型福利彩票,结果也没撞上大奖。有人曾做过统计,最赚钱的彩票,中彩的概率最高是500万分之一,有的达到1000万分之一甚至更低假定每张彩票面值是2元,大奖的奖金额是500万元,中将概率是500万分之一,你花掉1000万元购买500万张彩票,即使中了500万的大奖,你仍然亏损500万。况且,从概率的意义上看,即使你购买500万张彩票,也不能肯定就中大奖法国人就有这样的俗语:“中彩的机会比空难还少。”对于多数人来说,彩票只是一种数字游戏,是社会筹集闲散资金的一种方式,而不是一种投资,更不是赌博。相信有了本章介绍的概率方面的知识,你就不会再跟彩票较劲4.1度量事件发生的可能性概率是什么?怎样获得概率?怎样理解概率?第4章概率分布4-6统计学STATISTICSJuly31,2010什么是概率?(probability)1.概率是对事件发生的可能性大小的度量明天降水的概率是80%。这里的80%就是对降水这一事件发生的可能性大小的一种数值度量你购买一只股票明天上涨的可能性是30%,这也是一个概率2.一个介于0和1之间的一个值3.事件A的概率记为P(A)4-7统计学STATISTICSJuly31,2010怎样获得概率?1.重复试验获得概率当试验的次数很多时,概率P(A)可以由所观察到的事件A发生次数(频数)的比例来逼近在相同条件下,重复进行n次试验,事件A发生了m次,则事件A发生的概率可以写为pnmAAP重复试验次数发生的次数事件)(2.用类似的比例来逼近一家餐馆将生存5年的概率,可以用已经生存了5年的类似餐馆所占的比例作为所求概率一个近似值3.主观概率4.2随机变量的概率分布4.2.1随机变量及其概括性度量4.2.2离散型概率分布4.2.3连续型概率分布第4章概率分布4.2.1随机变量及其概括性度量4.2随机变量的概率分布4-10统计学STATISTICSJuly31,2010什么是随机变量?(randomvariables)1.事先不知道会出现什么结果•投掷两枚硬币出现正面的数量•一座写字楼,每平方米的出租价格•一个消费者对某一特定品牌饮料的偏好2.一般用X,Y,Z来表示3.根据取值情况的不同分为离散型随机变量和连续型随机变量4-11统计学STATISTICSJuly31,2010离散型随机变量(discreterandomvariables)1.随机变量X取有限个值或所有取值都可以逐个列举出来x1,x2,…2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为14-12统计学STATISTICSJuly31,2010连续型随机变量(continuousrandomvariables)1.可以取一个或多个区间中任何值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后完工的百分比测量误差(cm)X00X100X04-13统计学STATISTICSJuly31,2010离散型随机变量的期望值(expectedvalue)1.描述离散型随机变量取值的集中程度2.离散型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和3.记为或E(X),计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()(()(14-14统计学STATISTICSJuly31,2010离散型随机变量的方差(variance)1.随机变量X的每一个取值与期望值的离差平方和的数学期望,记为2或D(X)2.描述离散型随机变量取值的分散程度3.计算公式为4.方差的平方根称为标准差,记为或D(X)iiipxXD22)()(4-15统计学STATISTICSJuly31,2010离散型数学期望和方差(例题分析)【例】一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表。求该供应商次品数的数学期望和标准差次品数X=xi0123概率P(X=xi)pi0.750.120.080.0543.005.0308.0212.0175.00iiipx8397.07051.0)(22iiipx4-16统计学STATISTICSJuly31,2010连续型随机变量的期望和方差1.连续型随机变量的期望值2.方差xxxfXEd)()(2d)()()(xxfXExXD4.2.2离散型概率分布4.2随机变量的概率分布4-18统计学STATISTICSJuly31,2010离散型随机变量的概率分布1.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X=xix1,x2,…,xnP(X=xi)=pip1,p2,…,pn4.P(X=xi)=pi称为离散型随机变量的概率函数pi0;5.常用的有二项分布、泊松分布、超几何分布等11niip4-19统计学STATISTICSJuly31,2010离散型随机变量的概率分布(例题分析)【例】一部电梯在一周内发生故障的次数X及相应的概率如下表故障次数X=xi0123概率P(X=xi)pi0.100.250.35(1)确定的值(2)求正好发生两次故障的概率(3)求故障次数多于一次的概率(4)最多发生一次故障的概率4-20统计学STATISTICSJuly31,2010离散型随机变量的概率分布(例题分析)解:(1)由于0.10+0.25+0.35+=1所以,=0.30(2)P(X=2)=0.35(3)P(X2)=0.10+0.25+0.35=0.70(4)P(X1)=0.35+0.30=0.654-21统计学STATISTICSJuly31,2010二项试验(Bernoulli试验)1.二项分布建立在Bernoulli试验基础上2.贝努里试验满足下列条件一次试验只有两个可能结果,即“成功”和“失败”“成功”是指我们感兴趣的某种特征一次试验“成功”的概率为p,失败的概率为q=1-p,且概率p对每次试验都是相同的试验是相互独立的,并可以重复进行n次在n次试验中,“成功”的次数对应一个离散型随机变量X4-22统计学STATISTICSJuly31,2010二项分布(Binomialdistribution)1.重复进行n次试验,出现“成功”的次数的概率分布称为二项分布,记为X~B(n,p)2.设X为n次重复试验中出现成功的次数,X取x的概率为)!(!!),,2,1,0(xnxnxnCnxqpCxXPxnxxn式中:4-23统计学STATISTICSJuly31,2010二项分布(例题分析)【例】已知一批产品的次品率为4%,从中任意有放回地抽取5个。求5个产品中(1)没有次品的概率是多少?(2)恰好有1个次品的概率是多少?(3)有3个以下次品的概率是多少?80.81537269)04.01()04.0()0(05005CXP20.16986931)04.01()04.0()1(15115CXP0.999397860.0141557720.1698693180.81537269)2()1()0()3(XPXPXPXP4-24统计学STATISTICSJuly31,2010二项分布(用Excel计算概率)第1步:在Excel表格界面,直接点击【fx】(插入函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【BINOMDIST】,然后单击【确定】第3步:在【Number_s】后填入试验成功次数(本例为1)在【Trials】后填入总试验次数(本例为5)在【Probability_s】后填入试验的成功概率(本例为0.04)在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示计算成功次数小于或等于指定数值的累积概率值)用Excel计算二项分布的概率4-25统计学STATISTICSJuly31,2010泊松分布(Poissondistribution)1.1837年法国数学家泊松(D.Poisson,1781—1840)首次提出2.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布3.泊松分布的例子一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一定路段内,路面出现大损坏的次数一定时间段内,放射性物质放射的粒子数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数4-26统计学STATISTICSJuly31,2010泊松分布(概率分布函数)—给定的时间间隔、长度、面积、体积内“成功”的平均数e=2.71828x—给定的时间间隔、长度、面积、体积内“成功”的次数)0,,2,1,0(!exxxXP4-27统计学STATISTICSJuly31,2010泊松分布(例题分析)【例】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?7426010解:设X=10分钟内航空公司预订票处接到的电话次数149.06!e7676XP4-28统计学STATISTICSJuly31,2010泊松分布(用Excel计算概率)第1步:在Excel表格界面,直接点击【fx】(插入函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【POISSON】,然后单击【确定】第3步:在【X】后填入事件出现的次数(本例为6)在【Means】后填入泊松分布的均值(本例为7)在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示计算成功次数小于或等于指定数值的累积概率值)用Excel计算泊松分布的概率4-29统计学STATISTICSJuly31,2010超几何分布(hypergeometricdistribution)1.采用不重复抽样,各次试验并不独立,成功的概率也互不相等2.总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布3.概率分布函数为lxCCCxXPnNxnMNxM,,2,1)(4-30统计学STATISTICSJuly31,2010超几何分布(例题分析)【例】假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求(1)有3支能获利的股票都被你选中的概率有多大?(2)3支可获利的股票中有2支被你选中的概率有多大?解:设N=10,M=3,n=4301210