数据模型与决策-21(概率分布)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据、模型与决策丁邦俊13818068959dingbangjunmba@163.com第二讲离散概率分布离散概率基础概率第一定律:任何事件的概率都是0和1之间的数.例将一枚均匀的硬币抛出,观察是正面向上还是反面向上,由完备性和对称性,这两个结果出现的可能性相等,即P(出现正面)=0.5;P(出现反面)=0.5概率:是指不确定的结果出现的可能性。例从一副扑克牌(通常去掉大小猴)中任取一张,取到的是A,这种可能性就是概率。概率第二定律:如果事件A和事件B是互斥的,那么P(A或B)=P(A)+P(B)举例:从一副扑克牌中随机抽取一张,记A=“方快10”,B=“K”,那么,事件A和事件B是互斥的,于是P(A或B)=P(A)+P(B)=1/52+4/52=5/52离散概率基础离散概率基础概率第三定律:符号A|B表示事件B发生的情况下出现了事件A,则P(A|B)例:从一副扑克牌中随机抽取一张,记A=“该牌是任何花色K”,B=“该牌是花牌(J、Q、K)”则P(A|B)=P(A∩B)/P(B)=离散概率基础中国学生(C)外国学生(I)合计男生(M)251540女生(W)451560合计7030100例一个班级学生情况统计如下,求P(C|M)解:P(C|M)=离散概率基础中国学生(C)外国学生(I)合计男生(M)0.250.150.4女生(W)0.450.150.6合计0.700.301这个班学生的概率分布为另解:P(C|M)=离散概率基础同理,可求P(M|C)=25/70第三定律也可以写成:或:这就是概率的乘法公式。公式中的符号“∩”也可省去。离散概率基础概率第四定律:如果A、B是相互独立的事件P(A|B)=P(A)举例:从一副扑克牌中随机抽取一张,记A=“该牌是一张5”,B=“该牌是梅花”“AB”=“该牌是梅花5”所以,P(A)=P(A|B)则P(A)=4/52=1/13P(A|B)=P(A和B)/P(B)=离散概率基础第四定律也可以写成:或:即:独立的两个事件乘积的概率等于概率的乘积。这也叫概率的乘法公式。如何计算决策树中的概率CarolineJanse是一家消费品公司市场销售经理,她正在考虑是否生产一种无泡沫的新型自动洗碗清洁剂。为了使得该问题简化,我们假设市场要么是疲软的,要么是坚挺的。如果市场是坚挺的,那么公司将赢利1800万美元,如果市场是疲软的,那么公司将亏损800万美元,根据经验和直觉的综合考虑,卡罗林估计市场是坚挺的概率为30%在决定是否生产之前,她可以对无泡沫市场进行一项全国性的调查测试,费用将达到240万美元。这种市场调查测试不可能完全准确预测新产品市场,也就是说,它可能会误导新产品市场。过去的这类调查结果表明:如果市场是疲软的(weakly),那么有10%的可能性测试结果对市场是肯定的(Yes),同样,如果市场是坚挺的(strong),那么有20%的可能性测试结果对市场是否定的(No)。卡罗林可以决定要么不生产无泡沫产品,要么在决定是否生产之前,进行调查测试;要么不进行调查测试,直接进行生产。利用第一讲的方法,我们对Caroline问题构造了如下的决策树:ACG不调查,生产BFDE0.30.71800-800-240-10401560-10401560-240p1=?p2=?p3=?p4=?p5=?p6=?答案p1=0.310p2=0.690p3=0.774p4=0.226p5=0.087p6=0.913解:记S=市场坚挺,W=市场疲软Y=调查结果是肯定的N=调查结果是否定的P(W)=1-P(S)=1-0.3=0.7,由已知:P(S)=0.30,P(Y|W)=0.1,P(N|S)=0.20P(Y和W)=P(Y|W)P(W)=0.1*0.7=0.07,P(Y|S)=1-P(N|S)=1-0.20=0.80,P(N|W)=1-P(Y|W)=1-0.10=0.90.P1=0.31P2=0.69P3=P(S|Y)=P(S∩Q)/P(Y)=0.24/0.31=0.774P4=P(W|Y)=P(W∩Q)/P(Y)=0.07/0.31=0.226P5=P(S|N)=P(S∩N)/P(N)=0.06/0.69=0.087P6=P(W|N)=P(W∩N)/P(N)=0.63/0.69=0.913市场坚挺(S)市场疲软(W)合计市场调查是坚挺的(Y)0.240.070.31市场调查是疲软的(N)0.060.630.69合计0.300.701.00ACG不调查,生产BFDE0.30.7-800972.4-813.8-240972.4135.84-20135.84Caroline的最佳策略是:首先选择市场调查测试;当市场调查测试给出肯定的结果时,她选择生产;当市场调查测试给出否定的结果时,她选择不生产;这一决策的EMV是$135.84。随机变量及其分布斯隆学院的学生暑期工作的收入资料假定被收集到了,去年的情况是这样的(指第一年的MBA学生的收入):总的工资(12周)获得此类工资的学生所占百分比$21,6005%$16,80025%$12,00040%$6,00025%$05%随机变量及其分布上面的表格就是斯隆学院的学生暑期工作的周收入(假设为X)的分布随机变量:一个概率模型中可以用数值表示一个不确定的量。用大写的字母X、Y、W等表示如:X=“斯隆学院的学生暑期工作的周收入”Y=“一个硬币抛2次,出现的正面数”W=“上海市明年7月份的降雨的毫米数”随机变量及其分布随机变量的分布需要指出其取值和相应的概率,通常用表格或函数表示表格法:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05函数法:设Y=“一个硬币抛2次,出现的正面数”,p=抛一次硬币出现正面的概率二项分布每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率p对每次试验结果是相同,进行n次重复试验,出现“成功”的次数的概率分布称为二项分布设X为n次重复试验中事件A出现的次数,X取x的概率为)!(!!),,2,1,0(xnxnxnCnxqpCxXPxnxxn式中:二项分布(Excel)计算二项分布的函数是BINOMDIST(k,n,p,cumulative),它有两种形式例生产过程的质量控制假如一个生产过程的产品为合格品的概率是0.83,为废品的概率是0.17,现在假设生产5个这样的产品,求其中至少有一个是废品的概率。解p=二项分布的应用案例分析:航空公司机票超售问题整概率分布的体指标平均值方差与标准差概率分布的整体指标平均值:也称期望,定义为随机变量的取值与相应的概率相乘,再将所有乘积求和的结果,公式是:例:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05这个数字含义非常清楚,它就是Bill能够获得期望收入期望值与轮盘赌单个数字双拼三拼四拼六拼打1赔35打1赔17打1赔11打1赔8打1赔5369121518212427303336●00258111417202326293235●147101316192225283134●0打1赔2打1赔2打1赔21---18偶数红色白色奇数19---3618个数字打1赔112个数字打1赔2单个数字打1赔35,庄家赢X:庄家赢X-351概率P1/3837/38长期来看,庄家必赢概率分布的整体指标方差:定义为随机变量与其期望偏差的平方的期望公式是:例:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05这个数字特别大,其单位是平方美元,与X的单位不一致,它的算术平方根是3458.60美元,与X的单位一致,人们更喜欢使用,并称它为标准差随机变量的线性函数考虑到Bill参加校园招聘计划有一定的成本(与接收John的机会相比,有时间成本),假如该成本是600美元,那么Bill暑期打工12周的实际收入R1为:R1=X-600如果换成月收入,那么Bill暑期打工每月的实际收入R2为R2=⅓R1=⅓X-200,这是随机变量X的线性函数随机变量的线性函数我们可以求出R2的分布:R12100016200114005600-600Pr0.050.250.400.250.05R17000540038001866-200Pr0.050.250.400.250.05我们也可以求出R1的分布:有了R1的分布,我们自然能够求出R1的期望和标准差,并且可以用下面的简化公式。随机变量的线性函数例R1的期望和标准差分别是:协方差与相关性实例:太阳镜和雨伞的销售量概率pi太阳镜的销售量xi雨伞的销售量yi0.135410.1578100.058100.130130.216420.0529220.13510.114260.152110.054623问题:太阳镜和雨伞的销售量之间有关系吗?协方差与相关性X与Y的相关性定义为其中分子COV(X,Y)叫做X与Y的协方差,定义为例太阳镜的销售量与雨伞的销售量的相关性为:联合概率分布与独立性两个事件A与B的独立性是指P(AB)=P(A)P(B)考虑随机变量(X,Y)的概率,记(X,Y)的取值为(xi,yi),相应的概率为pi,将它们列出一个表,就是(X,Y)的联合分布例记X=“抛一枚均匀硬币出现的正面数”Y=“抛一枚均匀硬币出现的正面数减去反面数”则X可能的取值是0、1;Y的可能取值是-1,1联合概率分布与独立性X与Y的联合分布为:XY-11010.500.50合计合计0.50.510.50.5联合概率分布与独立性两个变量相互独立,当且仅当对所有x、y都是成立的。例(1)上面抛硬币的例子中,X与Y独立。(2)太阳镜的销售量与雨伞的销售量不独立。您能验证一下吗?提示:(1)需要写出四个式子验证。(2)只要找到一个式子不成立即可。P(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1不相关就是指没有任何关系,比如两个股票,一个涨跌不影响另一个涨跌。两个随机变量的和在投资市场里,通常要考虑资产组合配置,这就涉及到随机变量和的概念,最简单的情况是两个随机变量之和假设X、Y是两个随机变量,Z=aX+bY,其中a、b是已知常数,那么从该表达式可以看出:(1)若COV(X,Y)0,则Var(aX+bY)a2Var(X)+b2Var(Y)(2)若COV(X,Y)0,则Var(aX+bY)a2Var(X)+b2Var(Y)由此可见,选择负相关的两个资产组合投资,可以降低风险。见P91案例两个随机变量的和例假设AB两个资产的投资收益率分别为8%和15%,方差分别是100元和400元,且它们的协方差为-150,现在将1万元投资AB两个资产,求最佳分配比例。解设投资资产A、B的比例分别为x、1-x,则资产组合的方差为由此可见,当x=68.75%时组合风险达到最小,此时总收益是68.75%*10000*8%+31.25%*10000*15%=1018.75即平均收益率是10.1875%由资产组合确定最佳投资比例010020030040050000.511.50.6875股票价格的离散程度反映了投资的风险投资者当然关心股票的价格,但他更关心的是一段时间内价格的涨涨跌跌变化的情况,也就是股票价格的离散程度。有的时候股票涨了,而过了不长的时间它又跌了。这种股票的风险就大。离散程度反映了股票价格的不确定性,反映了投资者的风险。投资的风险可以用方差(标准差)来度量。资产组合收益的平均大小假设这个资产组合只有两个股票。由“和的期望等于期望的和”可以知道,资产组合(只有两个股票)收益的期望=“第1个股票收益的期望”+“第2个股票收益的期望”。资产组合收益的风险假设这个资产组合只有两个股票。研究这个资产组合的方差‘离不开探讨这两个股票之间有什么样的相关

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功