第7章序贯决策

zhuozhuokj
5 ℃
2018-07-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

一、多阶段决策问题在经济与管理活动中，常常遇到这样一些比较复杂和特殊的问题，对它们的决策过程需要分成几个阶段。每个阶段都需要做出阶段决策，当各个阶段的决策确定后，就形成一个决策序列，这个决策序列也就是整个决策中的一种决策方案。但我们在决策过程中不能只独立的考虑某一阶段的决策目标，而要更加重视这些阶段的前后联系。应注意到前阶段决策影响后阶段的决策目标，而后阶段的决策状态又依赖于前阶段决策结果。各个阶段的决策形成一个完整的决策过程，这样我们应更加注重决策过程的整体效应。在多阶段决策中注意以下特点：第一，多次决策是有前后顺序的，只有前面的决策做出了才能进行下一阶段决策；第二，前一阶段决策的结果直接影响后一阶段决策，后一阶段决策的状态又由前一阶段决策结果决定；第三，要注重考虑决策的整体效果，而不仅是各阶段决策的即时后果。第一节多阶段决策二、多阶段决策方法在多阶段决策中，关键是要正确的划分决策阶段，确定各个阶段的状态变量，寻找各个阶段的联系，再从后到前用逆序归纳法进行决策分析。解决多阶段决策问题的主要方法有决策树法和动态规划法。动态规划法我们已经在运筹学中学习过了，这里主要介绍决策树法。决策树由树根、树叶、节点及树枝组成,每条从树根到树叶的路线都表示一种决策方案。在每个分枝上要表明其本身的意义，还要在状态分枝上表明该状态的发生概率。在每条路线的末端标出用收益表示行动的结果。进行决策分析时，要从树根到树梢以次进行。遇到状态节点，取各行动分枝结果的期望值，遇到行动节点，取各个分枝的结果的最优值，同时截断不是最优的分枝。这种方法也就是逆序归纳法。第一节多阶段决策三、应用实例例7-1某企业考虑是否用100万元引进5条新生产线生产新产品。如果引进这5条新生产线，可以生产高端（1a）、中端（2a）和低端（3a）三种产品。前期的研究表明这三种产品在在投放市场后销售情况可能为畅销（1）、一般（2）和滞销（3）三种情况。其概率收益矩阵如表7-1所示：表7-1收益矩阵（万元）)(P1a2a3a10.5050040020020.3030035020030.20-300-100100第一节多阶段决策为了降低经营风险，企业可以先用30万元引进一条生产线生产少量的产品试销。假设试销结果分为受欢迎（1A）、一般（2A）、不受欢迎（3A）三种，其概率矩阵如表7-2所示：表7-2试销概率矩阵)(P)(1AP)(2AP)(3AP10.500.400.400.2020.300.300.400.3030.200.400.400.20如果此企业不购买这种新的生产线，将这笔资金投资在其他方面照样可以获利100万元。那么该公司应该采取哪种的方案？第一节多阶段决策解：首先我们应该分析这是一个三阶段的决策问题，第一阶段决定是否购买该生产线；第二阶段决定是否先引进一条生产线试销；第三阶段决定各种试销结果下应生产何种产品。然后再采取逆序归纳法，从后到前依次分阶段决策。首先要计算各种试销结果的概率以及一定试销结果下各种市场销售情况的后验概率。4.02.03.03.04.05.0)()()(3111iiiPAPAP0.3754.037.05.04.0)()()()(111111APPAPAP24.037.03.03.0)()()()(122112APPAPAP22.037.04.02.0)()()()(133113APPAPAP第一节多阶段决策同理可得3122)()()(iiiPAPAP0.4050.0)()()()(211221APPAPAP)()()()(222222APPAPAP0.3)()()()(233223APPAPAP0.23133)()()(iiiPAPAP0.23)()()()(311331APPAPAP0.44)()()()(322332APPAPAP0.39)()()()(333333APPAPAP0.17从而得试销后验概率矩阵如表7-3所示：第一节多阶段决策表7-3试销后验概率矩阵A)(AP)(1AP)(2AP)(3AP1A0.370.540.240.222A0.400.500.300.203A0.230.440.390.17画决策树（见图7-1），并将以上各概率值标记在决策树上，然后就进行决策分析第一节多阶段决策计算第三阶段各状态节点的收益期望值：5000.54+3000.24-3000.22=2764000.54+3500.24-1000.22=2782000.54+2000.24+1000.22=1785000.50+3000.30-3000.20=2804000.50+3500.30-1000.20=2852000.50+2000.30+1000.20=1805000.44+3000.39-3000.17=2864000.44+3500.39-1000.17=295.52000.44+2000.39+1000.17=183将这些值填入决策树第三阶段的节点处，对第三阶段做出决策，截取放弃的行动分枝。第一节多阶段决策计算第二阶段各状态节点的收益期望值：试销状态下2780.37+2850.40+295.50.23=284.83不试销状态下5000.5+3000.3-3000.2=2804000.5+3500.3-1000.2=2852000.5+2000.3+1000.2=180将这些值填入决策树第二阶段的节点处，并对第二阶段做出决策，因为284.83-30=254.83285所以将不试销作为第二阶段的决策，并截去试销分枝。最后，因为285-100=185100所以将引进五条新生产线作为第一阶段的决策。那么我们通过这多阶段决策得到最终结论为：引进技术但不试销，生产中端产品。第一节多阶段决策第一节多阶段决策例7-2某企业现有资金100万元要投资到A，B两个项目。项目A的回报率是35%，产量是6万吨/万元。项目B的回报率为20%，产量为8万吨/万元。为了保持投资的稳定性和长期性，企业将制定一个五年计划，假设前一年投入的资金在下一年不得再转投到另一个项目，但前一年的利润可用于再投资。为了使企业在这个五年计划中的总产量达到最大，那么在这五年中企业应该如何进行投资？解：设第i年分配给项目A和B的资金分别为ix和iy(1,2,3,4,5)i。由分析可得只有第一年的投资额来源于本金100万元，其后各年只能用往年的利润来投资。于是我们可得下面的规划问题第一节多阶段决策112233max5(6000080000)4(6000080000)3(6000080000)Zxyxyxy44552(6000080000)(6000080000)xyxy（1）1122113312124412312355123412341000.2()0.2()S.T.()0.20.350()()0.2(),.3500(1,2.350.,3,4,55)3iixyxyxyxyxxyyxyxxxyyyxyxxxxyyyyxyi23456（）（）（）（）（）我们用多阶段决策的逆序归纳法求解。第一节多阶段决策首先，假定前四年的投资已经确定，只考虑第五年的投资。因为第五年的产量为556000080000xy，5x的系数60000小于5y的系数80000，即投资每单位的资金到项目B的产量高于投资到项目A的产量，所以第五年投资的产量组合556000080000xy的最大值将在50x达到（即全部资金全投资到项目B）。、把50x代入到（1）和（6），然后再将（6）代入（1），得第一节多阶段决策112233max5(6000080000)4(6000080000)3(6000080000)Zxyxyxy44123412342(6000080000)80000[()0.2(0.35)]xyxxxxyyyy=1122335(6000080000)4(6000080000)3(6000080000)xyxyxy44123412342120000160000()16000(8)000xyxxxxyyyy1122333280002680(+416000)(336000)(256000)00208000xyxyxy44(176000)148000xy（7）然后，来研究第四年的投资。假定前三年的投资已经确定，只考虑第四年的投资。同样因为4x的系数小于4y的系数，即投资每单位的资金到项目B的产量高于投资到项目A的产量，所以第四年投资的产量组合44(171480600000)xy的最大值将在40x达到（即全部资金全投资到项目B）。第一节多阶段决策把40x代入到（5）和（7），然后再将（5）代入（7），得11223332800026max(+416000)(336000)(2560008000208)000Zxyxyxy123123176000[(0.)0.25()]3xxxyyy1122333896003296(+451200)(371200)(291200)00269600xyxyxy同理可得，第三年也应该全投资到项目B，得1122max(+509440)49152043152(4290440)Zxyxy第二年的投资。因为1x的系数大于1y的系数，即投资每单位的资金到项目B的产量低于投资到项目A的产量，所以第二年应投资到项目A，得1111max(491520+509440)431520(0.350.2)Zxyxy1164255max(+259)5744Zxy（8）第一节多阶段决策第一年的投资。因为1x的系数大于1y的系数，即投资每单位的资金到项目B的产量低于投资到项目A的产量，所以第一年投资的产量组合11+642552595744xy的最大值将在10y达到（即全部资金全投资到项目A）。综合上面的分析，投资组合为：第一年的100万资金应该全部投资到项目A，第二年的利润也投资到项目A，以后各年都投资到项目B。这样我们把1100x代入到（8）式，得max64255200Z（吨）第一节多阶段决策例7-3某企业集团在下属每个子公司中推选100名员工从事新生产线的工作。推选的员工对新生产线的知识需要培训的分为5%，20%，70%三种状态，且这三种状态发生的概率分别为0.2，0.5，0.3。设对员工的培训有两种方案：方案1对推选的员工都培训，每100人的培训费为10万元；方案2为不全培训，而是让员工直接在新生产线的实践中学习，需要培训的员工如直接进入新生产线工作，将会给企业造成损失5000元。此外为了更好的选择培训方案，可从每个分公司推选的员工中随机的抽取一名员工，请专家考核是否合格再决定采取何种培训方案，专家组考核的费用为每位员工5000元，现在此企业集团如何决策。（1）是否需要引入专家考核？（2）在引入专家考核和不引入专家考核的前提下，企业集团应采取何种决策方案？第一节多阶段决策解：这显然是一个两阶段决策问题。设1A，2A分别表示方案1和方案2。1，2，3分别表示需要培训的5%，20%，70%三种状态。对到新生产线实践检验的分公司，X=1和X=0分别表示专家考核认为该员工不需培训和专家考核认为该员工需要培训。计算收益矩阵得表7-4收益矩阵1231A-10-10-102A-2.5-10-35第一节多阶段决策相应的损失矩阵为表7-5损失矩阵1231A7.5002A0025因为31(0)(0)()iiiPXPXP=0.050.3+0.20.5+0.70.2=0.255111(0)()0.050.3(0)0