第二节动态规划应用举例本节将通过动态规划的三种应用类型——资源分配问题、复合系统可靠性问题、设备更新问题,进一步介绍动态规划的特点和处理方法。一、资源分配问题1.问题的一般提法设有某种资源,总数量为a,用于生产n种产品;若分配数量xi用于生产第i种产品,其收益为gi(xi)。问应如何分配,可使总收益最大?2.数学规划模型xi种产品的资源数量为设分配给第决策变量:xgMaxz)(目标函数:nixax,,1,0约束条件:模型的特点——变量分离。3.用动态规划方法求解阶段k状态sk决策xk=1,…,n表示把资源分配给第k种产品的过程;表示在给第k种产品分配之前还剩有的资源量;表示分配给第k种产品的资源量;状态转移sk+1=sk-xk;阶段指标vk指标函数vkn;;nkiiikkxgxg)()(,1,0,11nkffvMaxf基本方程12S1=ax1x2g1(x1)g2(x2)nxnsngn(xn)s2s3...例3某公司拟将某种高效设备5台分配给所属甲、乙、丙3厂。各厂获此设备后可产生的效益如下表。问应如何分配,可使所产生的总效益最大?效益厂设备台数甲乙丙000013542710639111141211125131112解:阶段k状态sk决策xk=1,2,3依次表示把设备分配给甲、乙、丙厂的过程;表示在第k阶段初还剩有的可分台数;表示第k阶段分配的设备台数;状态转移sk+1=sk-xk;阶段指标vk指标函数vk3;;阶段分配后产生的效益表示第3k)(xvk,1,0,123kffvMaxf基本方程问题:本问题是属于离散型还是属于连续型?怎样解?——离散型,用表格的方式求解。效益厂设备台数甲乙丙000013542710639111141211125131112kSkxkvkvk+fk+1fkP30123450123450461112120+04+06+011+012+012+0046111212012345kSkxkvkvk+fk+1fkP0123452000+000-0000+4155+051-0000+6155+421010+0102-0000+11155+621010+431111+0142-1000+12155+1121010+631111+441111+0161-32-2000+12155+1221010+1131111+641111+451111+0212-3kSkxkvkvk+fk+1fkP15012345037912130+213+167+149+1012+513+0210-2-32-2-1最优策略:P*13为0-2-3或2-2-1,即分给甲厂0台、分给乙厂2台、分给丙厂3台,或分给甲厂2台、分给乙厂2台、分给丙厂1台。最优值:f1=21。可见,最优解可以是不唯一的,但最优值是唯一的。资源分配问题的应用很广泛,例如:1.某学生正在备考4门功课,还剩7天时间,每门功课至少复习1天。若他已估计出各门功课的复习天数与能提高的分数之间的关系,问他应怎样安排复习时间可使总的分数提高最多?2.背包问题:旅行者携带的背包中能装的物品重量为a,现他要从n种物品中挑选若干数量装入背包,问他应如何挑选可使所带的物品总价值最大?二、复合系统工作可靠性问题1.问题的一般提法设某工作系统由n个部件串接而成,为提高系统的可靠性,在每个部件上装有备用件。已知部件i上装有xi个备用件时,其正常工作的概率为pi(xi);每个部件i的备用件重量为wi,系统要求总重量不超过W。问应如何安排备用件可使系统可靠性最高?串接:122.数学规划模型个备用件个部件安排设给第决策变量:xi)(1iinixpMaxz目标函数:为非负整数约束条件:xWxw1模型的特点——变量分离。3.用动态规划方法求解12S1=Wx1x2p1(x1)p2(x2)nxnsnpn(xn)s2s3...阶段k状态sk决策xk=1,…,n表示安排第k个部件备用件的过程;表示在给第k个部件安排之前还剩有的容许重量;表示第k个部件上安排的备用件数量;状态转移sk+1=sk-wkxk;阶段指标vk指标函数vkn;的可靠性;部件安排备用件后产生表示第)(nxpk,1,,1n1nkffvMaxf1基本方程可靠性问题的应用很广泛,例如:1.某重要的科研攻关项目正在由3个课题组以3种不同的方式进行,各组已估计出失败的概率。为减少失败的概率,选派了2名高级专家去充实科研力量。若可估计出各组增加专家后的失败概率,问应如何分派专家可使总的失败概率最小?2.已知x1+x2+…+xn=c,求z=x1x2…xn的最大值。三、设备更新问题例4某运输公司购进一批卡车投入运营,公司每年初需对卡车作出更新或继续使用的决定。假设第k年中,rk(tk)表示车龄为tk的车使用一年的收入,uk(tk)表示车龄为tk的车使用一年的维修费用,ck(tk)表示车龄为tk的车更新成新车的费用。现公司需制定一个10年计划,以决定如何安排使10年的总收入最大。12S1=?x1x210x10s10v1v2v10s2…问题:状态和决策怎样设置?——决策是更新与否,可用0-1变量表示;状态可设为车龄。阶段k状态sk决策xk=1,…,10表示第k年的决策过程;=tk表示第k年的车龄;年不更新,第年更新第kk01,状态转移tk+1=tk+1(1-xk)阶段指标vk指标函数vkn=rk[tk]-uk[tk]-ck(tk)(1-xk)(1-xk)xk;10v,110,0,111kffvMaxf基本方程四、其他——随机型问题举例例5某瓷厂接受订制一个瓷瓶的任务。瓷瓶用电炉烧制。据技术分析估计,每个瓷瓶出炉后的合格率为0.5,各瓶合格与否相互独立(即一炉如装有n个瓷瓶,那么出炉后都不合的概率为0.5n)。制造一个瓷瓶的原料费为100元,烧一炉的费用为300元。现因厂中条件限制最多只能烧3炉,每炉最多装4个瓷瓶。若3炉的瓷瓶无1个合格,则因不能履行合同而被罚款1600元。试用动态规划方法确定一种生产方案(即每炉该装几个瓷瓶),使总的期望成本为最小。