华南农业大学数学建模培训资料随机决策模型简介陈羽决策(Decision)是人们为了达到某一目标而从多个实现目标的可行方案中选出最优方案做出的抉择.决策分析(DecisionAnalysis)是帮助人们进行科学决策的理论和方法.在现代管理中,管理的核心就是决策,正如诺贝尔奖金获得者H.A.Simon说过的“管理就是决策”,决策在管理中起着十分重要的作用.本专题主要介绍随机决策的基本概念和基本方法,重点介绍风险型决策、不确定型决策和效用理论.第一节决策的概念一、实例例1某医院决策者对“CT”室配置“CT”机进行决策.目的是在满足诊断需要的同时取得最好的经济效益.他们设想的可行方案有三个,分别为配置一台、两台和三台.根据资料,预计在今年内需用“CT”诊断的患者人数有三种可能:人多、一般、人少.并且,出现这三种情况的概率分别为0.3、0.5和0.2.又计算得知,当配置一、二、三台“CT”机时,如果病人多,则效益分别为10、22、36(万元);一般时,效益分别为10、20、18(万元);而病人少时,效益分别为10、16、10(万元).问应选择何种方案,才能达到目标要求?建立实际问题的数学模型,是运筹学解决问题的前提,在这里我们先引入决策分析问题的精确数学描述,暂不考虑问题的解法.第二节将对该题给出解法.很显然,本题中有三个方案可供选择,每种方案都有三个可能结果,即存在三个自然状态:病人多、一般、病人少;因为状态是不可控制的,是随机事件,而每个状态发生的概率已经分别给出;不同方案和不同的状态的效益值也不同.为了能够给出问题的数学描述,我们先给出决策问题的一些基本概念.二、决策的基本概念华南农业大学数学建模培训资料1.策略集为实现预期目的而提出的每一个可行方案称为策略,全体策略构成的集合,称为策略集(StrategiesSet),也称方案集,记作}{iaA=,)3,2,1(niai=表示每一个方案.2.状态集系统处于不同的状况称为状态,它是由人们不可控制的自然因素所引起的结果,故称为自然状态.全体状态构成的集合称为状态集(StatesSet),记作}{jsS=,)3,2,1(mjsj=表示每一状态.3.状态概率状态js的概率称状态概率(StateProbability),记为)(jsp.4.益损函数益损函数(OpportunityLossFunction)是指对应于选取方案和可能出现的状态,所得到的收益值或损失值,记为R.显然,R是A与S的函数,益损函数值可正可负也可为零,如果认定正值表示收益,那么负值就表示损失,益损函数的取值就称为益损值.策略集,状态集,益损函数是构成一个决策问题的三项最基本要素.5.决策准则和最优值决策者为了寻找最佳方案而采取的准则称为决策准则(DecisionCriterion),记为Φ.最优值(OptimalNumber)是最优方案对应的益损值,记为*R.一般选取的决策准则往往是保证收益尽可能大而损失尽可能小,由于决策者对收益、损失价值的偏好程度不同,对同一决策问题,不同的决策者会有不同的决策准则.三、决策的数学模型一个决策问题的数学模型是由策略集A、状态集S、益损函数R和决策准则Φ构成的.因此我们可以用解析法写出上述集合、函数、准则来表示一个决策问题的数学模型.即ijrSARR==),(,其中,}{iaA=ni...2,1=,}{jsS=mj...2,1=,ijr是方案ia在状态js情况下的益损值.例2给出例9-1问题的数学模型.解数学模型为:策略集}{}{机台配制CTiaAi==321,,=i状态集}{}{}{321病人多,一般,病人少,,===ssssSj华南农业大学数学建模培训资料状态概率3.0)(1=sp5.0)(2=sp2.0)(3=sp益损值}{ijrR=3,2,1=i3,2,1=j1110r=1012=r1013=r2221=r2022=r1623=r3631=r1832=r1033=r另外,决策的数学模型也可用表格法表示,风险型决策也常用决策树方法表示.例1可由表1表示,决策树将于第二节详细介绍.表1不同方案在不同状态下的益损值(万元)自然状态方案1s(病人多)2s(一般)3s(病人少)3.0)(1=sp5.0)(2=sp2.0)(3=sp1a(配置一台)1010102a(配置两台)2220163a(配置三台)361810四、决策的步骤与分类一个完整的决策过程通常包括以下几个步骤:确定目标、拟定方案、评价方案、选择方案、实施决策并利用反馈信息进行控制.决策按问题所处的条件和环境可分为确定型决策、风险型决策和不确定型决策.确定型决策(CertainDecision)是在决策环境完全确定的情况下作出决策.即每种方案都是在事先已经确定的状态下展开,而且每个方案只有一个结果,这时只要把各种方案及预期收益列出来,根据目标要求进行选择即可.尽管如此,当决策可行方案很多时,确定型决策也非常复杂,有时可借助线性规划的方法,去找出最佳方案.风险型决策(VentureDecision)是在决策环境不完全确定的情况下做出的决策.即每种方案都有几个可能的结果,而且对每个结果发生的概率可以计算或估计,用概率分布来描述.正因为各结果的发生或不发生具有某种概率,所以这种决策带有一定的风险.不确定型决策(UncertainDecision)是在对将发生结果的概率一无所知的情况华南农业大学数学建模培训资料下做出的决策.即决策者只掌握了每种方案可能出现的各个结果,但不知道各个结果发生的概率.由于缺乏必要的情报资料,决策者只能根据自己对事物的态度去进行抉择,不同的决策者可以有不同的决策准则,所以同一问题就可能有不同的抉择和结果.这里我们只介绍风险型和不确定型两种决策.第二节风险型决策(有概率的决策)风险型决策也称随机决策,是在状态概率已知的条件下进行的决策.本节主要介绍风险型决策的条件和一些常用的基本决策准则及决策方法.一、风险型决策的基本条件在进行风险型决策分析时,被决策的问题应具备下列条件:(1)存在决策者希望实现的明确目标;(2)存在两个或两个以上的自然状态,但未来究竟出现哪种自然状态,决策者不能确定;(3)存在着两个或两个以上的可行方案(即策略)可供决策者选择,最后只选一个方案;(4)各种方案在各种自然状态下的益损值可以计算出来;(5)各种自然状态发生的概率可以计算或估计出来.对于一个风险型决策问题,首先要掌握决策所需的有关资料和信息,从而确定状态集S,以及状态概率)(jsP,明确可供选择的策略集A,进而计算出益损函数),(SAR.建立决策数学模型,根据决策目标选择决策准则,从而找出最优方案.二、最大可能准则由概率论知识可知,一个事件的概率越大,它发生的可能性越大.基于这种考虑,在风险型决策问题中选择一个概率最大的自然状态进行决策,而其他状态可以不管,这种决策准则称为最大可能准则(TheMaximumCriterion).利用这种决策准则进行决策时,把确定的自然状态看作必然事件,其发生的概率看作1,而其他自然状态看作不可能事件,其发生的概率看作0,这样,认为系统中只有一种确华南农业大学数学建模培训资料定的自然状态,从而将风险型决策转化为确定型决策.例3某药厂要确定下一计划期内某药品的生产批量,根据以往经验并通过市场调查和预测.现要通过决策分析,确定合理批量,使药厂获得效益最大,表2为不同方案在不同状态下的益损值.表2不同方案在不同状态下的益损值(万元)药品销路方案1s(好)2s(一般)3s(差)2.0)(1=sp5.0)(2=sp3.0)(3=sp1a(大批量生产)301882a(中批量生产)2520123a(小批量生产)161616解这是一个风险型决策问题,采用最大可能准则来进行决策.在药品销路中,自然状态2S出现的概率最大,即销路一般的可能性最大.现对这一种自然状态进行决策,通过比较,可知药厂采用策略2a(中批量生产)获利最大,所以选取中批量生产为最优方案.值得注意:在若干种自然状态发生的概率相差很大,而相应的益损值又差别不大时,使用这种决策准则效果较好.如果在若干种自然状态发生的概率都很小,而且相互很接近时,使用这种决策准则,其效果是不好的,甚至会引起严重错误.三、期望值准则期望值是指概率论中随机变量的数学期望.这里使用的是离散型随机变量的数学期望,是将每个策略(方案)都看作离散型随机变量,其取值就是采用该策略时各自然状态下对应的益损值.期望值准则(TheExpectedValueCriterion)就是选择期望益损值最大(或最小)的方案为最优方案.用公式表达为:)}({max)}({maxjjijiiispraER∑==∗(1)或)}({min)}({min∑==∗jjijiiispraER(2)其中ijr是方案ia在状态js情况下的益损值,)(jsp是状态js发生的概率.华南农业大学数学建模培训资料例4用期望值准则解例3.解根据表2所列各种状态概率和益损值,可以算出每个策略的期望益损值:163.0165.0162.016)(6.183.0125.0202.025)(4.173.085.0182.030)(321=×+×+×==×+×+×==×+×+×=aEaEaE通过比较可知)(2aE=6.18最大,所以采用2a也就是采取中批量生产,可能获得的效益最大.例5已知在过去的200天里,某药品在各种销售量下销售天数的记录如表3所示.设该种药品一旦生产出来需要及时推销出去,如当天不能推销出去,即全部报废.该药品每件生产成本8元,销售价10元,假设今后的销售情况与过去的销售情况相同,试确定最优的生产数量.表3销售量与销售时间每天销售量(件)8090100110相应的销售天数20708030解在本例中,自然状态是销售情况,设状态1s、2s、3s、4s分别表示销售量为80件、90件、100件、110件.策略也为4种,设方案4321,,,aaaa分别表示日生产80件、90件、100件、110件.由表3可计算状态概率:1.0200/20)(1==sp35.0200/70)(2==sp4.0200/80)(3==sp15.0200/30)(4==sp现在计算每个策略在各种自然状态下的益损值.当1a,1s时,生产80件销售80件,每件收益10-8=2元,共收益160元,即16011=r元,同理160141312===rrr;当2a,1s时,生产90件,但只销售80件,报废10件.共收益8010880221=×−×=r元.依此类推,可算出所有的益损值,详列于表4,利用(1)式计算出每种策略下的期望益损值进行比较,可以看出:华南农业大学数学建模培训资料170)()}(),(),(),(max{24321==aEaEaEaEaE故选择方案2a为最优策略,即日产90件,此时期望益损值为170元.表4不同方案在不同状态下的益损值(元)市场可销售量方案1s2s3s4s1.0)(1=sp35.0)(2=sp4.0)(3=sp15.0)(4=sp期望益损值1a1601601601601602a801801801801703a01002002001454a-802012022080一般地,用期望值准则进行风险型决策的计算步骤是:(1)根据统计资料计算各个自然状态的概率;(2)计算每个方案在各个自然状态下的益损值;(3)计算每个方案的期望益损值;(4)根据期望益损值评价方案的优劣.若决策目标是收益,应选择期望益损值最大的相应方案为最优方案;若决策目标是支出或损失,应选择期望益损值最小的相应方案为最优方案.四、决策树法(decisiontreesmethod)应用期望值准则作决策,还可借助于一种名为“决策树”(decisiontree)的图形来进行,它将方案、状态、益损值和状态概率等用一棵树来表示,将期望益损值也标在这棵树上,然后直接通过比较进行决策.图1就是例6中决策问题的决策树.图9-1决策树图1决策树华南农业大学数学建模培训资料决策树是由决策点、方案节点、树枝、结果节点四部分组成,下面就图中符号做一说明:□—表示决策点,从它引出的分枝称