第十六章随机性决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用.所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案.在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题.为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.16.1随机性决策问题的基本概念16.1.1主观概率随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的.主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.这里仅给出主观概率所服从的基本假设(或称公理系统):(1)设为一非空集合,其元素可以是某种试验或观察的结果,也可以是自然的状态.将这些元素记作抽象的点,因而有{}.(2)设F是中的一些子集A所构成的集合,F满足下列条件:1)F2)如果AF,则\AAF;3)如果可列多个nAF,1,2,,n则它们的并集1nnAF.(3)设()()PAAF是定义在F上的实值集函数,如果它满足下列条件,就称为F上的(主观或客观)概率测度,或简称概率,这些条件是1)对于每个AF,有0()1;PA2)()1;P3)如果可列多个nAF(1,2,)n,ijAA()ij,则11()().nnnnPAPA这里称点为基本事件,F中的集A称为事件,F是全体事件的集合,()PA称为事件A的(主观或客观)概率,三元总体(,,)FP称为(主观或客观)概率空间.设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4].16.1.2效用函数在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的n个后果为12,,,;nCCC后果iC可能发生的概率分别是(1,2,,),ipin且11.niip用P表示所有后果的概率分布,并记1122(,;,;;,)nnPpCpCpC则称P为展望.所有展望构成的集合记为P,可以验证P关于凸线性组合是封闭的,即如果12,,PPP而且01,则有12(1)PPP.对于任意两个展望12,PPP,都存在一定的优先关系,即对于决策人可以认为1P优于2P,或1P与2P无差异,或1P不优于2P三种情况,将这三种关系分别记为1212,PPPP和21.PP.这种优先关系反映了决策人对各种后果的偏好程度.定义16.1设()uP是定义在展望P上的实值函数,且满足(1)它和在P上的优先关系一致,即如果对于所有12,PPP,有12,PP当且仅当12()()uPuP;(2)它在P上是线性的,即如果12,PPP,而且01,则1212((1))()(1)(),uPPuPuP那么称()uP是定义在展望P上的效用函数.如果1122(,;,;;,)nnPpCpCpCP,则()uP就是表示以概率ip选择(1,2,,)iCin的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2设X为所有确定事件的后果x的集合,()ux是定义在X上的实值函数,如果对于任意的12,xxX有12()()uxux,当且仅当12.xx,则称()ux是定义在X上的序数效用函数.基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的.正线性变换:()()(0)uPuP.保序变换:()(())uxfux,对任意,xXf为严格的单调增加函数.16.2效用函数理论16.2.1效用与风险的关系实际中很多的决策问题都涉及经济效益,对于这类问题,在后果不确定的情况下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型.假设决策人面对一种风险的情况有1/2的机会得不到任何盈利,也有1/2的机会盈利2a元,即他的期望盈利为a元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.如果决策人认为这和不冒任何风险的另一行为盈利a元等价,则对待风险的态度是中立型的.这三种不同的态度可以反映在效用函数上就是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.图16-1三种不同的效用函数曲线由图16-1(a)是风险厌恶型的效用函数,即有123121()()()()22xxuxuxuxu;由图16-1(b)是风险中立型的效用函数,即有123121()()()()22xxuxuxuxu;由图16-1(c)是风险喜好型的效用函数,即有123121()()()()22xxuxuxuxu;实际中,很多的情况效用函数的曲线呈S型,即在后果的范围内,决策人对待风险的态(a)(b)(c)度往往会从厌恶风险改变为喜好风险.如图16-2.图16-2(a)反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b)反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.16.2.2损失函数与风险函数有的时候不要效用函数,而是用损失函数来做决策分析.记损失函数为(,)lxa,它表时示一个决策问题当状态为x,决策人的行动为a时所产生的后果使决策人所受的损失.损失函数可以为正,也可以为负,它反映决策人获得的利益,后果效用越大,则损失越小.由此可以用效用函数来定义损失函数,即令(,)(,)lxauxa实际中,在有些问题上为了使损失函数总是为非负的,也可以定义损失函数为(,)supsup(,)(,).xXaAlxauxauxa在效用理论中,我们说明了期望效用能够合理的表示在风险情况下决策人的偏好,因此,期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.16.2.3随机函数与效用函数随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情况下制定决策的方法,称为随机优势法.假设问题的效用函数为()ux,其自变量x表示财富(为一随机变量)。实际中的问题总是有,xab,且()ux在,ab上有界,对于这种效用函数可以分为以下几类:u(x)aoxoxu(x)(a)(b)图16-2两类S型效用函数曲线1.递增效用函数实际中,一般要求财富的效用函数()ux是,xab的非递减函数,即意味着当财富增加时,它的效用总不会减少.通常是随着x的增加()ux是严格递增的,而且是有界的.为此,我们假设:(1)对于任意12,,xxab,当12xx时有12()()uxux;(2)()ux在,ab上连续,且有界,即存在0M使()uxM;(3)()ux在,ab上一次可微,且在(,)ab内有'0()uxM.记此类效用函数为1U,即1''0Uuuuu和在[a,b]上连续有界,且在(a,b)内这中类型的效用函数仅能反映出财富与风险的关系,但不能反映出决策人对待风险的态度.因此1U中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还可以进一步分类.2.递增的凹效用函数这种效用函数是递增的,故设1()uxU,而且是严格凹的,即()ux在,ab上具有二阶连续有界的导数.记为''''21|,,,0.UuuUuCabu且在(a,b)内实际中常用的2U类函数有幂函数:(),,(0,0);cuxxxabca对数函数:()ln,,(0,);uxxxab指数函数:(),[,)(0).cxuxexac根据风险和效用函数的关系,当',''uu存在,且'0u时,定义对待风险态度的局部测度为'''()(),()uxrxux即()rx是效用函数()ux的曲率测度,可以证明:如果()0rx,则决策人的财产为x时,他是厌恶风险的.如果()0rx,则决策人的财产x时,他是风险中立的.如果()0rx,则决策人财产为x时,他是追求风险的,而且()rx愈大,他愈厌恶(或追求)风险.3.递增的厌恶风险的效用函数实际中,多数决策人对小额盈亏的态度是随着财富的积累而变化的,他们的财富积累愈多,对小额盈亏所冒风险的厌恶程度愈小.因此,我们假设()rx是x的非递增的函数,则可以得到一类效用函数,记为'32|,(),,()0,UuuUrxabx在上连续可微有界,且r即3U是2U的一个子类.由于当'()0rx时,()rx是非递增的。要使'()0rx,即2'''''''2'()()0,()uuuxrxux则''''''2()0,uuu故''''''()()0.uuxu因此,3U类函数存在的必要条件是'''0,(,),uxab但不是充分条件.上面给出了适应于不同情况的效用函数的基本形式,实际中需要依据具体问题的性质,来选用合适的效用函数,对问题进行研究.16.3DVD在线租赁问题数学模型16.3.1问题提出随着信息时代的到来,电子商务已成为一个重要的商业途径.在线DVD租赁就是其中一种典型的经营方式,但在实际的经营过程中还是存在很多问题.下面我们从复杂的现实情况中考虑一个典型的情景.鉴于业务量的考虑,网站有必要采用会员制度,顾客需缴纳一定数量的月费成为会员.会员对哪些DVD有兴趣,只要在线提交订单,网站就能立即了解他们的需求,并通过快递的方式尽可能满足要求.会员提交的订单内容包括他对哪几张DVD感兴趣,对不同的DVD的偏爱度,用数字表示.这些DVD是基于其偏爱程度排序的.网站会根据手头现有的DVD数量和会员的订单进行分发.每个会员每个月租赁次数不得超过2次,每次获得3张DVD.会员看完3张DVD之后,只需要将DVD放进网站提供的信封里寄回(邮费由网站承担),就可以继续下次租赁.1、由于DVD的更新速度很快,网站必须时常更新现有产品,因此在现有会员中随机抽取1000个会员进行调查,以得知愿意观看不同DVD的人数(表1.1给出了其中5种DVD的数据).虽然网站规定每位会员每月只能借两次DVD,但从历史数据显示,60%的会员每月租赁DVD两次,而另外的40%只租一次.现在我们假设网站现有10万个会员,并已经知道会员对DVD的需求,以及会员每月订DVD的规律.问题是应该至少准备多少张,才能保证希望看到该DV