第三章效用函数

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章效用函数广西大学数学与信息科学学院运筹管理系§3.1理性行为公理问题:某公司拟推出一种新产品,经预测该产品在市场看好的情况下,可以获利10万;在市场前景较差时,将亏损1万元。市场看好和较差的概率分别为0.6和0.4,是否推出该新产品?若另有一产品可稳获利2万元,推出哪种产品更好?这是一个随机决策问题。§3.1理性行为公理在随机决策中,决策系统(Ω,A,F)中的决策方案均是在状态空间背景中加以比较,并按照某种规则,选出决策者最满意的行动方案。在本章中,我们用事态体表示在随机性状态空间中的行动方案,方案的比较表示为事态体的比较,并引入效用的概念,用以衡量事态体(行动方案)的优劣。§3.1理性行为公理3.1.1事态体及其关系1.事态体的概念定义3.1具有两种或两种以上有限个可能结果的方案(或事情),称为事态体。事态体中各可能结果出现的概率是已知的。事态体即随机性状态空间中的行动方案。1.事态体的概念设某事态体的n个可能结果为:o1,o2,…,on各结果出现的概率是相应为:p1,p2,…,pn则该事态体记为:T=(p1,o1;p2,o2;…;pn,on)特别当n=2时,称T为简单事态体,此时T=(p,o1;1-p,o2)1.事态体的概念事态体可以用树形图表示如下:Tp1p2︰︰︰pno1o2︰︰︰on当n=2时:pT1-po1o2事态体集合Ŧ的性质①在凸线性组合下,Ŧ是闭集。即:若T1∈Ŧ,T2∈Ŧ,则当0≤λ≤1时,有λT1+(1-λ)T2∈Ŧ两个事态体的凸线性组合仍是一个事态体。②T=(0,o1;0,o2;…;1,oj;…;0,on)∈Ŧ称T为退化事态体。退化事态体仍属于事态体集合。2.事态体的比较定义3.2设o1,o2是事态体T的任意两个结果值,根据决策目标和决策者偏好,o1和o2有如下关系:①若偏好结果值o1,则称o1优于o2,记作o1o2;反之,称o1劣于o2,记作o1o2。②若对结果值o1,o2无所偏好,则称o1无差异于o2,记作o1~o2。③若不偏好结果值o1,则称o1不优于o2,记作o1≼o2;反之,称o1不劣于o2,记作o1≽o2。2.事态体的比较定义3.3设两个简单事态体T1,T2具有相同的结果值o1,o2,即:T1=(p1,o1;1-p1,o2)T2=(p2,o1;1-p2,o2)并假定o1o2,则:①若p1=p2,称事态体T1无差异于T2,记作T1~T2。②若p1>p2,称事态体T1优于T2,记作T1T2;反之,称事态体T1劣于T2,记作T1T2。2.事态体的比较定义3.4设两个简单事态体T1,T2仅具有一个相同结果值,另一个结果值不相同,即:T1=(p1,o1;1-p1,o0)T2=(p2,o2;1-p2,o0)且o2o1o0,①若p1≤p2,则事态体T2优于T1,记作T2T1。②若T1~T2,则必有p1>p2。§3.1理性行为公理3.1.2理性行为公理公理3.l(连通性,可比性)事态体集合Ŧ上事态体的优劣关系是连通的。即若T1,T2∈Ŧ则或者T1T2,或者T2T1,或者T1~T2,三者必居其一。表示任意两个事态体都是可以比较其优劣的!§3.1理性行为公理3.1.2理性行为公理公理3.2(传递性)事态体集合Ŧ上事态体的优劣关系是传递的。即若T1、T2、T3∈Ŧ,且T1T2,T2T3,则必有T1T3。表示任意多个事态体的优劣是可以排序的(若有些事态体无差异,可排在同一位置。)满足公理3.1和公理3.2的事态体集合称为全序集。§3.1理性行为公理3.1.2理性行为公理公理3.3(复合保序性,替代性)若T1,T2,Q∈Ŧ,且0<p<1,则T1T2当且仅当pT1+(1-p)QpT2+(1-p)Q。表示任意事态体的优劣关系是可以复合的,复合后的事态体保持原有的优劣关系不变。§3.1理性行为公理3.1.2理性行为公理公理3.4(相对有序性,连续性,偏好的有界性)若T1,T2,T3∈Ŧ,且T1T2T3则存在数p,q,0<p<l,0<q<1,使得:pT1+(1-p)T3T2qT1+(1-q)T3表示任意事态体都不是无限优,也不是无限劣。§3.1理性行为公理3.1.3事态体的基本性质性质3.1设事态体T1=(p,o1;1-p,o0)T2=(x,o2;1-x,o0)且o1o0,o2o0,若o2o1则存在x=p’<p使得T1~T2称x为可调概率值。§3.1理性行为公理3.1.3事态体的基本性质性质3.2(确定当量和无差异概率)设事态体T=(x,o1;1-x,o2)且o1o2。则对于满足优劣关系o1oξo2的任意结果值oξ,必存在x=p(0<p<l),使得T=(p,o1;1-p,o2)~oξ称结果值oξ为事态体T的确定当量,称p为oξ关于o1与o2的无差异概率。3.1.3事态体的基本性质性质3.3任一事态体无差异于一个简单事态体。设有事态体T=(p1,o1;p2,o2;…;pn,on)则必存在一个简单事态体T’=(p’,o*;1-p’,o0)~T其中:o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}且:njjjqpp1这里,qj(j=1,2,…,n)为oj关于o*与o0的无差异概率。3.1.3事态体的基本性质根据性质3.3比较一般事态体之间的优劣关系,可以转化为比较简单事态体之间的优劣关系(将问题简化)得到事态体之间两两的优劣或无差异关系后,再根据公理3.2(传递性)即可得到所讨论事态体的排序。§3.2效用函数的定义和构造设有决策系统(Ω,A,F),在离散情况下,结果值可以表示为决策矩阵:mnmmnnnmijooooooooooO.....................)(212222111211§3.2效用函数的定义和构造矩阵O的第i行表示第i个可行方案的n个可能结果值,即事态体Ti=(p1,oi1;p2,oi2;…;pn,oin)(i=1,2,…,m)决策就是要对这m个事态体进行排序。由第一节中的性质3.3知,存在简单事态体T’,使得Ti’=(pi’,o*;1-pi’,o0)~Ti问题又化为对这m个简单事态体Ti’进行排序。§3.2效用函数的定义和构造Ti’=(pi’,o*;1-pi’,o0)~Ti注意到这m个简单事态体Ti’具有相同的结果值o*、o0,根据定义3.3,其优劣关系可以由比较pi’的大小决定。根据性质3.3njijjiqpp1qjj是结果值oij关于o*与o0的无差异概率。其中:问题:如何测定无差异概率?,}{max,ijjioo*≽}{min,ijjioo0≼§3.2效用函数的定义和构造3.2.1效用和效用函数的概念1.效用的概念定义3.5设决策问题的各可行方案有多种可能的结果值o,依据决策者的主观愿望和价值倾向,每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。§3.2效用函数的定义和构造3.2.1效用和效用函数的概念2.效用函数的概念定义3.6若在事态体集合Ŧ上存在实值函数u,有:(1)对任意的T1、T2∈Ŧ,T1T2当且仅当u(T1)u(T2)(2)对任意的T1、T2∈Ŧ,且0≤λ≤1,有u[λT1+(1-λ)T2]=λu(T1)+(1-λ)u(T2)则称u(T)为定义在Ŧ上的效用函数。3.2.1效用和效用函数的概念3.估计效用函数的方法(1)标准效用测定法(概率当量法,V-M法)思路:对于给定的结果值,测定其效用值。设有决策系统(Ω,A,F),其结果值集合为:O=(o1,o2,…,on)记:o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}对于每一个结果值oj都存在一个概率值pj,使得oj~(pj,o*;1-pj,o0)pj就可以作为结果值oj的效用值。3.2.1效用和效用函数的概念(1)标准效用测定法(概率当量法,V-M法)步骤①设u(o*)=1,u(o0)=0;②建立简单事态体(x,o*;1-x,o0),其中x称为可调概率;③通过反复提问,不断改变可调概率值x,让决策者权衡比较,直至当x=pj时oj~(pj,o*;1-pj,o0)④测得结果值oj的效用u(oj)=pj=pju(o*)+(1-pj)u(o0)3.2.1效用和效用函数的概念3.估计效用函数的方法(2)确定当量法(修正的V-M法)思路:对于给定的效用值,测定其结果值。步骤①设u(o*)=1,u(o0)=0;②对于给定的效用值pj,构造简单事态体(pj,o*;1-pj,o0)③通过反复提问,不断改变结果值oξ,让决策者权衡比较,直至当oξ=oj时oj~(pj,o*;1-pj,o0)④得效用值pj对应的结果值为oj,即u(oj)=pj。3.2.2效用函数的构造介绍一种实用的效用函数的构造方法。基本思路对于决策问题的结果值集合,先用确定当量法找出一个基准效用值,即效用值等于0.5的结果值,称为确定当量oξ。其余效用值不再测定,而是按比例用线性内插的方法,用同一个标准计算得到。3.2.2效用函数的构造方法设决策问题结果值集合为:O=(o1,o2,…,on)①取o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}并令u(o*)=1,u(o0)=0;②构造简单事态体(0.5,o*;0.5,o0),用确定当量法找到该事态体的确定当量oξ,使得:oξ~(0.5,o*;0.5,o0)3.2.2效用函数的构造方法③对结果值进行归一化处理,记归一化的结果值为x(oj)Oooooooxjjj, 0*0)(则:x*=x(o*)=1,x0=x(o0)=0,0≤x(oj)≤1④记确定当量oξ的归一化值为ε,也记为x0.50*05.00*05.0)(xxxxoooooxx得到经归一化变换后的效用曲线上的三个点:(0,0),(ε,0.5),(1,1)ux011ε0.53.2.2效用函数的构造方法⑤在新区间[0,ε]和[ε,1]按同样方法插入点(x0.25,0.25)和(x0.75,0.75),保持比例关系0*05.005.0025.0xxxxxxxx计算得:275.0225.02xx, 0*05.05.0*5.075.0xxxxxxxx效用曲线上新增两个点:(ε2,0.25),(2ε-ε2,0.75)ux011ε0.50.25ε20.752ε-ε2⑥若认为点数太少,效用曲线不够精确,可继续按同样方法在新产生的区间内插入效用中点,直到产生足够的点为止。若在效用区间[0,1]中插入2n个分点:)2,,2,1(2nnkk  记相应的归一化的结果值为△k,有:111)2,,3,2)2()1]212([)1(0)2,,2,1()1(srnrrkknttnkkrktktkkk (                其中:  3.2.3效用与风险的关系在风险型或不确定型决策问题中,决策者选择方案几乎都要承担一定的风险,不同的决策者对风险的态度是有区别的。效用表示了决策者对决策方案各结果值的偏好程度,也反映了不同类型的决策者对风险的不同态度。因此从不同类型的效用函数可以看出决策者对风险的不同态度。3.2.3效用与风险的关系1.中立型效用函数设有效用函数u=u(x),若对xl<x2,有)2(2)()(2121xxuxuxu则称该效用函数为中立型。其效用曲线是一条直线。中立型效用函数的效用值和结果值成正比例,因此可以用结果值直接评选方案。3.2.3效用与风险的关系2.保守型效用函数设有效用函数u=u(x),若对xl<x2,有)2(2)()(2121xxuxuxu则称该效用函数为保守型。其效用曲线是一条上凸曲线,表示效用值随结果值的增加而增加,但增加的速度逐渐由快至慢。反映了决策者随结果值增加越来越谨慎,对风险持厌恶态度。3.2.3效用与风险的关系3.冒进型效用函数设有效用函数u=u(x),若对xl<x2,有

1 / 57
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功