管理决策分析第三章效用函数

zxczsw123
7 ℃
2018-12-16

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第三章效用函数广西大学数学与信息科学学院运筹管理系§3.1理性行为公理问题：某公司拟推出一种新产品，经预测该产品在市场看好的情况下，可以获利10万；在市场前景较差时，将亏损1万元。市场看好和较差的概率分别为0.6和0.4，是否推出该新产品？若另有一产品可稳获利2万元，推出哪种产品更好？这是一个随机决策问题。§3.1理性行为公理在随机决策中，决策系统（Ω，A，F）中的决策方案均是在状态空间背景中加以比较，并按照某种规则，选出决策者最满意的行动方案。在本章中，我们用事态体表示在随机性状态空间中的行动方案，方案的比较表示为事态体的比较，并引入效用的概念，用以衡量事态体（行动方案）的优劣。§3.1理性行为公理3.1.1事态体及其关系1．事态体的概念定义3.1具有两种或两种以上有限个可能结果的方案（或事情），称为事态体。事态体中各可能结果出现的概率是已知的。事态体即随机性状态空间中的行动方案。1．事态体的概念设某事态体的n个可能结果为：o1,o2,…,on各结果出现的概率是相应为：p1,p2,…,pn则该事态体记为：T＝（p1,o1；p2,o2；…；pn,on）特别当n＝2时，称T为简单事态体，此时T＝（p,o1；1－p,o2）1．事态体的概念事态体可以用树形图表示如下：Tp1p2︰︰︰pno1o2︰︰︰on当n＝2时：pT1-po1o2事态体集合Ŧ的性质①在凸线性组合下，Ŧ是闭集。即：若T1∈Ŧ，T2∈Ŧ，则当0≤λ≤1时，有λT1＋(1－λ)T2∈Ŧ两个事态体的凸线性组合仍是一个事态体。②T＝(0,o1；0,o2；…；1,oj；…；0,on)∈Ŧ称T为退化事态体。退化事态体仍属于事态体集合。2．事态体的比较定义3.2设o1，o2是事态体T的任意两个结果值，根据决策目标和决策者偏好，o1和o2有如下关系：①若偏好结果值o1，则称o1优于o2，记作o1o2；反之，称o1劣于o2，记作o1o2。②若对结果值o1,o2无所偏好，则称o1无差异于o2，记作o1～o2。③若不偏好结果值o1，则称o1不优于o2，记作o1≼o2；反之，称o1不劣于o2，记作o1≽o2。2．事态体的比较定义3.3设两个简单事态体T1，T2具有相同的结果值o1，o2，即：T1＝（p1,o1；1－p1,o2）T2＝（p2,o1；1－p2,o2）并假定o1o2，则：①若p1＝p2，称事态体T1无差异于T2，记作T1～T2。②若p1＞p2，称事态体T1优于T2，记作T1T2；反之，称事态体T1劣于T2，记作T1T2。2．事态体的比较定义3.4设两个简单事态体T1，T2仅具有一个相同结果值，另一个结果值不相同，即：T1＝（p1,o1；1－p1,o0）T2＝（p2,o2；1－p2,o0）且o2o1o0，①若p1≤p2，则事态体T2优于T1，记作T2T1。②若T1～T2，则必有p1＞p2。§3.1理性行为公理3.1.2理性行为公理公理3.l（连通性，可比性）事态体集合Ŧ上事态体的优劣关系是连通的。即若T1，T2∈Ŧ则或者T1T2，或者T2T1，或者T1～T2，三者必居其一。表示任意两个事态体都是可以比较其优劣的！§3.1理性行为公理3.1.2理性行为公理公理3.2（传递性）事态体集合Ŧ上事态体的优劣关系是传递的。即若T1、T2、T3∈Ŧ，且T1T2，T2T3，则必有T1T3。表示任意多个事态体的优劣是可以排序的（若有些事态体无差异，可排在同一位置。）满足公理3.1和公理3.2的事态体集合称为全序集。§3.1理性行为公理3.1.2理性行为公理公理3.3（复合保序性，替代性）若T1，T2，Q∈Ŧ，且0＜p＜1，则T1T2当且仅当pT1＋(1－p)QpT2＋(1－p)Q。表示任意事态体的优劣关系是可以复合的，复合后的事态体保持原有的优劣关系不变。§3.1理性行为公理3.1.2理性行为公理公理3.4（相对有序性，连续性，偏好的有界性）若T1，T2，T3∈Ŧ，且T1T2T3则存在数p，q，0＜p＜l，0＜q＜1，使得：pT1＋(1－p)T3T2qT1＋(1－q)T3表示任意事态体都不是无限优，也不是无限劣。§3.1理性行为公理3.1.3事态体的基本性质性质3.1设事态体T1＝（p,o1；1－p,o0）T2＝（x,o2；1－x,o0）且o1o0，o2o0，若o2o1则存在x=p’＜p使得T1～T2称x为可调概率值。§3.1理性行为公理3.1.3事态体的基本性质性质3.2（确定当量和无差异概率）设事态体T＝（x,o1；1－x,o2）且o1o2。则对于满足优劣关系o1oξo2的任意结果值oξ，必存在x＝p（0＜p＜l），使得T＝（p,o1；1－p,o2）～oξ称结果值oξ为事态体T的确定当量，称p为oξ关于o1与o2的无差异概率。3.1.3事态体的基本性质性质3.3任一事态体无差异于一个简单事态体。设有事态体T＝（p1,o1；p2,o2；…；pn,on）则必存在一个简单事态体T’＝（p’,o*；1－p’,o0）～T其中：o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}且：njjjqpp1这里，qj(j=1,2,…,n)为oj关于o*与o0的无差异概率。3.1.3事态体的基本性质根据性质3.3比较一般事态体之间的优劣关系，可以转化为比较简单事态体之间的优劣关系（将问题简化）得到事态体之间两两的优劣或无差异关系后，再根据公理3.2（传递性）即可得到所讨论事态体的排序。§3.2效用函数的定义和构造设有决策系统（Ω，A，F），在离散情况下，结果值可以表示为决策矩阵：mnmmnnnmijooooooooooO.....................)(212222111211§3.2效用函数的定义和构造矩阵O的第i行表示第i个可行方案的n个可能结果值，即事态体Ti＝（p1,oi1；p2,oi2；…；pn,oin）(i=1,2,…,m)决策就是要对这m个事态体进行排序。由第一节中的性质3.3知，存在简单事态体T’，使得Ti’＝（pi’,o*；1－pi’,o0）～Ti问题又化为对这m个简单事态体Ti’进行排序。§3.2效用函数的定义和构造Ti’＝（pi’,o*；1－pi’,o0）～Ti注意到这m个简单事态体Ti’具有相同的结果值o*、o0，根据定义3.3，其优劣关系可以由比较pi’的大小决定。根据性质3.3njijjiqpp1qjj是结果值oij关于o*与o0的无差异概率。其中：问题：如何测定无差异概率？，}{max,ijjioo*≽}{min,ijjioo0≼§3.2效用函数的定义和构造3.2.1效用和效用函数的概念1.效用的概念定义3.5设决策问题的各可行方案有多种可能的结果值o，依据决策者的主观愿望和价值倾向，每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。§3.2效用函数的定义和构造3.2.1效用和效用函数的概念2.效用函数的概念定义3.6若在事态体集合Ŧ上存在实值函数u，有：(1)对任意的T1、T2∈Ŧ，T1T2当且仅当u(T1)u(T2)(2)对任意的T1、T2∈Ŧ，且0≤λ≤1，有u[λT1＋(1－λ)T2]=λu(T1)＋(1－λ)u(T2)则称u(T)为定义在Ŧ上的效用函数。3.2.1效用和效用函数的概念3.估计效用函数的方法（1）标准效用测定法(概率当量法，V－M法)思路：对于给定的结果值，测定其效用值。设有决策系统（Ω，A，F），其结果值集合为：O＝（o1,o2,…,on）记：o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}对于每一个结果值oj都存在一个概率值pj，使得oj～（pj,o*；1－pj,o0）pj就可以作为结果值oj的效用值。3.2.1效用和效用函数的概念（1）标准效用测定法(概率当量法，V－M法)步骤①设u(o*)=1，u(o0)=0；②建立简单事态体（x,o*；1-x,o0），其中x称为可调概率；③通过反复提问，不断改变可调概率值x，让决策者权衡比较，直至当x=pj时oj～（pj,o*；1－pj,o0）④测得结果值oj的效用u(oj)=pj=pju(o*)＋(1－pj)u(o0)3.2.1效用和效用函数的概念3.估计效用函数的方法（2）确定当量法(修正的V－M法)思路：对于给定的效用值，测定其结果值。步骤①设u(o*)=1，u(o0)=0；②对于给定的效用值pj，构造简单事态体（pj,o*；1－pj,o0）③通过反复提问，不断改变结果值oξ，让决策者权衡比较，直至当oξ=oj时oj～（pj,o*；1－pj,o0）④得效用值pj对应的结果值为oj，即u(oj)=pj。3.2.2效用函数的构造介绍一种实用的效用函数的构造方法。基本思路对于决策问题的结果值集合，先用确定当量法找出一个基准效用值，即效用值等于0.5的结果值，称为确定当量oξ。其余效用值不再测定，而是按比例用线性内插的方法，用同一个标准计算得到。3.2.2效用函数的构造方法设决策问题结果值集合为：O＝（o1,o2,…,on）①取o*≽max{o1,o2,…,on}o0≼min{o1,o2,…,on}并令u(o*)=1，u(o0)=0；②构造简单事态体（0.5,o*；0.5,o0），用确定当量法找到该事态体的确定当量oξ，使得：oξ～（0.5,o*；0.5,o0）3.2.2效用函数的构造方法③对结果值进行归一化处理，记归一化的结果值为x(oj)Oooooooxjjj，　0*0)(则：x*=x(o*)=1，x0=x(o0)=0，0≤x(oj)≤1④记确定当量oξ的归一化值为ε，也记为x0.50*05.00*05.0)(xxxxoooooxx得到经归一化变换后的效用曲线上的三个点：（0,0）,（ε,0.5）,（1,1）ux011ε0.53.2.2效用函数的构造方法⑤在新区间[0,ε]和[ε,1]按同样方法插入点（x0.25,0.25）和（x0.75,0.75），保持比例关系0*05.005.0025.0xxxxxxxx计算得：275.0225.02xx，　0*05.05.0*5.075.0xxxxxxxx效用曲线上新增两个点：（ε2,0.25）,（2ε－ε2,0.75）ux011ε0.50.25ε20.752ε－ε2⑥若认为点数太少，效用曲线不够精确，可继续按同样方法在新产生的区间内插入效用中点，直到产生足够的点为止。若在效用区间[0,1]中插入2n个分点：)2,,2,1(2nnkk　　记相应的归一化的结果值为△k，有：111)2,,3,2)2()1]212([)1(0)2,,2,1()1(srnrrkknttnkkrktktkkk　（　　　　　　　　　　　　　　　　其中：　　3.2.3效用与风险的关系在风险型或不确定型决策问题中，决策者选择方案几乎都要承担一定的风险，不同的决策者对风险的态度是有区别的。效用表示了决策者对决策方案各结果值的偏好程度，也反映了不同类型的决策者对风险的不同态度。因此从不同类型的效用函数可以看出决策者对风险的不同态度。3.2.3效用与风险的关系1.中立型效用函数设有效用函数u=u(x)，若对xl＜x2，有)2(2)()(2121xxuxuxu则称该效用函数为中立型。其效用曲线是一条直线。中立型效用函数的效用值和结果值成正比例，因此可以用结果值直接评选方案。3.2.3效用与风险的关系2.保守型效用函数设有效用函数u=u(x)，若对xl＜x2，有)2(2)()(2121xxuxuxu则称该效用函数为保守型。其效用曲线是一条上凸曲线，表示效用值随结果值的增加而增加，但增加的速度逐渐由快至慢。反映了决策者随结果值增加越来越谨慎，对风险持厌恶态度。3.2.3效用与风险的关系3.冒进型效用函数设有效用函数u=u(x)，若对xl＜x2，有