3.效用函数3.1引言3.2效用的定义和公理系统3.3效用函数的构造3.4风险与效用3.5货币的效用3.1引言在定量评价可能的行动的各种后果时,会遇到两个主要问题:(1)后果本身是用语言表述,可能没有任何合适的直接测量标度。(2)即使有一个明确的标度可以测量后果,按这个标度测得的量也可能并不反映后果对决策人的真正价值。3.1引言例3.1考虑钱对同一个人的价值。假设一个学生手头紧张,正好有机会挣100元钱,但是所要做的是他相当讨厌的工作。1)如他经济情况差,他会认为100元钱的实际价值足够大,所要做的工作即使是相当讨厌的,他仍会去干;2)如他先有了10000元,要为100元钱去干这份让他讨厌的工作,他就很可能不干了。问题一:1)、2)中后果的数值分别是多少?问题二:1)、2)中后果的实际价值哪个大?例子说明:即使是数值量表示的后果,它对决策人的实际价值仍有待确定。3.1引言例3.2决策人面临图3.1中决策树所示的选择:①收入礼品1000元,或是②参与一次抽奖:有50%的机会得0元,50%的机会得2500元。礼品抽奖图3.1例3.2的决策树0.50.5250001.010001a2a有人选确定性的1000元的收入。抽奖的期望值虽大,风险也大,实际价值还不如保险的1000元。而有人认为礼品不如抽奖,因为抽奖提供了获得2500元的机会。3.1引言由上面两个例子可知:在进行决策分析时,存在如何描述或表达后果对决策人的实际价值,以便反映决策的人心目中各种后果的偏好次序(preferenceorder)的问题。偏好次序是决策人的个性与价值观的反映,它与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态有关。3.2效用的定义和公理系统3.2.1效用的定义3.2.2效用存在性公理3.2.3效用的公理化定义和效用的存在性3.2.4基数效用与序数效用3.2.1效用的定义效用:商品满足人的欲望的能力和消费者在消费商品时所感受到的满足程度.在决策理论中,后果对决策人的实际价值,即决策人对后果的偏好次序是用效用(utility)来描述的。效用就是偏好的量化,是数(实值函数)。1738年,DanielBernoulli就指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。一、效用的基本概念与符号(1)严格序“”ab(或者记作aPb)的含义是“a优于b”(aispreferredtob);也就是说,若非外界因素的强迫,决策人只会选择a而不会选择b。一、效用的基本概念与符号(2)无差异“~”a~b(或记作aIb)的含义是“a无差异于b”(aisindifferencetob);也就是说,决策人对选择或同样满意。一、效用的基本概念与符号(3)弱序“≥”记作aRb,含义是“a不劣于b”,亦即a优于或者无差异于b。一、效用的基本概念与符号(4)展望(prospect)展望指决策的可能的前景,即各种后果及后果出现的概率的组合,记作P=p1,c1;p2,c2;…;pr,cr;.0.50.5250001.01000优于在例3.2的决策问题中,后果集C={1000,2500,0},采取行动a1和a2时的展望分别是:P1=1.0,1000;0,2500;0,0P2=0,1000;0.5,2500;0.5,0(4)展望(prospect)展望既考虑各种后果Ci,又考虑了各种后果出现的概率(客观概率pi或主观概率πi),全面地描述了在决策问题中采取某种行动的可能前景。复合展望一、效用的基本概念与符号1.0C3C1C2p1-p(5)抽奖与确定当量由机会点和该机会点发出的n个机会枝的概率及相应后果构成的图形称为抽奖(lottery),抽奖又称彩票。若C1~(p,C2;(1-P),C3),则称确定性后果C1为抽奖(p,C2;(1-P),C3)的确定当量(certaintyequivalent)。二、效用的定义根据上述讨论和记号,可以初步给出效用函数的定义如下。定义3.1在集合P上的实值函数u,若它和P上的优先关系≥一致,即:若P1,P2属于P,P1≥P2当且仅当u(P1)≥u(P2),则称u为效用函数。•把效用函数定义在展望集P上而不是定义在后果集C上,是为了使效用函数能够反映决策人对风险的态度。3.2.2效用存在性公理定义3.1给出了效用函数的最基本性质,这就是可以根据它的大小来判断展望P的优劣。但是这样的效用函数是否一定存在呢?回答是不一定。至于决策人的价值判断在满足什么条件时存在与之一致的效用函数,vonNeumann-Morgenstern(1944)给出了效用的存在性公理,又称理性行为公理。3.2.2效用存在性公理式(3.3)推导:P1P2αP1+(1-α)P1αP2+(1-α)P2αP1+(1-α)P3αP2+(1-α)P3公理3.3表明两个有序的展望各有相同的比例被相等的量替代后,优先关系不变.)1(3)1(P例3.3横过马路问题:效用有界性证明例3.5Allais悖论:对预期效用的独立性公理的挑战0.89$500,0000.11b10情况B0.900$2,500,0000.10b20.890.01$500,0000$2,500,0000.10$500,0001.00情况A2a1aAllais悖论:P(a1)=500*1+2500*0+0*0=500P(b1)=500*0.11+2500*0+0*0.89=55P(b2)=500*0+2500*0.1+0*0.9=250P(a2)=500*0.89+2500*0.1+0*0.01=695Allais悖论:a1和a2的优先关系与b1和b2优先关系相对应(替代性)P(a1)=500*1+2500*0+0*0=500P(b1)=500*0.11+2500*0+0*0.89=55P(a1)=500*0.11+2500*0+0*0+500*0.89=500P(a2)=500*0.89+2500*0.1+0*0.01=695P(a2)=500*0+2500*0.1+0*0.01+500*0.89=695P(b2)=500*0+2500*0.1+0*0.01+0*0.89=2503.2.3效用的公理化定义和效用的存在性3.2.3效用函数的存在性3.2.4基数效用与序数效用基数:为实数,如1,2,3,π序数:如第一,二,…,4,3,2,1基数性效用函数与序数效用函数区别:1.基数效用定义在展望集P上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上,不涉及概率,可以是整正数.2.基数效用反映偏好强度:(正线性变换下唯一)原数列可变换为:b+c,2b+c,3b+c,100b+c;其中b,c∈R1,b>0.而序数效用不反映偏好强度,(保序变换下唯一),原序数列可变换为16,9,4,1;或8,6,4,2,或10,7,6,1等.3.2.4基数效用与序数效用基数(cardinalnumber)效用:边际效用分析方法--总效用(TOTALUTILITY,TU):消费者在一定时间内从一定数量商品的消费中所得到的效用量的总和;--边际效用(MARGINALUTILITY,MU):消费者在一定时间内增加一单位商品的消费所得到的效用量的增量.序数(ordinalnumber)效用:无差异曲线分析方法希克斯认为,效用的数值表现只是为了表达偏好的顺序,并非效用的绝对数值。现在比较通用的是序数效用。无差异曲线(Indifferencecurve)含义:无差异曲线表示对消费者没有区别的商品组合的点的轨迹。即无差异曲线是用来表示两种商品或两组商品的不同数量的组合对消费者所提供的效用是相同的。特征:(1)无差异曲线是是一条凸向原点,并向右下方倾斜的曲线,其斜率为负值,它表明在收入与价格既定的条件下,为了获得同样的满足程度,增加一种商品消费时就必须放弃或减少另一种商品的消费。(2)两种商品在消费者偏好不变的条件下,不能同时减少或增多。在同一平面图上有无数条无差异曲线,同一条无差异曲线代表同样的满足程度,不同的无差异曲线代表不同的满足程度,离原点越远,满足程度越大,反之则越小。(3)在同一平面图上,任意两条无差异曲线不能相交,否则与第二点矛盾。3.3效用函数的构造1.估计效用函数值的方法2.离散型后果的效用设定3.连续型后果的效用函数构造4.用解析函数近似效用曲线1.估计效用函数值的方法⑴概率当量法⑵确定当量法⑶增益当量法⑷损失当量法从纯理论角度看,这四种方法并没有实质性的区别;但是实验结果表明,使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hershey,1982);采用增益当量法与损失当量法时产生的误差也比用概率当量法大,因此只要有可能,应该尽可能使用概率当量法。⑴概率当量法2.离散型后果的效用设定后果为离散型随机变量时,后果集C中元素为有限个,构造后果集上的效用函数有两方面的内容:(1)确定各后果之间的优先序;(2)确定后果之间的优先程度。离散型后果效用值的设定可以采用概率当量法,简称NM法。NM法步骤如下:例3.6例3.6天气预报说球赛时可能有雨,一个足球爱好者要决定是否去球场看球。看球看电视c2无雨看球c1下雨看球c4无雨看电视c3下雨看电视)(1)(1)(2)(21a2a首先作该问题的决策树如图所示。由题意可知决策人对四种后果优劣的排序是:c2c3c4c1。步骤:第一步:令u(c1)=0,u(c2)=1。第二步:询问决策人,下雨在家看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.3,则c30.7c2+0.3c1,u(c3)=0.7u(c2)=0.7。第三步:询问决策人,无雨看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.6,则c40.4c2+0.6c1,得u(c4)=0.4c2=0.4。第四步:进行一致性校验。c30.4c2+0.6c4,则u’(c3)=0.64≠0.7。重复二、三,若u(c3)不变,则调整u(c4)=0.5,决策人仍认为c30.4c2+0.6c4,则通过校验。3.连续型后果的效用函数构造当后果c为连续变量时,上述方法就不再适用。但是如果能通过分析找到u(c)的若干特征值,求特征点的效用后,再连成光滑曲线;或者u(c)是连续、光滑的,则可以分段构造u(c)。每天学习时间与效用•随着学习时间的增加,效用值也会有所增加•但是由于进入状态需要一定的时间,所以在t较小时,效用的增加较慢;•过了一小段时间后,效用与所化时间基本上是线性关系;•随着学习时间的不断增加,人会疲劳,效率会下降;•时间太长,这时的效果不如时间适度,即存在效用值最大的点tm;•再增加学习时间又会从效用最大值处下降。其中与效用最大值对应的tm是因人而异。•由于效用函数的惟一性(即在正线性变换下惟一,见效用的公理化定义),效用的值域可以是整个实轴,而不必限于[0,1]区间。4.用解析函数近似效用曲线为了分析和运算方便,分析人员通常希望能够用某种解析函数式u(x)来近似地表达效用。常用的函数有幂函数和对数函数.3.4风险与效用3.4.1风险的含义3.4.2效用函数包含的内容3.4.3相对风险态度3.4.1风险的含义风险包含有两个方面的内容:(1)后果的损失严重程度;(2)出现损失的可能性的大小.一般的,可以用以下几种指标来度量风险。(1)方差(2)自方差(3)临界概率(4)Fishburn的风险定义3.4.2效用函数包含的内容1.对风险的态度2.对后果的偏好强度3.可测价值函数1.对风险的态度如图所示为几种典型的效用函数曲线。曲线A是下凹的,曲线N是线性的,曲线P是凸函数。这三种形状的曲线分别反映了决策人的三种风险态度:风险厌恶(riskaversion)、风险中立(