效用函数-哈尔滨工业大学

一步杀一
14 ℃
2016-11-25

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

3-1第三章效用函数§3—1效用的定义和公理系统一、引言·为什么要引入效用决策问题的特点：自然状态不确定——以主观概率表示；后果价值待定——以效用度量。1.无形后果，非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量；2.即使是数值量(例如货币)表示的后果，其价值仍有待确定，后果的价值因人而异。例一：同是100元钱，对穷人和百万富翁的价值绝然不同；对同一个人，身无分文时的100元，与已有10000元再增加100元的作用不同，这是钱的边际价值问题。例二：礼品抽奖10.50.51000元02500元上图作为商业、经营中实际问题的数学模型有普遍意义。有人认为打赌不如礼品，即1000元优于02500元0.50.5*由上面两个例子可知：在进行决策分析时，存在如何描述(表达)后果的实际价值，以便反映决策人偏好次序(preferenceorder)的问题*偏好次序是决策人的个性与价值观的反映，与决策人所处的社会、经济地位，文化素养，心理和生理(身体)状态有关。如工资/工作时间权衡，年龄对带伞与否的影响。*除风险偏好之外，还有时间偏好。i.折扣率；ii.其他。3-2而效用(Utility)就是偏好的量化，是数(实值函数)。DanielBernoulli在1738年指出：“若一个人面临从给定行动集(风险性展望集)中作选择的决策问题，如果他知道与给定行动有关的将来的自然状态，且这些状态出现的概率已知或可以估计，则他应选择各种可能后果中偏好期望值最高的行动。”二、效用的定义1.符号i.ab(即aPb)读作“a优于b”(aispreferredtob)。：严格序a≧b(即aRb)“a不劣于b”。≧：弱序a～b(即aIb)“a无差别于b”(I:indifference)。～：无差异ii.展望(prospect):或称“预期”，可能的前景即各种后果及后果出现概率的组合P=(pc11,;…;,;pcii…pcnn,)既考虑各种后果(consequence)又考虑了各种后果的概率(probabilityorlikelihood)分布复合展望所有P的集合记作piii.抽奖(lottery)与确定当量（certaintyequivalent）1.0C3C1C2p1-p抽奖L2=pC,2;(),13pC。若C1L2则称确定性后果C1为抽奖L2的确定当量2.效用的定义(A)在集合p上的实值函数u，若它和p上的优先关系≥一致，即:若21,PPp,1P≥2P当且仅当u(1P)≥u(2P)则称u为效用函数效用函数定义在展望集上，而非后果集上。三、效用存在性公理（理性行为公理）VonNeumann-Morgenstern,19443-3·公理1连通性(Connectivity)又称可比性21,PPp,则1P2Por1P2Por1P2P·公理2传递性(Transitivity)321,,PPPp,若1P2P,2P3P则1P3P·公理3替代性公理(加等量时优先关系不变)若321,,PPPp,1P2P且01则对任何3P∈p,必有1P+(1-)3Pp2+(1-)3P或者表达成：1P2P,则1P+(1-)2P1P+(1-)2P即二种后果中，决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。·公理4连续性公理----偏好的有界性若1P2P3P则存在01,01,使1P+(1-)3P2P1P+(1-)3P由1P+(1-)3P2P可知3P不是无穷劣,即u(3P)由2P1P+(1-)可知1P不是无穷优,即u(1P)3P即使是死亡，亦不至于无穷劣例：i,过马路1107无法到目的地不过过死亡到目的地若死亡为无穷劣，则不能过马路ii,狂犬病疫苗1106注射不注射20元死亡生存3-4上述公理看来是合乎理性的，事实上并不尽然.例：Allais悖论（Paradox〕例如，1953年Allais在一次学术会议上提出如下问题，请效用理论权威Savage回答i.ABi.ii.ii.$2,500,000$500,000$500,000$0$0$0$0$0$0$0$0$500,000$500,000$2,500,0001.0.89.1.01.11.89.1.9Savage的回答是A组宁择i，B组宁择ii，Allais指出：B组的i,ii,均以0.89的$500,000取代0.89的$0，即与A组的i,ii相对应，照公理3、A、B两组中i,ii,的优先关系应当不变。Savage当时语塞。·效用的公理化定义在上述公理系统中，若p上存在实值函数u，使i.iPjP当且仅当u(iP)＞u(jP)ii.u(α,iP;1-α,jP)=αu(iP)+(1-α)u(jP)——线性性iii.对满足上述条件的u1、u2，必有u1(iP)=bu2(iP)+c,其中b,c∈R1,b＞0则u(P)称为(基数)效用函数*关于线性：将ii.u(α,iP;1-α,jP)=αu(iP)+(1-α)u(jP)推广到一般,若iP∈p;i≥0,i=1,2,…m;ii=1;则u(im1iiP)=im1iu(iP)四、基数效用与序数效用(Cardinal&OrdinalUtility)3-5基数：实数：2，2.01,100……序数：第1，2，…·区别：1.基数效用定义在展望集p上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上，不涉及概率，可以是自然数2.基数效用反映偏好强度：(正线性变换下唯一)原数列可变换为:b+c,2b+c,3b+c,πb+c;其中b,c∈R1,b＞0.而序数效用不反映偏好强度，(保序变换下唯一),原序数列可变换为16,9,4,1;或8,6,4,2,或10,7,6,1等.·序数效用的存在性公理1.连通性(可比)2.传递性3.连续性：对任何确定的后果x，优势集与劣势集均为闭集。(教材：P29§3.1)§3.2效用函数的构造一、离散型的概率分布后果元素有限·各后果效用设定的步骤NM法（vonNeumann-Morgenstern），也称概率当量法由公理4:若1P2P3P,则可找到0α1,使2Pα1P+(1-α)3P第一步：选定C1,C2C,使C2C1令u(C1)=0,u(C2)=1所选择的C1、C2应使比较易于进行.第二步：对C2C3C1,求α(0α1),使C3αC2+(1-α)C1则u(C3)=u(αC2+(1-α)C1)=αu(C2)+(1-α)u(C1)u(C3)=α第三步：若C4C1C2,求α(0α1),使C1αC2+(1-α)C4则u(C1)=u(αC2+(1-α)C4)=αu(C2)+(1-α)u(C4)u(C4)=α/(α-1)第四步：若C5C2C1,求α(0α1),使C2αC5+(1-α)C1则u(C2)=u(αC5+(1-α)C1)=αu(C5)u(C5)=1/α第五步：一致性校验设C5C3C4且C5,C4,C3已知，（C5C2C3C1C4）由C3αC5+(1-α)C4求得u’(C3)若u’(C3)与已知的u(C3)不符，则反复进行二、三、四步，直到一致性校验通过.3-6例a2a1c1c2c3()1()2()1()2下雨看球无雨看球下雨看电视c4无雨看电视设C2C3C4C1一、u(C1)=0,u(C2)=1二、C30.7C2+0.3C1u(C3)=0.7三、C40.4C2+0.6C1u(C4)=0.4校验设C30.4C2+0.6C4u’(C3)=0.64≠0.7重复二、三、若u(C3)不变u(C4)=0.5则通过校验.二、连续型后果集·当C为连续变量时,u(c)是光滑的，因此可分段构造，求特征点的效用，再连成光滑曲线例1.每天学习时间的效用曲线在10～12小时／日处效用最大8小时／日处效率最高(效用／小时)·注意：效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴，而不必限于[0,1]§3.3风险与效用一、效用函数包含的内容1.对风险的态度3-7风险厌恶(RiskAversion)风险中立(RiskNeutrality)风险追求(RiskProneness/Seeking)即有冒险倾向以上是初期对风险的解释(PrattC.,1964)2.对后果的偏好强度钱的边缘价值：设某人现有积蓄为0，增加1000地的作用(价值)与有了1000元后再加1500元相等,则此人的财富的价值函数是凹函数。若他认为1000元(0.5,0;0.5,2500),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。3.效用表示时间偏好十分复杂，我们在第八章再介绍。二、可测价值函数——确定性后果偏好强度的量化定义：在后果空间X上的实值函数v，对ω,x,y,z∈X有i,(ωx)(yz)当且仅当υ(ω)-υ(x)≥υ(y)-υ(z),且ii,υ对正线性变换是唯一确定的。则称υ为可测价值函数说明：i，(ωx)(yz)表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,3-8ii.由定义之ii，可测价值函数具有基数性质但与基数效用不同：VF不反映决策人的风险态度。iii.它定在后果空间上，能起序数效用的作用但又与OUF不同：能反映后果的偏好强度.三、相对风险态度设效用函数u和可测价值函数v在X上都是单调递增，且连续二次可微。1.风险的局部测度0u在x处凹,风险厌恶r(x)=-u”(x)/u’(x)=0u在x处线性,风险中立0u在x处凸,风险追求2.偏好强度的局部测度0在x处有递减的边际价值m(x)=-v”(x)/v’(x)=0在x处有不变的边际价值0在x处有递增的边际价值3.真正的(相对)风险态度的定义若m(x)＜r(x)称为在X'区内相对风险厌恶m(x)=r(x)称为在X'内相对风险中立m(x)r(x)称为在X'内相对风险追求四、风险酬金k=E(x)-S这是决策人为了避免风险而愿意损失的金额3-9五、货币的效用1.性质i.单调递增：愈多愈好有界：全世界财富总量不足$1016,u(10100)与u(1090)几乎无差异ii.x较小(相对于决策人资产而言)时,u(x)近乎线性iii.x0时u(x)通常是凹的递减的边际价值风险厌恶x0与x0的形状不同,负债较多有追求风险的倾向.2.钱的效用曲线的构成设某人现有1000元存款(某商店有资产10万，企业有1000万等等)i.NM法(见§3.2)利用x2～αx1+(1-α)x3ii.修正的NM法利用x2～0.5x1+0.5x3例:设u(0)=0,u(1000)=1有300～0.50+0.51000u(300)=0.5又125～0.50+0.5300u(125)=0.25550～0.5300+0.51000u(550)=0.75由0～0.5a+0.5500设a=-250则u(-250)=-u(500)=-0.72-250～0.5b+0.50原因：i,价值函数是S型ii,在一定范围内相对风险态度不变iii,负债到一定程度以上有冒险倾向3-10Friedmann-Savage效用曲线(1948):§3.4损失、风险和贝叶斯风险一、损失函数L有些文献采用损失函数进行分析∵u(c)=u(θ,a)∴l(θ,a)=-u(θ,a)则损失函数与效用作用相同为了使损失值非负，可取l(θ,a)=AaSupSupu(θ,a)-u(θ,a)二、风险函数自然状态集Θ-----参数空间行动集A-----决策空间观察值集X-----测度空间决策规则δ:x→a,,Δ为策略空间损失l(θ,a)=l(θ,δ(x))由于X是随机变量，对给定的θ，采用决策规则δ时定义风险函数R(θ,δ)=EX[l(θ,δ(x))]=[xXl(θ,δ(x))]f(x|θ)dx或xXl(θ,δ(x))p(x|θ)三、贝叶斯风险r(π，δ)=EπR(θ,δ)含义：θ的先验分