效用函数-哈尔滨工业大学

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3-1第三章效用函数§3—1效用的定义和公理系统一、引言·为什么要引入效用决策问题的特点:自然状态不确定——以主观概率表示;后果价值待定——以效用度量。1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100元,与已有10000元再增加100元的作用不同,这是钱的边际价值问题。例二:礼品抽奖10.50.51000元02500元上图作为商业、经营中实际问题的数学模型有普遍意义。有人认为打赌不如礼品,即1000元优于02500元0.50.5*由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反映决策人偏好次序(preferenceorder)的问题*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,心理和生理(身体)状态有关。如工资/工作时间权衡,年龄对带伞与否的影响。*除风险偏好之外,还有时间偏好。i.折扣率;ii.其他。3-2而效用(Utility)就是偏好的量化,是数(实值函数)。DanielBernoulli在1738年指出:“若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择各种可能后果中偏好期望值最高的行动。”二、效用的定义1.符号i.ab(即aPb)读作“a优于b”(aispreferredtob)。:严格序a≧b(即aRb)“a不劣于b”。≧:弱序a~b(即aIb)“a无差别于b”(I:indifference)。~:无差异ii.展望(prospect):或称“预期”,可能的前景即各种后果及后果出现概率的组合P=(pc11,;…;,;pcii…pcnn,)既考虑各种后果(consequence)又考虑了各种后果的概率(probabilityorlikelihood)分布复合展望所有P的集合记作piii.抽奖(lottery)与确定当量(certaintyequivalent)1.0C3C1C2p1-p抽奖L2=pC,2;(),13pC。若C1L2则称确定性后果C1为抽奖L2的确定当量2.效用的定义(A)在集合p上的实值函数u,若它和p上的优先关系≥一致,即:若21,PPp,1P≥2P当且仅当u(1P)≥u(2P)则称u为效用函数效用函数定义在展望集上,而非后果集上。三、效用存在性公理(理性行为公理)VonNeumann-Morgenstern,19443-3·公理1连通性(Connectivity)又称可比性21,PPp,则1P2Por1P2Por1P2P·公理2传递性(Transitivity)321,,PPPp,若1P2P,2P3P则1P3P·公理3替代性公理(加等量时优先关系不变)若321,,PPPp,1P2P且01则对任何3P∈p,必有1P+(1-)3Pp2+(1-)3P或者表达成:1P2P,则1P+(1-)2P1P+(1-)2P即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。·公理4连续性公理----偏好的有界性若1P2P3P则存在01,01,使1P+(1-)3P2P1P+(1-)3P由1P+(1-)3P2P可知3P不是无穷劣,即u(3P)由2P1P+(1-)可知1P不是无穷优,即u(1P)3P即使是死亡,亦不至于无穷劣例:i,过马路1107无法到目的地不过过死亡到目的地若死亡为无穷劣,则不能过马路ii,狂犬病疫苗1106注射不注射20元死亡生存3-4上述公理看来是合乎理性的,事实上并不尽然.例:Allais悖论(Paradox〕例如,1953年Allais在一次学术会议上提出如下问题,请效用理论权威Savage回答i.ABi.ii.ii.$2,500,000$500,000$500,000$0$0$0$0$0$0$0$0$500,000$500,000$2,500,0001.0.89.1.01.11.89.1.9Savage的回答是A组宁择i,B组宁择ii,Allais指出:B组的i,ii,均以0.89的$500,000取代0.89的$0,即与A组的i,ii相对应,照公理3、A、B两组中i,ii,的优先关系应当不变。Savage当时语塞。·效用的公理化定义在上述公理系统中,若p上存在实值函数u,使i.iPjP当且仅当u(iP)>u(jP)ii.u(α,iP;1-α,jP)=αu(iP)+(1-α)u(jP)——线性性iii.对满足上述条件的u1、u2,必有u1(iP)=bu2(iP)+c,其中b,c∈R1,b>0则u(P)称为(基数)效用函数*关于线性:将ii.u(α,iP;1-α,jP)=αu(iP)+(1-α)u(jP)推广到一般,若iP∈p;i≥0,i=1,2,…m;ii=1;则u(im1iiP)=im1iu(iP)四、基数效用与序数效用(Cardinal&OrdinalUtility)3-5基数:实数:2,2.01,100……序数:第1,2,…·区别:1.基数效用定义在展望集p上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上,不涉及概率,可以是自然数2.基数效用反映偏好强度:(正线性变换下唯一)原数列可变换为:b+c,2b+c,3b+c,πb+c;其中b,c∈R1,b>0.而序数效用不反映偏好强度,(保序变换下唯一),原序数列可变换为16,9,4,1;或8,6,4,2,或10,7,6,1等.·序数效用的存在性公理1.连通性(可比)2.传递性3.连续性:对任何确定的后果x,优势集与劣势集均为闭集。(教材:P29§3.1)§3.2效用函数的构造一、离散型的概率分布后果元素有限·各后果效用设定的步骤NM法(vonNeumann-Morgenstern),也称概率当量法由公理4:若1P2P3P,则可找到0α1,使2Pα1P+(1-α)3P第一步:选定C1,C2C,使C2C1令u(C1)=0,u(C2)=1所选择的C1、C2应使比较易于进行.第二步:对C2C3C1,求α(0α1),使C3αC2+(1-α)C1则u(C3)=u(αC2+(1-α)C1)=αu(C2)+(1-α)u(C1)u(C3)=α第三步:若C4C1C2,求α(0α1),使C1αC2+(1-α)C4则u(C1)=u(αC2+(1-α)C4)=αu(C2)+(1-α)u(C4)u(C4)=α/(α-1)第四步:若C5C2C1,求α(0α1),使C2αC5+(1-α)C1则u(C2)=u(αC5+(1-α)C1)=αu(C5)u(C5)=1/α第五步:一致性校验设C5C3C4且C5,C4,C3已知,(C5C2C3C1C4)由C3αC5+(1-α)C4求得u’(C3)若u’(C3)与已知的u(C3)不符,则反复进行二、三、四步,直到一致性校验通过.3-6例a2a1c1c2c3()1()2()1()2下雨看球无雨看球下雨看电视c4无雨看电视设C2C3C4C1一、u(C1)=0,u(C2)=1二、C30.7C2+0.3C1u(C3)=0.7三、C40.4C2+0.6C1u(C4)=0.4校验设C30.4C2+0.6C4u’(C3)=0.64≠0.7重复二、三、若u(C3)不变u(C4)=0.5则通过校验.二、连续型后果集·当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线例1.每天学习时间的效用曲线在10~12小时/日处效用最大8小时/日处效率最高(效用/小时)·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1]§3.3风险与效用一、效用函数包含的内容1.对风险的态度3-7风险厌恶(RiskAversion)风险中立(RiskNeutrality)风险追求(RiskProneness/Seeking)即有冒险倾向以上是初期对风险的解释(PrattC.,1964)2.对后果的偏好强度钱的边缘价值:设某人现有积蓄为0,增加1000地的作用(价值)与有了1000元后再加1500元相等,则此人的财富的价值函数是凹函数。若他认为1000元(0.5,0;0.5,2500),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化。3.效用表示时间偏好十分复杂,我们在第八章再介绍。二、可测价值函数——确定性后果偏好强度的量化定义:在后果空间X上的实值函数v,对ω,x,y,z∈X有i,(ωx)(yz)当且仅当υ(ω)-υ(x)≥υ(y)-υ(z),且ii,υ对正线性变换是唯一确定的。则称υ为可测价值函数说明:i,(ωx)(yz)表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,3-8ii.由定义之ii,可测价值函数具有基数性质但与基数效用不同:VF不反映决策人的风险态度。iii.它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好强度.三、相对风险态度设效用函数u和可测价值函数v在X上都是单调递增,且连续二次可微。1.风险的局部测度0u在x处凹,风险厌恶r(x)=-u”(x)/u’(x)=0u在x处线性,风险中立0u在x处凸,风险追求2.偏好强度的局部测度0在x处有递减的边际价值m(x)=-v”(x)/v’(x)=0在x处有不变的边际价值0在x处有递增的边际价值3.真正的(相对)风险态度的定义若m(x)<r(x)称为在X'区内相对风险厌恶m(x)=r(x)称为在X'内相对风险中立m(x)r(x)称为在X'内相对风险追求四、风险酬金k=E(x)-S这是决策人为了避免风险而愿意损失的金额3-9五、货币的效用1.性质i.单调递增:愈多愈好有界:全世界财富总量不足$1016,u(10100)与u(1090)几乎无差异ii.x较小(相对于决策人资产而言)时,u(x)近乎线性iii.x0时u(x)通常是凹的递减的边际价值风险厌恶x0与x0的形状不同,负债较多有追求风险的倾向.2.钱的效用曲线的构成设某人现有1000元存款(某商店有资产10万,企业有1000万等等)i.NM法(见§3.2)利用x2~αx1+(1-α)x3ii.修正的NM法利用x2~0.5x1+0.5x3例:设u(0)=0,u(1000)=1有300~0.50+0.51000u(300)=0.5又125~0.50+0.5300u(125)=0.25550~0.5300+0.51000u(550)=0.75由0~0.5a+0.5500设a=-250则u(-250)=-u(500)=-0.72-250~0.5b+0.50原因:i,价值函数是S型ii,在一定范围内相对风险态度不变iii,负债到一定程度以上有冒险倾向3-10Friedmann-Savage效用曲线(1948):§3.4损失、风险和贝叶斯风险一、损失函数L有些文献采用损失函数进行分析∵u(c)=u(θ,a)∴l(θ,a)=-u(θ,a)则损失函数与效用作用相同为了使损失值非负,可取l(θ,a)=AaSupSupu(θ,a)-u(θ,a)二、风险函数自然状态集Θ-----参数空间行动集A-----决策空间观察值集X-----测度空间决策规则δ:x→a,,Δ为策略空间损失l(θ,a)=l(θ,δ(x))由于X是随机变量,对给定的θ,采用决策规则δ时定义风险函数R(θ,δ)=EX[l(θ,δ(x))]=[xXl(θ,δ(x))]f(x|θ)dx或xXl(θ,δ(x))p(x|θ)三、贝叶斯风险r(π,δ)=EπR(θ,δ)含义:θ的先验分

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功