长沙理工大学交通运输工程学院第七章非集计模型长沙理工大学交通运输工程学院7.1非集计模型概述非集计模型(DisaggregateModel)是强调其与集计模型(AggregateModel)的不同而命名的,通常也称为非集计行为模型(DisaggregateBehavioralModel)、个人选择模型(IndividualChoiceModel)或离散选择模型(DiscreteChoiceModel)。非集计模型的基本假设是当出行者面临选择时,他对某种选择的偏好可以用被选择对象的“吸引度”或“效用值”来描述,效用是被选择对象的属性和决策者的特征的函数。非集计模型(离散选择模型)是基于效用最大和随机效用(randomutilitytheory)两个概念建立起来的,最常见的两个离散选择模型为:多元Logit模型、多元Probit模型。非集计模型在交通领域的交通方式划分和交通分配阶段有着十分广泛的应用。长沙理工大学交通运输工程学院交通需求预测中的集计与非集计分析交通需求预测的集计模型通常是将每个人的交通活动按交通小区进行统计处理、分析,从而得到以交通小区为单位的分析模型。需求预测的非集计模型则以实际产生交通活动的个人为单位,调查得到的数据不按交通小区进行统计等处理而直接用于建立模型。与集计分析相比较,非集计分析在分析的单位、模型预测方法、应用层面、政策体现、数据的效率和说明变量等方面有着明显的差异。非集计模型的发展非集计模型的开发、研究始于20世纪60年代初期,最早是以交通方式选择为研究中心。进入70年代,MIT的Mcfadden教授等人在理论研究上取得了很大的进展,将非集计模型的研究推向了实用化阶段。长沙理工大学交通运输工程学院集计分析与非集计分析的区别类别项目集计分析非集计分析调查单位各次出行各次出行分析单位交通小区个人或家庭因变量小区统计值(连续量)个人的选择(离散量)自变量各小区的数据各个人的数据预测方法回归分析等极大似然法适用范围水平预测交通小区任意政策的体现交通小区代表值的变化个人变量值的变化出行频率出行的发生与吸引出行分布目的地选择交通方式划分交通方式选择交通现象的把握方法路径分配路径选择长沙理工大学交通运输工程学院7.2选择函数基本变量及其定义K:方案的集合;选择集合中包含K个备选对象:1、2、……、K。kU:方案k的效用。),,,,,(21KkUUUUU:选择集合K对应的效用向量。对某一个决策者而言,某个选择对象(方案、交通方式、路径等)的效用可以表示为被选对象的可测特征和决策者本人特征两者的函数,用向量a表示包含了这些特征参数的变量向量,则有:)(aUUkk。考虑到存在不可测特征对效用值的影响,将效用kU定义为一个随机变量,该随机变量由效用确定项)(aVk和效用随机项)(ak组成,即有:)()()(aaVaUkkkKk。其中:效用随机项)(ak满足0)(aEk,因此有)()(aVaUEkk成立。通常称)(aUk为“感知效用”(perceivedutility)、)(aVk为“观测效用”(measuredutility)。长沙理工大学交通运输工程学院②选择函数当效用值的分布已知时,从决策者群体中随机挑选出的任意一位决策者选择某一方案的概率就可以计算出来。由于效用的分布是向量a的函数,因此方案)(Kkk被选中的概率kP也与向量a相关,通常称反应kP与a两者关系的函数为选择函数,并用)(aPk来表示。根据效用最大化原则,方案k被选中的概率即为方案k的效用)(aUk高于其它方案效用的概率,即:kjaUaUPaPjkrkK)()()(k另外,选择函数)(aPk还具有一般概率函数的特征,即:1)(0aPk1)(1KkkaPk一旦确定了效用随机误差项k的分布,就可以确定效用值的分布,然后选择函数也可以直接计算出来。长沙理工大学交通运输工程学院考虑一个两方案的简单选择问题,效用函数分别为31U、22U,其它所有的参数和特征变量均为已知的定值,则第一方案被选中的概率为:123211rrrPPUUPP假设误差项的概率密度为区间[-2,2]的均匀分布,则有:75.0411211dxPPr,25.0112PP这说明了在一群认同效用函数31U、22U的决策者中,有75%的人选择方案1,而仅有25%的人选择方案2。如果假设31U、32U,变量的分布不变,则有:5.0410201dxPPr,即有一半的人选择方案1。总体上来讲,某一方案的选择概率取决于效用函数的特征和效用随机项的分布。长沙理工大学交通运输工程学院7.3多元Logit模型多元Logit模型简介多元Logit模型是应用最为广泛的非集计模型之一。如果假定每个效用函数的效用随机项都是独立同Gumble分布的随机变量,则根据效用最大化的原则可以导出多元Logit模型,其选择概率公式为:某一方案的选择概率也可以表示为该方案的效用值与其它可选方案效用值之差的函数:KllkkVVP1)exp()exp(klklkVVP)exp(11长沙理工大学交通运输工程学院二元Logit模型的推导111VU、222VU、)(211UUPPr)()()(12122211211VVPVVPUUPPrrryyVVyPPr,21211假定效用随机项1和2是独立同Gumble分布的随机变量,其分布函数为F、密度函数为f:yeeyyF))exp(exp()(yyeeeyFeeedyydFyfyy)()()()()()(''长沙理工大学交通运输工程学院假定),(12zyf是效用随机项1和2的联合概率密度函数,根据1和2独立同分布的假定,则有联合概率密度函数:)()(),(12zfyfzyf。那么,方案1的选择概率可简化为:dydzzfyfdydzy,zfVVyξPyξPyVVy,ξξPP-VVy--yVV-rrr2121)()()(12212121211将效用随机项的概率分布函数、概率密度函数代入上式中,有:1211212()()()()()()yVVy---y-PfyfzdzdyFyeFyVVdyeFyFyVVdy令)1(211212)21()21()()(VVyVVyyVVyyVVyyeeeeeeeeeeeeeeVVyFyF)1()1(12121212)1()1(VVyyVVeeeeeeeeedydeVVyVVy长沙理工大学交通运输工程学院显然当y时,10e;y时,0e,因此,作积分变换如下:211121211)1(10101011VVVVVVVyyyy-yeeeedeeeddydedddyePdyeP积分转化为对如果有多个选择方案,则选择方案k的概率为:klklKllkkVVVVP)exp(11)exp()exp(1。如果假定效用随机项1和2的概率分布函数和概率密度函数为具有参数(0)的Gumble分布,则二元Logit模型为:2111VVVeeeP,多元Logit模型为:KllkkVVP1)exp()exp(。长沙理工大学交通运输工程学院二元Logit模型的简单算例在公交车/小汽车的两模式Logit选择模型中,两种交通方式的效用函数分别为:tVUbusbusˆ2、tVUcarcar21式中t和tˆ分别表示小汽车和公共汽车的交通时间,则选择小汽车的概率为:)ˆ(2111)21ˆ2exp(11)exp(11)ˆ,(ttcarbuscarettVVttP长沙理工大学交通运输工程学院Logit模型的性质多元Logit模型的优点是简单实用,与其它更复杂的离散选择模型相比,MNL模型相对简单得多(特别是计算简单),另外模型的可解释性也较好。Logit模型的IIA特性对于Logit模型,两个方案的选择概率之比(或称为两个方案的相对优劣)仅取决于这两个方案的特性,而与其它方案的特性无关。通常称该性质为Logit模型的IIA特性(IndependentofIrrelevantAlternative),IIA特性源于效用随机项之间相互独立的假定,属于Logit模型的弱点之一。例如,在比较汽车方式与公共汽车方式时,与地铁无关,而实际上,地铁的存在既对汽车又对公共汽车有影响。这时,则需要使用巢式Logit模型(NL模型)、Dogit模型或Probit模型等。长沙理工大学交通运输工程学院针对Logit模型缺陷特性的例子红蓝巴士问题:如果某人选择小汽车和公共汽车(假定所有的公共汽车都被漆成红色)的概率各为0.5。这时假定新增加一条蓝色的巴士线,由于人们在进行巴士选择时与巴士的颜色无关,新增加蓝色的巴士线后,小汽车、公共汽车的选择概率应仍为0.5,而红、蓝巴士的选择概率应各为0.25。但根据Logit模型,在增加蓝巴士的选择肢后,由于三个方案(小汽车、红色巴士、蓝色巴士)的效用完全一致,公共汽车、红巴士、蓝巴士的选择概率均为1/3。很明显,这是一个不合理的结论,导致这个荒谬结果的原因正是忽视了蓝巴士与红巴士紧密的相关性。红巴士蓝色巴士全方式公交车小汽车0.50.50.250.25图a:图b:10min5min125min120min长沙理工大学交通运输工程学院长短路的路径选择问题:在网络a中,两条路径的时间分别是10min和5min,差别是5min;在网络b中,两条路径的时间分别是125min和120min,差别仍为5min。对图a所示的网络,“时间5min”的路径选择概率为0.993,“时间10min”的路径选择概率为0.007;对图b所示的网络,“时间120min”的路径选择概率仍为0.993,“时间125min”的路径的选择概率仍为0.007。图a所示的网络绝大部分的出行者选择5min的路径行驶是合理的(5min与10min相比,行驶时间缩短了一倍),而在图b所示的网络中,125min和120min路径上的出行者数量应该相差不大(120min与125min相比没有多大的差别)。产生这一现象的根源在于Logit模型的基本假设:假设各路径的感知出行时间有着相同概率分布的误差项(尤其是方差也相同)。长沙理工大学交通运输工程学院Logit模型应用举例在只有公共汽车和汽车两种交通方式的地区,假设如下Logit方式选择模型适用,试用表1~表6所示的现状数据拟合参数,并利用表7~表11所示的将来数据,计算方式划分率和这两种交通方式的将来OD分布。)exp()exp()exp(carijbusijbusijbusijVVVPbusijcarijPP1busijbusijbusijctVcarijcarijcarijctV其中:carijP、busijP分别为汽车和公共汽车的划分率;carijt、busijt分别为汽车和公共汽车的行驶时间(min);carijc、busijc分别为汽车和公共汽车的费用(元);、、为未知常数。长沙理工大学交通运输工程学院表1:公共汽车的行驶时间(min)表2:汽车的行驶时间(min)busijt123carijt12315.011.013.013.08.010.0210