航班延误问题摘要随着人们生活水平的提高,外出乘坐航班的人数与日俱增,航班延误所带来的问题如果不能得到有效解决,可能会造成民众对航空公司失去信心。本论文希望通过采集数据,运用数学等一系列知识,分析出航班延误的原因,从而有效改变航班延误的现象。针对问题一,查询分析最近一个月,最近一周的航班延误状况,通过做柱状图等工具简要分析题目所述是否正确,通过图形可以明显发现成都双流的偏差有点大,选取成都双流机场,香港国际机场和咸阳机场运用层次分析法,通过分析延误率,延误时长,延误损失这三个因素综合评判,得出成都双流的延误确实不如香港国际和咸阳机场严重,因此题目所给的论述是错误的。由于题目本身没有明确指明统计的数量及日期期限等条件,通过查询其他网站进行对比,可进一步印证题目所给的论述有所出入。针对问题二,通过数据及结合现实生活分析出航班延误的一些因素。首先我们运用Eviews对各个因素的共线性进行了分析,由结果可知天气,机场,旅客自身原因是相互独立的,没有共线性。目前国内对于航班延误的因素分析主要基于贝叶斯方法的一些应用。通过收集资料确定航班延误的因素大致有航空公司自身、天气、流量、军事活动及机场故障等几类,利用Netica贝叶斯网络工具软件建模,采用EM算法进行网络学习。由学习结果可以看出,飞机延误的主要因素是机场公司自身原因(包括飞机晚到、航路限制及公司计划等)。针对问题三,就寻求航空公司最优调度这一角度为目标,通过航班置换的方法,建立了延误时间最少和延误成本最低这两个最优化目标。运用matlab编程,构建了时间置换矩阵和成本置换矩阵,通过调用匈牙利算法,得出两目标下的航班替换方案,有结果看出,在不同的目标下,航班替换方案不同,结果也确实显著地减少了航班延误时间和航班延误的成本。为解决实际航班问题提供了依据和方案。[关键词]层析分析法贝叶斯延误调度航班置换matlabEviews一、问题重述香港南华早报网根据flightstats.com的统计称:中国的航班延误最严重,国际上航班延误最严重的10个机场中,中国占了7个。其中包括上海浦东、上海虹桥、北京国际、杭州萧山、广州白云、深圳宝安、成都双流等机场。请自行收集数据并研究以下问题:(1)上述结论是否正确?(2)我国航班延误的主要原因是什么?(3)有什么改进措施?二、问题分析问题一要求统计国内国际航班延误数据,进行合理处理。首先,我们查阅题目所给的网页和一些主要统计部门的相关信息,搜集了最近一周和一个月的航班延误数据,并在此基础之上,考虑利用MATLAB软件做出各种统计指标的柱状图,对数据进行初步的分析。问题二要求我们分析航班延误的真实原因。显然,航班延误是当前国际民航业发展中的一大难题,也是顾客对航空服务质量不满意的主要内容。根据收集得到的数据,我们发现,导致航班延误有两大主要原因,一是航空公司自身的原因,涉及到航空公司自身的相关运行管理;另外一方面是非航空公司自身因素,即空管流量控制,恶劣天气,军事活动等非航空公司自身因素。为了问题分析的方便,考虑对数据进行更深层次的挖掘和处理,并且,有效结合实际情况,分析得出航班延误的真实原因。问题三要求提出航空公司及乘客应对航班延误的策略(如航空公司的预定票策略,乘客购买航空延误保险或恰当选择出行方式等),我们通过分析历年我国航班延误率初步得出我国延误的大致水平,然后从航班延误成本和航班延误时长两个点入手,构造动态规划模型,最后为航空公司提供了一种合理的管理措施,即在延误时长一定的合理范围内,满足延误成本最小的建议。三、模型假设(1)假设收集到的数据真实可靠。(2)假设查阅到的文献资料具有可行性。(3)假设利用层次分析法所设定的影响度真实。(4)假设航空公司是追求利润最大化的,乘客都是理性人。四、符号说明i飞机的指标j航班的下标执行航班f的飞机替换航班f的飞机iT可用飞机的就绪时间集合f'f'jT最早延误航班之后的航班按原计划到达时间集合F最早延误航班之后的航班集合A最早延误航班之后的可用飞机集合ImA能够在m机场维修的机型为I的飞机集合Z当天备用和修复飞机的集合fijX时间对i到j的航班取消航班f的标志,1为取消,0为不取消旅客的失望溢出成本v乘客数w该航班上的平均票价ijpi时刻就绪的飞机执行j时刻的航班及后续航班的延误成本表当天有可用飞机b指派给航班f,0表示没有bfC把航班f指派给备用飞机的成本五、模型建立与求解(一)问题一的分析与处理航班延误是指航班降落时间比计划降落时间(航班时刻表上的时间)延迟30分钟以上或航班取消的情况。日常生活中航班延误不仅影响着乘客的心情,也影响着航空公司的运行效率和服务质量,所以我们一般使用准点率来衡量承运人运输效率和运输质量。准点率,又称正点率、航班正常率,是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间的较为一致的航班数量与全部航班数量的比率。下表由flightstats.com给出的最近一周和一月的航班延误统计数据。1近一周航班延误机场排行榜fyfpfbX表2近一月航班延误机场排行榜由上表数据做柱状图:图一全球各机场一月延误数量柱状图图二全球各机场一周延误数量柱状图由以上两个表格及柱状图分析,上海浦东、上海虹桥、北京国际、杭州萧山、广州白云、深圳宝安机场都在航班延误排行榜前十左右,而成都双流机场的数据排行差别较大。由大数定律,我们有理由怀疑成都双流机场不在延误情况最严重的十个机场内。下面用层次法分析证明成都双流机场不在十个机场之内。1.建立层次结构目标层准则层方案层成都C3每天航班延误率B1香港C1咸阳C2每天的延误损失B3每天的平均延时B2航空公司航班延误状况A2.征求大家意见,构造成对比较矩阵及层次单排序我们可以构造出准则层B1,B2,B3关于目标层A的两两判断矩阵,可得11/242171/41/71ABA此时通过软件matlab计算可得AA-B的最大特征值,一致性指标由此可知我们构造的判断矩阵通过了一致性检验。继续分别计算第三层对第二层的两两比较矩阵:1)第三层对于准则层B1的比较矩阵:11111121311111222231111323331/1/1/BCCCCACCCCCC求出矩阵的最大特征值,以及归一化的最大特征值的特征向量,即得到第三层对准则层B1的排序权重向量2)第三层对于准则层B2的比较矩阵:22211121322221222232221323331/1/1/BCCCCACCCCCC求出矩阵的最大特征值,以及归一化的最大特征值的特征向量,即得到第三层对准则层B1的排序权重向量3)第三层对于准则层B3的比较矩阵:33311121333331222233331323331/1/1/BCCCCACCCCCC求出矩阵的最大特征值,以及归一化的最大特征值的特征向量,即得到第三层对准则层B1的排序权重向量1230.5950.0820.4290.2770.2360.4290.1290.6820.1423.0053.00230.0030.00100.580.580.58计算可知B1,B2,B3通过一致性检验。求解完第三层对第二层所有准则的最大特征值的归一化特征向量后,就可以得到方案层元素关于目标A的合成权重向量为:这样就可以进行综合排序了,在这个模型中,由于第三层对第二层的一致性标准都在控制范围内,所以模型具有整体一致性。下表为各层级组合权值:准则每天航班延误率平均航班延时每天的延误损失总排序权值准则层权值0.31500.60260.0823方案层单排序权值香港0.37950.38150.21620.367228咸阳0.29870.34260.35870.330062成都双流0.32180.27590.42510.30261由上表数据可以得出航班延误排序为:香港咸阳成都双流。由于香港,咸阳机场不在最延误机场的城市行列,所以我们有理由相信程度双流机场延误情况不在前十位。既题目中说法不正确。(二)对于问题二,一般来说,航班的延误主要有以下原因:1、航空公司的运行管理2、流量控制3、恶劣天气影响4、军事活动影响5、机场保障下表给出几种原因导致航班延误的比例:为了更清楚的看出各种原因所占的比重,我们制作出饼状图由上表的数据,我们利用Eviews分析其延误原因之间的相关性。航空自身、流量与天气图三Eviwes关于共线性的运算结果由图表数据可知R^2=0.205796,所以航空公司自身,流量原因与天气原因三者的相关性不显著。认为这三种原因不存在共线性,相互独立。下面用贝叶斯检验哪个因素影响大。1)贝叶斯定理设12,,...nAAA互不相容,并且有1niiA(必然事件),则对于任一事件B,有1()(|)(|)(1,2,...,)()(|)iiinjjjpApBAPABinpApBA其推导过程如下:当另一事件B发生时,事件A的条件概率是P(A|B),由条件概率公式得:又()()(|),(|)()()PABPABPABPBAPBPA(|)()(|)()PABPBPBAPA(|)()(|)()PBAPAPABPB又12,,...nAAA互不相容,由全概率公式1()()(|)njjjPBPApBA,则上式可得:1()(|)(|)(1,2,...,)()(|)iiinjjjpApBAPABinPAPBA该式称为Bayes公式。其意义是:假设导致事件B发生的“原因”有(1,2,...)iAin,他们互不相容。现已知事件B确已经发生了,若要估计它是“原因”所导致的概率,则可用Bayes公式求出,即可从结果分析原因。2)基于贝叶斯网络的机场航班延误因素分析航班延误本身的因素已经十分复杂,由于延误波及而产生的延误,其形成因素将更加复杂。此外,影响因素中还包含有很多不确定因素,这些复杂的函数关系在数学上的量和表述都将很困难的,因而基于历史数据的相关因素统计分析是相对更为可行的方法。基于贝叶斯网络的某机场航班延误分析通过以上对航班延误的分析,并结合贝叶斯网络的特点,以国内某大中型机场为例建立机场航班延误分析预警模型,如图四。通过收集、整理该机场夏季航班2010年7月17日至9月17日的航班运行数据,通过数据分析得到该机场进、离港航班延误率为26.9%,引起航班延误的主要原因为航空公司计划、本站天气、前站天气、旅客、运力调配、前站飞机、航路限制等,其比重如表5-3所示。图四国内某机场航班延误的贝叶斯网络模型表三各因素比重基于对该机场的延误情况收集10000个案例,对该机场的离港航班延误进行分析,其中9000个案例用于学习,1000个案例用于检验模型。其中,进、离港航班时刻表均参照该机场各航空公司航班计划时刻表。符合以下条件之一的航班为不正常航班,判断航班延误的标准为:①在计划时刻公布离站时间后25min后未能正常起飞或发生返航、改航和备降等不正常情况的航班;②在计划时刻公布的到达时间前后20min之内未能落地的航班。根据实际起飞时间与航班计划起飞时间的差值,把离港航班延误程度分为6级,分级标准如表5-4所示。航班延误程度等级延误时间/minⅠ级(0,25]Ⅱ级(25,40]Ⅲ级(40,60]Ⅳ级(60,120]Ⅴ级(120,240]Ⅵ级(240,900]表四分级标准图五贝叶斯网络学习结果结果与分析:利用Netica贝叶斯网络工具软件建模,采用EM算法对9000个案例进行网络学习,学习结果如图5-4所示。由以上学习结果可以看出,该机场主要运营航线为国内干线和国内支线,进港航班集中在10:00—23:00,延误率为39.1%,延误主要原因为飞机晚到、航路限制;离港航班主要集中在8:00—22:00,延误率为25.5%,其主要延误原因为公司计划。延误程度集中在20min至120min,其比重为22.45%。综上所述飞机延误的主要要因素是机场公司自身原因(包括飞机晚到、航路限制及公司计划等)。(三)问题三的模型建立与求解航空公司应对延误策略模型:不正常航班延误调度。关于航班延