1摘要对于问题一,建立了回归分析模型,用以验证国内统计标准的合理性。基于国内外航班延误的统计标准不同,由于flightstats给出的的是国际主要大型机场的排名,通过收集2014年国内十大航空公司部分月份的航班延误时间,然后进行数据统计与整理,对收集到的十个机场部分月份的指定天数的航班延误时间进行统计,进而求指定天数十个机场航班延误时间的平均值,判断得知flight的统计标准是不合理的。对于问题二,建立层次分析模型,从中分析得出导致航班延误的最主要因素。得出导致航班延误的主要因素权重排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、以及机场保障,即导致航班延误的最主要因素是航空公司的运行管理。对于问题三,建立时间序列模型,利用一次指数平滑法建立预测模型,然后对预测的航班延误时间峰值进行人为调控。建立指数平滑模型之后进行模型评估,进而求出2.0是合适的,最后对航班延误时间进行预测,分析曲线走势,并与具体的航班延误时间进行对比分析,讨论模型的效用性。本文综合利用回归分析模型、基于层次分析法的综合评价,使用相关软件,对航班延误问题进行了多角度的分析。并给出了航班延误的时间序列模型,对航班延误作出了理论预测,且对模型的适用范围做出了推广,最后给出了模型的优缺点和改进方案,在实际应用中有较大的参考价值。关键词:回归分析模型;层次分析法;时间序列模型;指数平滑法2一、问题重述随着我国民航运输业的快速发展,我国民航业正在经历美国等西方发达国家在上个世纪七十年代放松航空管制后航空业务量急剧膨胀,导致机场和空域拥堵严重、航班延误快速增长的局面。2015年3月21日,香港《南华早报》报道,据总部设在美国的空中旅行数据提供商flightstats(以下简称flight)介绍,在全球61个最大机场中,中国机场及航空公司的准点离港表现可谓全球最差,准点离港表现最差的7个机场均位于中国内地,其中上海虹桥机场、浦东机场和杭州萧山机场分别以37.17%、37.26%和37.74%的准点率排名垫底。此次调查中,深圳宝安机场、广州白云机场、重庆机场和北京首都国际机场也在表现最差的7个机场之列。在全球61个特大机场中,日本东京羽田机场表现最佳,准点率达89.76%。在航空数据网调查的全球各地374个大小不同的机场中,日本大阪伊丹机场表现最佳,准点率高达94.56%。请自行收集数据并建立模型解决以下问题:1、关于上述flightstats提供的结论是否正确?2、我国航班延误的主要原因是什么?3、针对我国航班延误的现状,提出一些改进措施。二、问题分析首先,flight给出的是国际主要大型机场的航班延误时间排名,我们在本问题在也只讨论国内大型机场的航班延误,以2014年给出的国内十大机场为准,具体机场信息见附录4。另外,我们调查发现国内大型机场的航班到港基本不存在延误,因而我们在问题中只研究航班的离港延误时间,下面给出问题分析。32.1问题一的分析:关于flight给出的全球61个最大机场中准点率排名,我们在flight官网找到了2014年全球主要最大机场航班延误排名,见下表:表一:2014年全球主要最大机场航班延误部分排名On-timeRankAirportcodeFlightsSeatsTrackedComp.FactorOn-time54SVO1.15*1051.82*10777.22%76.62%54.20%55PEK2.85*1055.72*10797.18%95.34%52.64%56CKG1.17*1051.84*10790.45%89.64%52.19%57CAN1.99*1053.41*10795.62%93.93%49.56%58SZX1.34*1052.31*10796.22%93.53%49.42%59PVG1.82*1053.45*10796.25%94.11%37.26%60SHA1.30*1052.45*10797.48%93.96%37.17%61HGH1.00*1051.60*10794.58%93.16%36.74%注:原始数据见附录二首先这个排名是flight公司根据航班延误国际标准来统计作出的排名,但是由于每个国家的国情不同,发展阶段不一致,我们中国也有自己的民航航班正常统计办法(以下简称统计办法),根据中国民航总局发布的《民航航班正常统计办法》[1],对于枢纽机场,如在北京首都国际机场、上海浦东国际机场、广州白云国际机场起飞的航班,在公布的计划离港时间后30分钟内起飞且没有发生不正常情况的航班为正常航班;对于在上海虹桥国际机场和深圳宝安国际机场起飞的航班,这个时间规定是25分钟;对于在成都双流国际机场和昆明巫家坝机场起飞的航班,这个时间规定是20分钟。由于国内外的统计标准不同,我们有理由怀疑flight给出的排名的真实性。因而我们只需要说明国内统计办法的合理性,并大致得出其标准,同国际标准对比说明问题所在即可。毋庸置疑的是,国际航班延误统计标准和中国的民航航班延误统计办法都有其理论依据,肯定不是随便定义的,我们试图从航班延误时间4的角度建立回归分析模型,因此数据预处理的重点在于从现有航班信息中统计出不同时段的离港航班延误时间。我们以北京首都国际机场为首的2014年国内十大机场的航班进离港信息表为原始数据,并在fight官网收集到了按时间顺序记录的离港航班的计划起降时间,实际起降时间,根据这些信息我们计算出了整点时间每个航班延误的具体时间,进而对这些延误时间作为回归分析的数据,建立一元线性回归分析模型。我们从收集的数据出发,确定自变量和因变量之间的定量关系式,即iiXiy,大致估计出国内大型机场延误时间的上下界,并计算出均值,同国际标准进行比较,最后说明国内大型机场航班延误统计标准的合理性。2.2问题二的分析据中新社2014年3月27日报道,航班延误的因素复杂多元,具体原因及其百分比是:航空公司运行管理占42.3%,流量控制占26.1%,恶劣天气影响占20.9%,军事活动影响占7%,机场保障占3.7%。基于我们查找到的航班延误的原因,欲找出导致航班延误的最主要因素,属于决策模型问题,由于层次分析具有系统性的分析方法,简洁实用的决策理论,以及所需定量数据信息较少的特性,我们的做法是建立层次分析模型,并依次建立层次结构模型,构造成对比较阵,计算权向量并做一致性检验,计算组合权向量并做组合一致性检验,最后利用几何平均法,算术平均法,特征向量法,最小二乘法分别求得的总权重,综合分析得出导致航班延的最主要因素。52.3问题三的分析关于航班延误问题的解决办法,现在已经有很多政策性的方案,如预订机票时使用民航资源网数据分析中心的“航线运力数据分析系统”提前查询航线航班历史准点率信息,尽量选择预订历史准点率较高的航班机票。我们的做法是建立航班延误预测模型。查找文献我们发现,MuellerR在2003年发表的“飞行器进离港延误特征分析”[2]一文中分析了美国交通流量大和航班延误显著的10个主要枢纽机场的离港、航路和到达数据,其目的在于改善延误预测,分别用正态分布和泊松分布建模,得到飞机延误时间的概率密度函数,根据原始数据计算均值和标准差,用最小二乘法改善均值和标准差,以减少模型与实际分布之间的误差,研究表明泊松分布能较好的建模离港延误,而正态分布则对建模航路和到达延误效果理想;然而,这种进离港延误的总体概率分布模型对于短期或单航班的进离港延误预测来说并没有实际意义。徐涛等人在2009年发表的“基于贝叶斯网络的航班延误与波及分析模型”[3]一文中,采用贝叶斯网络对航班进离港事件进行分析和建模,构造了一个航班计划网络;利用贝叶斯原理,对网络中的节点进行延误预测,并能对可能发生延误的节点进行延误波及影响的分析,为相关部门提供参考,以采取措施避免或减小延误影响。问题回到怎么解决航班延误问题,我们的想法是利用历史数据构建一个航班延误时间的预测模型,我们利用一次指数平滑法,对未来数天的航班延误时间作出大致预测,然后针对航班延误的峰值时间,及时进行政策方案调控(见附录七),以及时解决延误问题。最后我们观察了北京首都国际机场2015年5月4日的航班延误实时数据,建立预测评估模型,与我们得到的预测数据进行对比,说明模型的可靠性。6三、模型假设1、合理性假设:假设问题中影响数据拟合的误差是极小的。2、排他性假设:假设航班延误只与导致航班延误的主要因素有关,不考虑其他因素对航班延误的影响。3、准确性假设:假设我们收集的数据是真实可靠的,可以根据航班延误的时间得到相应的机场航班延误信息。四、符号说明与名词解释4.1符号说明序号符号符号说明123456789W权重向量CI一致性指标RI一致性比例iT航班离港的花费时间1W流量控制影响的权重2W军事活动影响的权重3W航空公司运行管理的权重4W恶劣天气影响的权重5W机场保障影响的权重注:未列出的符号及重复的符号以出现处为准。4.2名称解释1、准点率:又称正点率、航班正常率,是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间的较为一致的航班数量即正常航班与全部航班数量的比率。2、准点:如果一个航班在计划起飞时间后30分钟内完成起飞(机轮离地),即认为该航班准点放行。3、略晚点:如果一个航班在计划起飞时间后30-45分钟内完成起飞,即认为该航班略晚点放行。74、较晚点:如果一个航班在计划起飞时间后45-60分钟内完成起飞,即认为该航班较晚点放行。5、严重晚点:如果一个航班在计划起飞时间后60分钟以后完成起飞,即认为该航班严重晚点。6、流量控制:流量控制是指通过限制单位时间内进入某空中交通管制节点的航空器的数量,来维持安全的空中交通流。五、模型的建立与求解5.1问题一的模型建立与求解5.1.1数据预处理由于flight给出的是全球主要最大机场的航班统计排名,我们在数据收集时针对中国十大机场,具体收集的数据方式如下,2014年12个月中国十大机场,每一个月抽取6号、12号、18号、24号、30号(二月以28号为准),记为6M、12M、18M、24M、30M,从这五天再抽取0-24时每一个整点(若整点没有航班,以最近的航班为准)的航班离(到)港的花费时间,记为iT,然后计算每一天的平均值,具体结果保留两位小数。我们具体整理了2014年2、5、6、8、9、12月的国内十大机场航班离港延误平均时间如下表所示:表二:2014年2月国内十大机场航班离港延误数据统计简称/时间2月6号2月12号2月18号2月24号2月28号PEK18.8014.3818.3319.0921.75CAN15.2513.8820.5016.7518.38PVG28.1325.3835.8024.4531.25SHA23.5026.7527.5030.2528.50CTU20.8018.7523.2521.5022.00SZX24.8022.7523.3324.5021.888KMG26.7524.5025.3326.3325.11CKG26.2325.6024.8025.5027.38XIY20.0019.5019.3821.5021.33HGH20.3322.0523.1521.5021.88平均值22.4621.3524.1423.1423.94我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(1.2,22.46),(1.4,21.35),(1.6,23.14),(1.8,23.14),(2.0,23.94)。表三:2014年5月国内十大机场航班离港延误数据统计简称/时间5月6号5月12号5月18号5月24号5月28号PEK19.8815.5019.8020.5021.88CAN16.7514.5020.0017.7519.50PVG28.2526.3835.8026.5030.75SHA24.5025.7526.3330.8027.75CTU21.8019.5025.0020.7523.50SZX25.5021.0024.5024.0022.80KMG25.0023.45