1五一数学建模竞赛承诺书我们仔细阅读了五一数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其它公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们愿意承担由此引起的一切后果。我们授权五一数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。参赛题号(从A/B/C中选择一项填写):参赛队号:参赛组别(研究生、本科、专科、高中):所属学校(学校全称):参赛队员:队员1姓名:队员2姓名:队员3姓名:联系方式:Email:联系电话:日期:年月日(除本页外不允许出现学校及个人信息)五一数学建模竞赛2题目:煤炭价格预测问题研究关键词:煤炭价格灰色关联分析时间序列逐步回归SPSSMatlab摘要:煤炭作为不可再生能源,是我国最安全、可靠的重要能源之一。煤炭价格的变化往往反映了煤炭市场的变化,能源市场的变化,其不仅影响煤炭市场的供需平衡,也影响煤炭产业结构调整的幅度。科学有效的预测煤炭价格的变话规律,可以使煤炭行业更加兴旺,也能为国家能源市场的宏观调控提供科学依据。本文在对秦皇岛煤炭价格的历史数据分析的基础上,利用灰色关联分析给出影响煤炭价格变化的重要因素,并利用时间序列预测未来的煤炭价格,同时结合逐步回归分析,给出研究的结论,并对煤炭市场给出一些建议。对于问题一要求给出影响煤炭价格的重要因素并排序,进行灰色系统分析,利用灰色关联分析求出煤炭价格与指标之间的两两相关性并排序。对于问题二要求预测未来31天、35周、36个月的煤炭价格,结合煤炭价格折线图数据,发现一定周期性和波动性,为了简化分析,在众多预测方法中选择了时间序列,由于给出的煤炭价格为每周的价格,时间序列无法预测以天为单位的,采用随机模拟,预测未来31天的煤炭价格。对于问题三为了得到精准的预测模型,且考虑变量间的多重共线性问题,采用逐步回归方法,找到一个能描述煤炭价格变化的多元线性回归方程,并以此进行灵敏度分析,得出一些结论。对于问题四可以基于问题三建立的多元线性回归方程,预测未来成本的变化趋势以及影响煤炭价格波动的因子,根据价格波动因子,提出相关的合理意见以减少煤炭价格的波动。3一、问题重述煤炭属于大宗商品,煤炭价格既受国家相关部门的监管,又受国内煤炭市场的影响。除此之外,气候变化、出行方式、能源消耗方式、国际煤炭市场等其他因素也会影响煤炭价格。请完成如下问题。1.请建立数学模型,通过量化分析的方法,给出影响煤炭价格的主要因素(不超过10种),并且以秦皇岛港动力煤价格为例,给出从2019年5月1日至2020年4月30日,影响秦皇岛港动力煤价格的主要因素的排序(按影响程度从大到小排序,不超过10种)。2.请结合秦皇岛港动力煤价格的历史数据(附件1),以及问题1中的影响煤炭价格的主要因素,建立煤炭价格预测模型,分别以天、周、月为单位,预测未来31天、35周、36个月的煤炭价格,并完成表1。3.为了更加准确地预测秦皇岛港动力煤价格,请综合考虑未来各种情况(例如突发事件)引起的煤炭价格影响因素在结构性和重要性方面的变化,建立煤炭价格综合预测模型,并给出模型的预测结果。4.为保障我国未来煤炭市场的平稳发展,请结合问题3的模型,向政府部门提供相关的政策建议。二、问题假设1.假设附件中的数据真实可靠,可以作为分析依据。2.假设秦皇岛港动力煤的月平均价格可以直接视作该月各周其价格的均值。3.假设个别周煤炭平均价格的缺少不会影响整体煤炭平均价格的走势。4.假设问题2中未来煤炭的价格仅受问题1模型中所涉及的因素的影响。三、符号说明符号说明BIC相关系数灰色相关性贝叶斯信息准则滞后算子四、问题分析4.1问题一的分析问题一要求给出影响煤炭价格的重要因素并排序,因此需要搜索影响煤炭价格的指标数据,由于数据较少,我们认为是灰色系统,利用灰色关联分析求出煤炭价格与指标之间的两两相关性并排序。4.2问题二的分析4问题二要求预测未来31天、35周、36个月的煤炭价格,结合煤炭价格折线图数据,发现一定周期性和波动性,为了简化分析,在众多预测方法中选择了时间序列,由于给出的煤炭价格为每周的价格,时间序列无法预测以天为单位的,我们采用随机模拟,预测未来31天的煤炭价格。4.3问题三的分析为了得到精准的预测模型,且考虑变量间的多重共线性问题,采用逐步回归方法,找到一个能描述煤炭价格变化的多元线性回归方程,并以此进行灵敏度分析,得出一些结论。4.4问题四的分析问题四要求给出维持我国煤炭市场平稳发展的建议,基于问题三建立的多元线性回归方程,预测未来成本的变化趋势以及影响煤炭价格波动的因子,根据价格波动因子,提出相关的合理意见以减少煤炭价格的波动。五、问题一模型的建立与求解5.1模型准备5.1.1数据收集我们从网络上收集到2019-5月到2020-3月份煤炭进口量/万吨,煤炭出口量/万吨,全国铁路煤炭发运量/万吨,居民消费者指数价格指数(上月=100),全国煤炭企业库存/万吨,GDP,煤炭加工成本指数,秦皇岛平均最高气温/℃。5.1.2数据预处理鉴于数据收集之繁琐且困难,在保证绝大部分数据真实可信的条件下,我们对某些自变量(煤炭出口量,全国煤炭企业库存,煤炭产量,煤炭进口量)值进行临近线性插值和算术平均处理,以及对因变量煤炭价格进行平均处理,求得每月平均价格。大致数据如下表:表5-12019年5月-2020年3月与煤炭价格相关的各项指标煤炭产量/亿吨煤炭进口量/万吨煤炭出口量/万吨全国铁路煤炭发运量/万吨居民消费者指数价格指数(上月=100)全国煤炭企业库存/万吨GDP煤炭加工成本指数秦皇岛平均最高气温/℃煤炭价格/元2019-53.102747.0031.9020800.00100.005300.0080785.91109.1024.50611.882019-63.302710.0033.2020300.0099.905300.0080658.23105.6025.80597.502019-73.203288.0066.2021200.00100.405250.0081129.66100.3028.00600.0052019-83.203295.0034.1020000.00100.705700.0082200.2098.6028.80586.002019-93.203028.0023.8020000.00100.905750.0083869.8690.9026.90586.502019-103.202569.0034.0021500.00100.906400.0086138.6488.7019.40577.502019-113.402078.0079.2021100.00100.406600.0094611.5984.3010.70554.502019-123.30277.0067.5021500.00100.006800.0093874.7987.003.20552.502020-12.453403.0060.8020500.00101.4017105.0089533.3291.102.30561.252020-22.453403.0064.2016750.00100.8019256.0081587.1691.903.50575.002020-33.402783.0061.0018500.0098.8033726.0070036.3390.3011.10575.005.1.3灰色关联分析介绍灰色关联度分析是对多因素指标统计分析方法,用灰色关联度来描述各个因子之间的强弱、大小和次序。灰色关联度分析法对数据的连续性、规律性、代表性均没有严格要求,能保证量化结果与定性分析结果的一致性。具体流程图如下:5.2模型建立5.2.1分析数列的确定灰色关联度分析的进行需要确定参考序列,反映系统特征的数据列,还需要确分析数列确定数据标准化序列绝对差定义关联系数计算灰色关联度比较并排序6定比较数据序列,是影响系统变化的数据序列。设为母序列(因变量)煤炭价格为,子序列(自变量)依次为5.2.2数据标准化数据标准化处理去量纲,令,其中为各序列的均值。5.2.3序列绝对差对标准化后的参考序列与比较序列进行差值运算并取绝对值,计算得出每列数列的最大差与最小差。数学表达式如下:5.2.4定义关联系数,表示参考序列与比较序列第个序列的关联程度,,数值越大,表示相关性越强,反之,相关性越小。一般地,。5.2.5计算灰色关联度灰色关联度是对灰色关联系数做均值运算,将参考序列与比较序列在各个时刻所体现的关联度数值,转变为两序列间的关联度数值,以代表母序列与子序列之间的灰色关联度,则计算公式表示为:5.3模型求解利用MatlabR2017a平台(代码见附录),我们对母序列与子序列灰色关联分析度进行求解,子序列中各个指标的灰色关联度分别为:表5-2秦皇岛港煤炭价格与各项指标的关联性关联性煤炭产量煤炭进口量煤炭出口量全国铁路煤炭发运量居民消费者指数价格指数全国煤炭企业库存GDP煤炭加工成本指数秦皇岛平均最高气温大小0.93530.86270.75590.95110.97790.65590.93280.96220.6777排序467319528由计算结果可知,从2019年5月1日至2020年4月30日,影响秦皇岛煤炭价7格的主要因素依次排序为经济水平,煤炭生产成本,煤炭产量,季节因素。六、问题二模型的建立与求解6.1模型准备6.1.1数据处理题目中给出了秦皇岛港动力煤价格的共600多组历史数据,由于数据众多,因此我们对秦皇岛港动力煤每周平均价格求平均值,便于后面的计算分析。6.1.2模型转化且对于每天数据预测,查找文献,发现一周内的每天煤价的变化很小,且根据第一问的影响因素发现煤价的波动范围具有很强的随机性。故将每天的数据由每周平均值加上这个波动变化值来代替,这就将每天的数据预测转化为每周的平均值以及波动范围边界预测。对数据进行处理后,发现平均值近似等于最大值和最小值的平均值,波动范围边界为平均值和最大值或者最小值的绝对值,所以决定通过建立ARMA时间序列模型预测每周的最大值,最小值,进而实现对每天煤价的预测。6.1.3时间序列模型简介时间序列模型有四种:自回归模型AR、移动平均模型MA、自回归移动平均模型ARMA、自回归差分移动平均模型ARIMA,而都是ARIMA模型的特殊形式。以下时间序列都是基于ARIMA模型:且即(1)拟合优度评价指标:一般比较两个模型的好坏,我们可以使用平稳的R方或者标准化BIC(BIC准则,它综合考虑了残差大小和自变量的个数,残差越小BIC值越小,自变量个数越多BIC值越大),这两个指标既考虑了拟合的好坏,又考虑了模型的复杂度,R方可用来反映线性模型拟合的好坏,越接近于1拟合的越准确。(2)白噪声序列:若时间序列{𝑥𝑡}满足以下三个条件:𝐸(𝑥𝑡)=𝐸(𝑥𝑡−𝑠)=0𝑉𝑎𝑟(𝑥𝑡)=𝑉𝑎𝑟(𝑥𝑡−𝑠)=𝜎2𝐶𝑜𝑣(𝑥𝑡,𝑥𝑡−𝑠)=0(𝑠≠0)则称{𝑥𝑡}为白噪声序列(3)ACF自相关系数:表示一个平稳序列{𝑥𝑡}中,间隔s期的两个时间点之间的相关系数。它的计算公式为𝜌𝑠=𝑐𝑜𝑣(𝑥𝑡,𝑥𝑡−𝑠)√𝑉𝑎𝑟(𝑥𝑡)√𝑉𝑎𝑟(,𝑥𝑡−𝑠)=𝛾𝑠𝛾0其中,𝛾0=𝐶𝑜𝑣(𝑥𝑡,𝑥𝑡)=𝑉𝑎𝑟(𝑥𝑡)(4)PACF偏自相关系数:用来衡量𝑥𝑡和𝑥𝑡−𝑠在剔除掉所有中间取值的线性关系。8(5)白噪声序列的残差检验:①Q值(杨-博克斯)检验法如果{𝜀𝑡}是白噪声序列,那么𝜌𝑠={1,𝑠=00,𝑠≠0