2016年河南科技大学选拔赛承诺书我们仔细阅读了数学建模选拔赛的规则.我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。我们知道,抄袭别人的成果是违反选拔规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。我们选择的题号是(从A/B/C/D中选择一项填写):C队员签名:1.刘世磊2.张双亮3.张汝亮日期:年月日2016年河南科技大学数学建模竞赛选拔编号专用页评阅编号(评阅前进行编号):评阅记录(评阅时使用):评阅人评分备注1我国旅游业发展预测问题摘要近年来,随着经济的不断发展,开放程度的不断提高,我国旅游业得到快速发展,旅游逐渐成为人们主要休闲方式之一。旅游收入是衡量旅游业发展的重要指标之一。通过1994年到2014年中国国内旅游的收入与时间的相关数据,做散点图,进行相关关系分析,建立国内旅游收入与时间的非线性回归模型,得到y=c+b^t。预测未来5年2015-2019年的国内旅游收入,分别为30227.73、35366.455、41378.74、48413.13、56643.36(亿元)为优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一y=−3255.321+10.835x1+5.99𝑥3−20.060𝑥4,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。𝑦𝑡=−2910.027+0.302837𝑦𝑡−1+7.566093𝑥1𝑡−14.08207𝑥2𝑡+7.395051𝑥3𝑡关键字:时间序列、逐步回归、多元回归、sas、spss、EViews2一、问题重述近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放以来,特别是进入20世纪90年代以后,中国的国内旅游收入年增长14.4%,远高于同期GDP9.76%的增长率。1994年到2014年中国旅游收入及相关数据如表1所示。为了规划中国未来旅游产业的发展,请根据表1提供的数据,解决以下问题:1.建立我国国内旅游市场收入的回归模型并预测未来5年内我国国内旅游市场收入的情况;2.考虑其它国内旅游市场收入的影响因素,建立我国国内旅游市场收入的模型。(中国统计年鉴2015版自己查找)3二、问题分析问题一针对1994年到2014年中国旅游收入的相关数据,建立国内旅游市场收入的回归模型,先做时间t与旅游收入y的散点图,若发现y与t存在非线性相关关系,进而利用SPSS对y与t做非线性回归模型,得到模型y=c+b^t。利用建立的模型预测未来5年的国内旅游收入。问题二优化所建立的国内旅游市场收入的模型,先对各个因素的样本数据进行相关性分析,发现各个因素之间具有高度相关,于是采用逐步回归的方法利用spss进行建模,得到模型一,在模型一的基础上,我们有考虑时间对各个因素的影响,采用时间按序列分析的方法,利用sas得到各个因素与其滞后项的关系,再利用EViews进行建模得到模型二。得到优化改进后的旅游市场收入模型。三、问题假设1、所给数据都近似符合正太分布的假定2、假设所收集到的数据真实、准确、稳定、科学,没有较大的误差四、符号定义与说明y国内旅游收入t时间y(t)当期国内旅游收入y(t-1)前期国内旅游收入x1(t)当期国内旅游人数x2(t)当期公路里程x3(t)当期农村旅游消费4五、模型的建立与求解第一问模型1、数据预处理:建立时间t与国内旅游收入y的散点图如下图一、国内旅游收入y与时间t的关系图根据散点图可知,国内旅游随时间有较快的增长,因此利用SPSS建立时间t与国内旅游收入y的回归摸型。5统计量F-statistic=834.224,Prob(F-statistic)=0.00000.01,拒绝原假设,说明模型检验显著,因此所建模型可以使用。拟合优度:R-squared=0.989且调整后的AdjustedR-squared=0。977,说明模型具有很高拟合优度,所建模型为很好的非线性模型;参数检验:通过参数检验可知,所有参数(Pr0.05)都非常显著。模型为:y=955.689∗1.17𝑡用模型进行拟合得如下结果:图二、模型的拟合图由图可知,我们所建模型拟合良好,可以进行未来预测。对未来5年的预测结果为:年份预测值201530227.7308201635366.445201741378.7407201848413.1266201956643.35816第二问模型(1)多元线性分析对影响国内旅游收入的五个因素之间的关系分析国内旅游人数𝑥1(百万人次)、城镇居民人均旅游支出𝑥2(元)、农村居民人均旅游支出𝑥3(元)、公路里程𝑥4(万公里)、铁路里程𝑥5(万公里)关系分析利用SPSS软件得到相关系数图相关性X1X2X3X4X5X1Pearson相关性1.862**.939**.906**.986**显著性(双侧).000.000.000.000N2121212121X2Pearson相关性.862**1.867**.910**.896**显著性(双侧).000.000.000.000N2121212121X3Pearson相关性.939**.867**1.827**.948**显著性(双侧).000.000.000.000N2121212121X4Pearson相关性.906**.910**.827**1.901**显著性(双侧).000.000.000.000N2121212121X5Pearson相关性.986**.896**.948**.901**1显著性(双侧).000.000.000.000N2121212121**.在.01水平(双侧)上显著相关。图三、各个因素的相关系数图由上图可知,各个因素之间具有高度的相关性,如果直接用所有数据去建立回归模型的话,易产生因素之间的共线性。因此,我们决定用采用逐步回归的方法建立回归模型。利用SPSS软件得如下结果:7图四、模型一的参数检验由上面图的过程可知,我们最终得到的模型为模型3,再对模型进行F检验结果如下:由上可知模型的拟合优度R=0.998,调整的拟合优度R=0.996,模型的拟合优度较好,且F检验(p0.01),说明模型显著,且各个系数的t检验也显著。因此可以认为模型可用。再对残差进行检验得P-P图8图五、残差的正态性检验图由P-P图知,模型的残差服从正态分布。进一步验证模型可用。因此,最终模型一为:y=−3255.321+10.835x1+5.99𝑥3−20.060𝑥4(2)时间序列分析由模型知,影响国内旅游收入的主要因素为旅游人数、农村旅游消费以及公路里程。因为所给数据为时间序列数据,所以我们又在模型的基础上考虑时间对各个因素之间的影响。因此,我们又利用SAS软件对各个因素进行时间序列分。以国内旅游收入为例:(1)建立时序图:9图六、国内旅游收入的时序图根据时序图可以看出,2004-2014年国内旅游收入数据具有明显的上升趋势,数据为非平稳序列,于是对数据进行一阶差分,得一阶差分时序图如下:图七、国内旅游收入一阶差分时序图根据时序图可以看出,2004-2014年国内旅游收入一阶差分仍具有明显的上升趋势,数据为非平稳序列,于是对数据进行二阶差分,得二阶差分时序图如下:10图八、国内旅游收入二阶差分时序图从二阶差分时序图可以看出,国内旅游收入二阶差分的时序图已经没有明显的上升趋势,呈平稳分布。因此对数据进行单位根检验如图:图九、国内旅游收入二阶差分的单位根检验由单位根检验可知,Rho统计量、Tau统计量和F统计量的概率值Pr都小于0.01,因此可以得出国内旅游收入二阶差分具有平稳性。对国内旅游收入进行纯随机性检验如下:通过白噪声检验,6阶的Chi-square统计量的概率值Pr0.01,因此不能拒绝原假设,但造成这种情况的原因是因为样本数据量太少,因此我们通过时序图判断国内旅游收入不具有随机性,可以对其建立ARIMA模型。利用SAS软得到序列的自相关图和偏自相关图如下:图十、国内旅游收入的自相关图图十一、国内旅游收入的偏自相关图由自相关图和偏自相关图可知,国内旅游收入的偏自相关系数在延迟一阶之后迅速衰减到两倍标准误之内,因此可以建立AR(1)模型。综上可知国内旅游收入与一阶国内旅游收入具有高度的相关性,当年国内旅游收入受到上年国内旅游收入的影响。对其它因素用一样的方法分析得:11图十二、国内旅游人数的自相关图图十三、国内旅游人数的偏自相关图国内旅游人数与一阶国内旅游人数具有高度的相关性,当年国内旅游人数受到上年国内旅游人数的影响。图十四、农村旅游消费的自相关图图十五、农村旅游消费的偏自相关图由自相关图和偏自相关图可知,农村旅游消费的自相关系数和偏自相关系数在一阶及之后都在两倍标准误之内,因此不可以建立AR(p)模型。综上可知农村旅游消费与一阶农村旅游消费不具有高度的相关性,当年农村旅游消费不受到上年农村旅游消费的影响。12图十六、公路里程的自相关图图十七、公路里程的偏自相关图公路里程与一阶公路里程具有高度的相关性,当年公路里程受到上年公路里程的影响。(3)模型建立由以上的分析可知,国内旅游收入、一阶国内旅游收入与国内旅游人数、一阶国内旅游人数、公路里程、一阶公路里程以及农村旅游之间有高度的相关关系,因此可以建立美国内旅游收入、一阶国内旅游收入与国内旅游人数、一阶国内旅游人数、公路里程、一阶公路里程以及农村旅游的线性模型。为了建立线性模型,首先对数据进行正态性检验(P-P图)。文章的开始,我们已经检验过,数据符合正态性。利用Eviews软件,建立模型如下:13模型的F检验:统计量F-statistic=1303.110,Prob(F-statistic)=0.00000.01,拒绝原假设,说明模型检验显著,因此所建模型可以使用。拟合优度:R-squared=0.9984685且调整后的AdjustedR-squared=0。997701,说明模型具有很高拟合优度,所建模型为很好的线性模型;序列相关性检验:Durbin-Watson=1.749331,说明模型不具有序列相关性;参数检验:通过参数检验可知,参数𝑥1𝑡−1、参数𝑥2𝑡−1以及参数𝑥3𝑡(Pr0.05)不显著外,其余参数(Pr0.05)都非常显著。因此,去掉参数𝑥1𝑡−1、参数𝑥2𝑡−1以及参数𝑥3𝑡再进行建模。去掉参数𝑥1𝑡−1,进行建模得如下模型、模型检验及参数估计:14模型的F检验:统计量F-statistic=1508.69,Prob(F-statistic)=0.00000.01,拒绝原假设,说明模型检验显著,因此所建模型可以使用。拟合优度:R-squared=0.99828且调整后的AdjustedR-squared=0.997618,说明模型具有很高拟合优度,所建模型为很好的线性模型;序列相关性检验:Durbin-Watson=1.648502,说明模型不具有序列相关性;参数检验:通过参数检验可知,参数𝑥2𝑡−1和参数𝑥3𝑡(Pr0.05)不显著外,其余参数(Pr0.05)都非常显著。去掉参数𝑥2𝑡−1,进行建模得如下模型、模型检验及参数估计:15模型的F检验:统计量F-statistic=1614.360,Prob(F-statistic)=0.00000.01,拒绝原假设,说明模型检验显著,因此所