居民消费价格指数的预测及其结构分析——以贵州省为例贵州民族学院李洪飞、杨小欢、陈蛟目录摘要……………………………………………………………………2一、问题的提出………………………………………………………3二、国内研究现状……………………………………………………3三、模型构建前的准备………………………………………………43.1模型若干假设………………………………………………43.2数据来源说明………………………………………………4四、CPI预测模型构建前得基本分析与处理………………………44.1数据的观察分析……………………………………………54.2模型的识别、建立、优化……………………………………6五、模型的检验………………………………………………………8六、CPI的预测………………………………………………………8七、CPI的聚类分析……………………………………………………97.1对13类具有代表性的商品CPI进行聚类…………………97.2对13类具有代表性的商品CPI进行结构分析……………11八、模型结论及意义…………………………………………………13九、模型的不足和改进………………………………………………14-1-十、参考文献…………………………………………………………15十一、附录……………………………………………………………15摘要CPI是居民消费价格指数(consumerpriceindex)的简称。居民消费价格指数,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。对于CPI的研究,是一个热点。首先,本文基于时间序列,以2002年1月至2011年3月的数据为基础,对数据进行Box-Cox变换,建立SARIMA模型[1],对贵州省2011年4月至10月的CPI做出预测,达到了87.1258%的拟合优度。模型结果显示,贵州省2011年4月至10月的CPI有上升的趋势,在10月份同比增长率达到了6.4421%。因此,要实现贵州省2011年4%的调控目标有较大压力。然后选取13类具有代表性的商品,对它们的CPI做聚类分析[2]。在分析前,为了直观,本文对CPI进行了等级划分,划分标准为:Ⅰ级(90≤CPI≤100),Ⅱ级(100≤CPI≤110),Ⅲ级(110≤CPI≤120),Ⅳ(120≤CPI≤130),Ⅴ级(130≤CPI≤140)。结果显示,在13类商品中,粮食和鲜果总是保持在较高等级。所以对CPI的影响中,粮食和鲜果是导致上涨的主要因素。其次,肉禽及制品、蛋、水产品三类得CPI相对来说也比较高,是导致上涨的次要因素。而13类商品中剩下的商品CPI都比较稳定,价格没有发生多大变化。最后,分阶段(4个月为一阶段)对13类商品的CPI进行聚类分析。发现13类商品中,粮食基本维持在Ⅳ级,变化不大;鲜果CPI变化很大,并保持持续上涨,上涨的速度非常快。肉禽及制品、蛋、水产品的变化相对来说也是比较大的。通过分阶段聚类分析,结果显示:影响CPI的众多商品构成中,构成结构会随着时间的推移有所改变,即13类商品中,影响CPI增长的权重会有所改变。对CPI的预测,其意义在于有利于加强宏观、微观预警机制,针对市场可能-2-出现的情况,相关部门可以依据一定的预测,采取措施进行调控,以实现既定目标。对CPI的聚类分析,表明分析CPI可以从宏观的分析角度转向微观的分析角度。通过这种方法对CPI进行细分,针对不协调点,采取相应措施进行调节。关键词:CPI(居民消费价格指数)SARIMA模型预测等级K值聚类CPI细分■一、问题的提出消费者物价指数(ConsumerPriceIndex),即居民消费价格指数,英文缩写为CPI,是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。它既是监测国民经济运行状况的重要指标,又是市场经济活动与政府制定货币政策的重要参考指标。如果消费者物价指数升幅过大,表明通胀已经成为经济不稳定因素,央行会有紧缩货币政策和财政政策的风险,从而造成经济前景不明朗。(CPI)是一个滞后性的数据,但它往往是市场经济活动与政府货币政策的一个重要参考指标。CPI稳定、就业充分及GDP增长往往是最重要的社会经济目标,同时它与老百姓的生活息息相关,研究CPI变化的特性、规律以及影响因素,具有十分重要的理论和现实意义。因此,正是基于其重要意义,提出如下问题:⑴利用能够收集到的现有数据,对未来一定范围的CPI做出预测,并根据CPI的实际意义,对预测值做相应的分析。⑵CPI是市场的一个综合指标,分析讨论其内部结构,并分析对CPI增长影响较大的是哪些商品。■二、国内研究现状居民消费价格指数(CPI)一直是国内经济专家、学者研究的热点,具有研究历史长、研究方法成熟、研究成果丰富等特点。预测的方法可以分为定性方法和定量方法。定性分析的方法很多,比如赵蔚将商品价格指数和居民消费价格指数作为主要分析对象,在对其1978年以来走势分析的基础上,预测“十一五”时期的变化趋势[3]。冯学敏、黄文慧从阐述海南省居民消费价格指数的变化入手,分-3-析了2005年海南物价的基本走势和物价回落的原因。定量分析的方法又包括时间序列法和神经网络法,其中时间序列法得到了众多研究者的认可,如谢佳丽,杨善朝,梁鑫运用时间序列的几个不同模型,对我国居民消费价格指数的变化规律进行了比较研究。查文中利用ARIMA模型,对中国CPI指数进行了预测,得到很好的预测效果。黄德春、张长征、汤云超则研究CPI与月份之间是否有显著的关系,最后指出,CPI与月份无显著关系[4]。国海证券构建出很好拟合我国CPI定基指数的含有春节因素回归变量的季节时间模型,拟合优度达到75.45%,对样本外数据的预测误差不超过0.51%,具有较好的预测效果。肖宏伟则运用了X—12—ARIMA与TRAMO/SEATS季节调整原理,解决了季节和中国春节因素等问题,对CPI进行预测,也得到了好的效果。而神经网络是最近几年兴起的一种流行的预测方法,郑艳伟,钱乐祥,张红光,彭军等人建立基于BP神经网络的居民消费价格指数进行预测,结果表明模型的预测值与实测值的误差仅为0.91%[5]。而对于分析讨论CPI内部结构及哪些商品对CPI增长有较大影响的这一话题,目前本文作者未发现有人进行研究。■三、模型构建前的准备3.1模型若干假设本文从研究的背景出发,我们提出下列假设:(1)模型建立中,数据的变换是必要的,并且对数据的Box-Cox变换,根据经验直接取对数是合适的。(2)在使用模型对CPI进行预测时,我们假定预测时间内不会发生重大的政策变化以及一些影响经济的突发性事件。(3)我们选择的13类商品具有代表性,它们的变化大体上能够反应整个市场CPI的变化。(4)对4个阶段的研究,以4个月为一阶段的划分是合理的,对研究没有多大影响。(5)为了便于直观,人为的对CPI平均值进行等级划分是合理的。3.2数据的来源说明ⅰ、由于本文是对贵州省2011年3月后的居民消费价格指数[6](CPI)进行预测,因此,本文在建立CPI预测模型时,CPI月度数据选取了贵州省2002年1-4-月至2011年3月的数据,数据来自于贵州省统计外网()(统计资料——西部快讯)和中华人民共和国国家统计局数据库()。ⅱ、对CPI进行聚类分析时,收集的是贵州省2010年1月至2011年4月具有代表性的13类商品的月度居民价格指数(CPI),其数据来源:中华人民共和国国家统计局数据库()。■四、CPI预测模型构建前的基本分析及处理4.1数据的观察与分析4.1.1建立时间序列分析模型;本文采用Box-Jenkins法[7]和计量经济学软件Eviews5.0进行模型识别和拟合。4.1.2Box-Jenkins法是一种精度较高的时间序列短期预测方法,其主要思想是:某些时间序列是依赖于时间T的一族随机变量,构成该时间序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型进行描述。其步骤一般分为四步:Ⅰ检验序列是否属于(弱)平稳时间序列,Ⅱ识别模型的ARMA的阶数p、q的值,建立ARMA(P,q)模型,Ⅲ检验模型,Ⅳ利用模型进行预测。4.1.3本模型样本数据(数据附附录),对数据的初步分析,数据在2008年出现高峰区,我们分析是由于2008年1月贵州凝冻引起的,在2008年凝冻灾害中贵州直接损失348亿元,在凝冻期间,由于受交通的影响,雪灾造成了物价疯长,因此在2008初,CPI有一个高峰。从总体的数据来看,CPI有向上增长的趋势,如果直观地对其差分,则可能给预测带来较大大的误差,为了减少增长趋势,我们下面将引入Box-Cox变换(1964年由Box和Cox提出)。4.1.4在一般的时间序列分析中,非平稳时间序列可以通过有限阶差分化为平稳时间序列进行建模,但是有些不能够通过有限阶差分使其平稳。有许多序列虽然均值平稳但方差非平稳,此时需要考虑利用适当的变换使得方差平稳。为了有效的提高预测精度,可以使用一种常用的数据变换工具——Box-Cox变换。实践证明,Box-Cox变换对许多数据是行之有效的,对因变量的变换可以明显的改善数-5-据的正态性、方差齐次性和对称性。现在假设因变量Y=(nyyyy,,,,321)是一组取值为正的变量,对于Y考虑做如下变换:()1,0ln,0YWYY称为因变量Y的Box-Cox变换。它包含了许多常见变换,诸如对数变换(0),倒数变换(1)和平方根变化(2/1)。在这里根据经验,选择对数变换(即0),变换后的数据记为(X1=log(x))。4.1.5对X1做序列图,我们发现虽然序列的增长趋势有所减缓,但是序列仍然是不平稳的,为了使序列平稳,对其做一阶差分,记差分序列为2X,对2X做ADF检验,检验结果如下:表上表显示,在1%﹑5%﹑10%的显著性水平下拒绝原假设,接受不存在单位根的结论。再结合2X的自相关图和偏自相关图,可以接受2X平稳的结论。但是由于CPI序列的一阶差分的平稳性明显不如二阶差分的平稳性好,所以我们在以下的建模过程中使用二阶差分记为3X。做出3X的自相关图和偏自相关图,我们发现该序列在滞后期为12的整数倍时出现峰值,即存在明显的季节现象,从经济的常识来看,我们也可以看出,居民消费价格指数存在季节现象。因此为了更好的建立模型,我们对序列做季节差分,建立乘积季节模型。记季节差分后的序列为tX,对tX做检验,我们发现tX是平稳的。4.2模型的识别与建立、优化-6-4.2.1做出序列tX的自相关图和偏自相关图(附附录),从自相关图和偏自相关分析可知,序列自相关系数在K=1时明显不为零,偏自相关系数在K=1,2,3,明显不为零,之后基本趋于零,从其中可以看出,数据明显存在季节因素,其周期为12。由于上述判断比较粗糙,有很大的主观性。为精确起见,我们同时建立多个模型,所以可能拟合的模型是:SARIMA(1,2,0)(1,1,1)12,SARIMA(3,2,0)(1,1,1)12,SARIMA(4,2,0)(1,1,1)12,SARIMA(5,2,0)(1,1,1)12,SARIMA(6,2,0)(1,1,1)12,SARIMA(3,2,,1)(1,1,1)12,SARIMA(,6,2,1)(1,1,1)12,SARIMA(3,2,0)(1,1,1)12,SARIMA(0,2,1)(2,1,1)12,SARIMA(3,2,0)(2,1,1)12SARIMA(4,2,0)(2,1,1)12等4.2.2.模型的优化在软件中输入d(log(x),1,0)car(1),我们发现均值C=-0.000244,伴随概率p=0.8535,远远大于0.05,不显著,即C的取值可以取0。C没通过检验,这项表明CPI是一个零均值的平稳序列,所以在以后的建模中均值这项