房价的影响因素分析及预测模型——基于北京市相关数据的实证研究摘要房地产既是我国国民经济的支柱产业,也是关系重大的民生问题。本文以北京市经济适用房销售价格、北京市生产总值等相关数据为例,分析房价的主要影响因素,建立房价与其影响因素的关系模型对北京市房价进行准确预测,并根据得出的预测结果对房地产发展提出合理性意见:问题一,建立影响房价的指标体系,利用SPSS16.0软件将各指标数据进行折线图描述,将变化偶然性较大的货币供应量删除,建立主成分分析模型提取主成分,将各指标对各主成分的贡献率加权得到每个指标的总贡献率,比较得出影响北京市房价的六项主要指标依次为:居民家庭人均收入,房地产开发投资额,北京市生产总值,经济适用房销售价格,人均住宅建筑面积,新增保障性住房面积。问题二,建立逐步回归模型,根据SPSS16.0软件的运行结果显示,被剔除的前六个变量与问题一得出的六项主要指标一致,证明结论正确。建立多元回归分析模型,由SPSS16.0软件实现得到北京市房价与其主要影响因素的关系模型为:。问题三,建立曲线估计模型,通过SPSS16.0软件拟合得到各指标变量随时间拟合的曲线方程(见表3·1),将预测房价与实际值进行比较,其平均误差仅为5.14%,说明预测效果良好。利用MATLAB7.0软件运行得到各指标及房价在2000至2015年的房价(见表3·6)稳中有升。问题四,根据所得预测结果、北京房地产市场结构、政府相关政策,结合经济学知识,对北京市房地产发展提出合理建议。最后,对所建模型进行了优缺点评价,在模型推广种介绍了这几个模型的广泛应用。关键词:房价预测、影响因素、主成分、线性回归、曲线拟合一、问题重述1.1问题的背景及条件俗话说;“安居才能乐业!”在我国的传统观念中房子就家,不管住别墅还是住瓦房,每一个家庭都必须有自己的住房,因此住房问题本生就是关系国计民生的大问题。同时,随着改革开放以来我国经济的高速发展,人民生活质量得到了极大提高,对住房质量、住房环境、小区配套服务等的要求也随之不断提高。近十年来我国一些城镇的商品房价格上涨过快,过高的房价使城镇却中低收入者无力购买住房,为了社会持续稳定的发展,政府一直出台各种文件,从宏观层面对房地产市场进行调控。但由于各部门配合不协调,加上恶意炒房的炒家操作,房地产的价格在过去的几年时间里快速地上涨,房价成了各种社会矛盾的焦点。近几年来,保障房建设正在加速推进,中共中央政治局常委、国务院副总理李克强在全国保障性安居工程工作会上强调,要认真贯彻落实党中央、国务院的决策部署,大规模实施保障性安居工程,加大投入,完善机制,公平分配,保质保量完成今年开工建设1000万套的任务,努力改善群众住房条件。1.2问题的提出在上述背景条件以及题目给出的提示下,第一步我们需要对物价水平、国内生产总值、国民收入水平、金融政策、税收政策、土地、城市化率、各类保障性住房的投入使用等房地产价格的影响因素进行实证研究,找到影响房价的主要指标。在第一步的基础上,第二步利用所学的数学基础知识,建立房地产价格与包括城镇住房保障规模在内的主要因素或指标之间联系的数学模型。利用第二步所建立的关于房地产价格的数学模型,根据有关政策和规划对未来几年我国或某一地区在不同的保障房建设力度下就房地产价格趋势进行仿真或预测,并根据模型的需要对未来的情况作适当的假设。最后,根据上述建立的数学模型和仿真结果,向相关单位、人士等提出房地产价格相关问题的咨询建议。二、问题分析2.1问题的重要性分析在上文已经提到住房是关系国计民生的大问题,虽然近几年来房地产业对我国各项经济指标的增长做出了巨大贡献,但高速上涨的房价使众多中低收入阶层的住房问题陷入窘境,贫富差距的矛盾日益突出,房价也成为了各种社会问题的焦点,已经威胁我国社会的持续性发展。近段时间以来,从中央到地方的各级人民政府都相继出台了各种法律法规文件对房地产市场进行调控,公租房、廉租房和经济适用房等各类保障性住房也正在加大力度建设之中。利用科学的方法分析得出房价的主要影响因素,建立预测模型预测近期的房价不仅有利于普通百姓更直观地根据市场、政策环境的变化分析房地产的变化,更重要的是,这将有利于政府部门合理地对房地产市场进行调控,使房价更合理、房地产市场的发展更稳健,从而解决民生问题,使老百姓安居乐业。2.2目前有关方面对本问题的研究房地产相关行业以及政府的研究机构从未停止过对房价及相关问题的研究,出现了众多的研究方法。在房价的影响因素分析方面,彭聪【1】、赵丽丽【2】、李晨【3】分别通过回归分析、灰色关联分析、因子分析等方法,选取影响房地产价格的主要指标,说明住宅实际建造成本和实际生产总值对住宅价格有着显著的影响,而人口数和所有者实际资本成本的影响作用则不明显,并提出相应的改善措施和建议。乔志敏【4】用实证分析表明生产成本的波动对房地产价格的波动有较强作用。在确立房地产价格与各主要影响因素之间的联系方面,严焰【5】利用岭回归方法本文采用岭回归方法,以香港市场为样本,构建房价模型。曾俊杰【6】基于回归分析和灰色关联分析做了多目标规划的房地产定价模型。曹瑞【7】利用多项式回归模型讨论了影响房价的主要因素并建立对房价的分析模型。总体来讲,国内学者对我国房价的研究主要从两个方面进行,一是从宏观经济方面的条件及微观经济方面的市场供求原理,来观察可能影响房价涨跌的因素;二是采用特征价格法,即针对组成房地产的各种特征属性,通过微观经济中的消费者效用理论,来分析特征属性的隐含价格对该商品价格的影响。2.3问题的思路分析本题主要是通过确定房价的主要影响因素,找到房价与各主要影响因素的变化关系,建立房价的预测模型,成为房地产市场调控的重要依据。选取具有代表性的样本是科学研究的基本前提,北京是我国的首都,也是第一批保障性住房建设的试点城市,因此本文选取北京的相关数据进行实证研究。问题一:在收集大量数据以及参考相关文献的基础上,确立房价主要影响因素的指标体系,并采用解决主要因素提取问题最广泛、最精确的方法之一的主成分分析方法,通过对载荷矩阵中各指标对所提取主成分的总贡献率的比较,即得到对房价产生影响的各主要指标。问题二:在前人的研究成果中,我们可以发现建立房价与各主要指标之间的关系模型的主要方法是各种回归分析方法,本文采用思路最清晰明了、得到的关系式最精准的逐步回归分析法。通过逐步回归分析,即得到房价与各主要指标的联系,同时将结果与问题一中得到的各主要指标进行比较,可检验得到的主要指标是否一致,从而对提取出的各主要指标进行验证。最后利用多元线性回归方法对房价与各主要影响因素进行拟合,得到房价与保障住房在内的各主要影响因素之间的关系模型。问题三:根据房价与保障性住房在内的各主要影响因素之间的关系模型,以及北京市“十二五”规划中关于保障性住房建设的规划,我们可以利用数学软件对“十二五”期间(即2011—2015年)北京市的房价进行仿真预测。问题四:根据已经得到的模型及仿真结果,加上对房地产相关情况的了解及当前的国内外宏观经济环境等,最后对相关部门、单位及个人提出合理性的建议。三、模型假设(1)假设经济性适用房的销售价格可以代表保障性住房的价格,从而进行本题的研究。(2)假设在本文预测的2011至2015年期间,国家对房地产市场的宏观调控政策不发生重大改变,与现行的政策基本一致。(3)假设在本文预测的2011至2015年期间,不发生重大自然灾害(如08年汶川地震)、金融危机(如08年美国次贷危机引起的世界金融危机)、战争等不可抗拒的、影响房地产市场发展的外力因素。(4)房地产价格受众多因素的影响,受比赛时间所限,假设只考虑本文所研究的11个因素,以外的其他因素对房产价格的影响可暂时忽略。(5)假设本文数据挖掘及处理研究过程中只出现有系统误差,无随机误差。(6)假设本文所研究的各项因素的误差是不相关的。四、符号说明符号意义单位原始指标个数个第i个原始指标北京市房地产价格元第i个主成分个所提取主成分个数个的相关系数矩阵的特征值对应的党委特征向量随机误差五、模型的建立与求解5·1问题一:确定影响房地产价格的主要因素5·1.1主成分分析的基本原理根据题意要求和相应的分析,对于问题一本文采用主成分分析方法。主成分分析法是利用降维的思想,通过研究指标体系的内在结构关系,把多指标转化成少数几个互相独立而且包含原有指标大部分信息(80%—85%以上)综合指标的多元统计方法,本文在提取主成分是要求提取达到90%以上的信息,其优点在于利用该方法所确定的权数是基于数据分析而得到的指标之间的内在结构关系,不受主观因素的影响,而且得到的综合指标(主成分)之间彼此独立,减少信息的交叉,从而使分析评价结果具有客观性和可确定性。主成分分析是对于原先提出的所有变量,通过线性变换建立尽可能少的新变量,使得这些新变量是两两不相关的,且这些新变量在反映数据的信息方面尽可能保持原有变量或数据的信息和特点。数学上的处理就是将原来个指标作线性组合,作为新的综合指标,如果将选取的第一个线性组合即第一个综合指标记为,自然希望尽可能多的反映原来指标的信息,这里的“信息”用的方差来表达,即越大,表示包含的信息越多。因此在所有的线性组合中所选取的应该是方差最大的,故称为第一主成分。如果第一主成分不足以代表原来个指标的信息,再考虑选取即选第二个线性组合,为了有效反映原来信息,已有的信息就不需要出现在中,用数学语言表达就是要求,称为第二主成分,依此类推可以构造出第三,四,···,第个主成分。通过查阅中华人民共和国国家统计局网站【8】、北京市统计信息网【9】,中国知网【10】,我们得到北京市的物价水平、生产总值、收入水平、金融政策、税收政策、土地、城市化率、保障性住房面积、销售价格等统计数据,并在查阅大量相关文献的情况下,得到如表1所示的影响房价的指标体系(见表1·1)。最后本文选取从2001年至2010年期间房价及各指标的统计数据进行实证分析(见附1)。表1·1影响房价的指标体系指标意义单位经济适用房销售价格元北京市生产总值亿元恩格尔系数%居民家庭人均收入元新增保障性住房面积万平方米人均住宅建筑面积平方米CPI城市化率贷款利率房地产开发投资额亿元货币供应量亿元商品房销售价格元本文将所搜集整理的各指标数据按时间进行绘图描述,得到各指标的描述图(如图1·1)图1·1各指标按时间序列拟合曲线图如上图所示,在2000至2010年11年间,由于近几年我国通货膨胀严重,人民币贬值,导致X11货币供应量各年份的丈夫偏差太大,由于无法预料未来一段时间内人民币或发生货币通货膨胀还是通货紧缩以及其变化程度,故将这一因素删除,最后将影响房价的指标确定为表1·1中的前十个指标。5·1·2主成分分析法的数学模型及实证分析结果设有样本容量为的个变量,通过变换将原变量转换成主成分(用表示),主成分是原变量的线性组合,且具有正交特征,即将综合成个变量,可用多项式表示:或矩阵满足,即为正交矩阵,其中为单位阵,且由下列原则决定:(1)与()不相关;(2).主成分分析法步骤如下:(1)假定输入一个决策表,其中为论域,为条件属性集,D为决策属性集。需输出条件属性的主成分。(2)按对原始数据进行标准化处理,使每个属性均值为0,方差为1。在SPSS16.0软件运行下得到描述性统计分析(见表1·2)。表1·2各指标的描述性统计分析DescriptiveStatisticsMeanStd.DeviationN商品房销售价格(元)7551.783284.39122055经济适用房销售价格(元)3110.27500.80122055北京市生产总值(亿元)7625.403400.74822055恩格尔系数(%)37.5541.196122055居民家庭人均收入(元)12445.3616275.811522055人均住宅建筑面积(平方米)24.24215.0043322055CPI1.01527.01984722055城市化率.8146.0293522055贷款利率6.18917.47732722055房地产开发投资额(亿元)153