多元线性回归模型在房价走势分析与预测中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

科技创业刊PIONEERINGWITHSCIENCESTECHNOLOGYMONTHLY多元线性回归模型在房价走势分析与预测中的应用钟丽燕高淑兰(百色学院数统学院广西百色533000)摘要:文章通过对广西南宁市房价及其影响因素的历史数据进行收集和整理,分析南宁市的人均地区生产总值、商品房销售面积、房地产开发投资额、财政收入、城镇居民人均可支配收入、城镇人口等因素对房价的影响。利用逐步回归的方法建立关于房价走势的分析与预测的多元线性回归模型,并对模型进行相应的检验及分析。关键词:多元线性回归;房价预测;房价走势中图分类号:F293.3文献标识码:Ad〇i:10.3969/j.issn.l665-2272.2017.09.0371影响房价的因素分析对影响房价的因素进行分析,是做好房价走势分析与预测工作的基础和前提。由前人的研究论证,可知影响房价的因素主要有:经济因素、社会因素、行政与政治因素、人口因素、房地产内在因素及周边环境因素等。其中,经济因素包括经济发展水平、居民收入水平、物价、利率、汇率等;人口因素包括人口数量、人口素质、人口结构等;行政与政治因素包括财政收入与支出、金融、土地、住房、城市规划与建设等。本文以广西南宁市为例,引入人均地区生产总值、商品房销售面积、房地产开发投资额、财政收入、城镇居民人均可支配收入、城镇人口等6个影响因素,并通过分析这些因子与房价的关系来确定预测方法及预测模型。2多元线性回归模型的基本原理2.1多元回归模型与回归方程多元回归模型是描述因变量赠如何依赖于自变量曾1,曾圆,曾3…曾噪和误差项着的方程,它的一'般形式为:赠越茁0+茁1曾1+茁2曾2+茁3曾3垣---垣茁噪曾噪+着(1)其中,茁。,茁1,茁2,茁3,…茁噪是模型的参数,着为误差项,误差项反映了除曾1,曾2,曾3…曾噪与赠的线性关系外的随机因素对赠的影响,表示的是不能由X^XhXji…曾噪与赠的线性关系所解释的变异性。一般地,对误差项着有三个假定:①着是期望值为的随机变量,即E(s)=0;②对的方差滓2都相同;③服从正态分布,且相互独立,即着耀-*晕(0,滓2)。由模型的假定,可得多元回归方程:E(y)=茁。+茁1曾1+茁圆曾2+茁3曾3+…+茁噪曾噪(2)2.2估计的多元回归方程回归方程中的参数茁0,茁1,茁2,茁3,…茁噪是未知的,需要要用样本数据来估计。当用样本统计量茁〇,茁1,茁2,茁3,…茁噪去估计回归方程中的参数茁0,茁1,茁圆,茁3,…茁噪时,便得到了估计的多元回归方程:赠越茁。+茁1X1+茁2X2+茁3X3+---+茁kXk(3)其中,m茁3,…茁噪是参数茁。,茁1,茁2,茁3,…茁噪的估计值,赠是因变量赠的估计值.2.3参数的最小二乘估计回归方程中的茁0,茁1,茁2,茁3,…茁噪可根据最小二乘法求得,也即使残差平方和匝越移(yi_^)2=移(y「茁『茁^「…-茁kxkr最小。从而得到求解茁。,茁1,茁2,茁3,…茁噪的标准方程组,并求出其解(此过程可借助计算机实现)。2.4多元线性回归模型的检验由样本数据所建立的回归方程,需要通过方程的拟合优度、方程线性关系的显著性、系数的显著性等统计量的检验后,才可以可用于解释、分析实际问题。2.4.1回归方程的拟合优度检验多重判定系数R2(R2=回归平方和=HR)是度量*基金项目:广西高校中青年教师基础能力提升项目(项目编号:KY2016LX348)收稿日期:2017-03-0594科技创业月刊2017年第9期多元线性回归模型在房价走势分析与预测中的应用管理论评多元回归方程拟合程度的一个统计量。砸圆月接近1,说明拟合优度越好,能用自变量解释因变量的线性部分所占比例越大。然而,当向模型中增加加一个自变量时,即使该自变量在统计上不显著,也会使砸圆变大。因此,为了避免因为增加自变量而高估R2,通常用调整的多重判定系数砸圆(R:=1-(1-硭)(-^))度量n-k-1多元回归方程的拟合优表i南宁市商品房銷售平均价格的影响因素yX1X2X3X4X5X6年份商品房人均地区商品房房地产开发财政收入城镇居民人均城镇人口平均价格(元/米)生产总值(元)销售面积(万平米)投资额(亿元)(亿元)可支配收入(元)(万人)2006287313071456.02139.07120.3610193254.862007340415759628.84187.46150.8411877259.772008394619142484.91199.3191.1714446347.5420094557.221829731.7226.73231.3716254354.022010514426330666.48317.5300.8818032350.5220115152.531173717.73392.42363.5220005367.3720126002.937016629.01362.7342222561382.2120136959.438994702.6416.37473.6624817395.2420146627.145735802.57551.82526.5927075403.720156645.9490661000.73657.19572.4829106414.32表2南宁市商品房销售平均价格与影响因素的线性相关系数人均地区生产总值商品房销售面积房地产开发投资额财政收入城镇居民人均可支配收入城镇人口商品房均价0.9560.7320.8860.9680.9710.926度。同样,R圆越接近于1,说明方程的拟合优度越好。2.4.2线性关系显著性检验(F检验)线性关系显著性检验是检验因变量赠与噪个自变量之间的线性关系是否显著。检验步骤为,先提出假设H。:茁1=茁圆=噎茁噪=0,匀1:茁1=茁圆=…茁噪至少一个不为;然后计算检验的统计量F(、~F(k,n-k-1)),k为sse/(n-k-1)分子自由度且等于自变量个数,n-k-1为分母自由度,且为样本的个数曰最后做出决策,对给定的显著性水平琢,查F分布表得云琢的值,若云跃云琢,则拒绝原假设,若FFa,则不拒绝原假设。也可根据计算机输出结果,直接用责值做出决策:若孕琢,则拒绝原假设,若若Pa,则不拒绝原假设。2.4.3回归系数显著性检验(贼检验)回归系数的显著性检验步骤为,先提出假设对茁蚤(i=1,2…k),有匀园:茁蚤=0,匀:茁屹0曰然后计算检验的统计量t(tl=lt(n-k-1));最后做出决策,给定显著sft性水平琢,查t分布表得贼琢〃的值,若ltlta/2,则拒绝原假设,若ltl〇_,则不拒绝原假设。3多元线性回归模型在分析与预测房价走势中的应用3.1模型的建立根据上文对影响房价因素的分析,从广西统计局官网上收集了2006年至2015年的相关数据(见表1)。根据表1可得广西南宁市的商品房价及其影响因素的线性相关系数矩阵(见表2)。由表2可知商品房价与所列的6个影响因素的线性关系都很强,因此,考虑建立多元线性回归模型来分析与估计该地区的房价走势。以南宁市的商品房的平均销售价格为因变量(赠),以其人均地区生产总值(Xi)、商品房销售面积(曾2)尧房地产开发投资额(曾3)、财政收入(曾4)、城镇居民人均可支配收入(曾缘)、城镇人口(曾远)为自变量建立如下的最初多元线性回归模型:赠=茁0+茁!X,+茁2曾2+茁3曾3+茁4曾4+茁5曾5+茁6曾6+£(4)利用泽责泽泽统计软件,根据逐步回归的方法,可得到以下输出结果(见表3~表6):根据所输出的结果,可得最后的预测模型为:赠=27.263+0.373x5-6.235x3(5)3.2模型的分析与检验由表4得,最终模型(模型2)调整的多重判定系数方为0.975很接近于1,可认为模型的拟合优度很好。取显著性水平琢=0.05,查F分布表得Fa=0.05(2,7)5.786,查t分布表得ta/2(10-3)=2.3646。对照表5可知F值远远大于Fa=0.05(2,7)5.786,所以方程的线性关表3变量的进入和移出标准模型已输入变量已除去变量方法1城镇居民人均可.步进(准则:F-to-enter的概率=.050,2支配收入(元).F-to-remove的概率=.100)。房地产开发投资步进(准则:F-to-ent(.,r的概率=.050,额(亿元)F-to-remove的概率=.100)。a.因变量:商品房平均价格(元/米)表4两个模型的主要统计量模型RR平方调整后的R平方标准估算的错误Durbin-Watson(U)1.971a.943.936361.7952.4122.990b.980.975228.183a.预测变量:(常量),城镇居民人均可支配收入(元)1.预测变量:(常量),城镇居民人均可支配收入(元),房地产开发投资额(亿元)c.因变量:商品房平均价格(元/米)PIONEERINGWITHSCIENCE&TECHNOLOGYMONTHLYNO.9201795PIONEERINGWITHSCIENCESTECHNOLOGYMONTHLY科技创业刊多元线性回归模型在房价走势分析与预测中的应用表5两个模型的主方差分析表模型回归平方和ANOVAa自由度均方F显著性1残差17404520.826117404520.826132.965.000b总计1047167.6278130895.953回归18451688.45392残差18087214.61629043607.308173.689.000c总计364473.837752067.69118451688.4539a.因变量:商品房平均价格(兀/米)b.预测变量院渊常量),城镇居民人均可支配收入(元)c.预测变量:(常量),城镇居民人均可支配收入(元),房地产开发投资额(亿元冤表6模型参数的估计和检验模型非标准化系数B标准错误标准系数贝塔t显著性1(常量)918.394382.8402.399.043城镇居民人均可支配收入(元).217.019.97111.531.0002(常量)27.263344.770.079.939城镇居民人均可支配收入(元).373.0451.6738.327.000房地产开发投资额(亿元)-6.2351.722-.727-3.621.008a.因变量:商品房平均价格(元/米)系显著;对照表6可知,两个回归系数的贼统计量的绝对值均大于2.3646,均通过检验,且责值均小于0.05也通过检验。由表6中模型(1)可发现:城镇居民人均可支配收入每增加1元,商品房销售均价增加0.373元;房地产投资额没增加1亿元,商品房销售均价减少6.235元,解释合理可靠。3.3南宁市商品房平均售价的预测分析根据得到的多元线性回归方程(1),对南宁市2006年至2015年的商品房平均售价进行预测,并将预测值与实际值对比,如表7所示。由表7可得,利用所得的多元线性回归方程估计的南宁市商品房平均售价实际值与预测值的平均相对误差为3.41%,精度较高,可用于该地区未来年份的商品房销售均价的预测。4结语文章以多元线性回归模型的分析为基础,选择与商品房销售均价有显著影响的因素作为解释的自变量,用逐步回归的方法,建立关于商品房销售均价的最优多元线性回归模型。通过检验分析证实所建的模型是合理有效的,能够为当地有关部门的相关决策提供科学的参考依据。参考文献唐小飞,刘伯强,王春国.我国房地产行业发展趋势影响因素研究[J].宏观经济研究,2014(12)柳冬,王雯珺,谢海滨,陆凤彬.我国房地产价格影响要素分析与趋势预测[J].管理评论,2010(5)关海玲.北京市房地产价格波动及其影响因素研究[J].价格理论与实践,2015(12)(责任编辑梁工)表7南宁市商品房平均售价的实际值与预测值的对比年份2006200720082009201020112012201320142015实际值2873340439464557514451526003695966276646预测值2962.153288.574172.994676.344773.595042.396180.

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功