葡萄酒价格影响因素分析一、研究背景随着中国经济的快速发展们生活水平的提高,越来越多的人追求生活的质量,随着人们消费观念的转变,葡萄酒在我国的销量快速增长,成为拉动国际葡萄酒增长的新的市场,但由于葡萄酒一直很少关注中低端市场,我们作为大学生,最求时尚,消费理念开放,我们迫切需要了解葡萄酒市场。本报告中我们从波尔多葡萄酒行业协会收集了葡萄酒价格和生长期间的降雨量、气温、酿制年份,以波尔多葡萄价格为主要研究对象,探究葡萄酒价格的主要影响因素,并探究葡萄酒价格和其影响因素存在着什么联系。其中Y为波尔多葡萄酒的价格与1961年葡萄酒价格之比的自然对数,X1为收获季节的降雨量;X2为收获前一年冬季的降雨量;X3为种植季节的平均温度;X4为酿制年份到1989年的年数。具体数据表一所示:表一:葡萄酒的价格指数、降雨量、温度与酿制年份YX1X2X3X4YX1X2X3X4-160016017.1231-0.758198616.5317-0.456908016.7330-1.6571411816.2316-0.6143018015.3829-2.2561029216.215-0.8150213017.1528-2.1557524416.5514-1.1244014015.6527-0.916228916.6713-1.5142011016.1326-1.355111216.7712-1.7258218716.4225-2.2953615814.9811-0.4248518717.4824-1.8637612317.0710-1.9776329016.4223-2.257418416.3908303817.3322-1.257217116.958-1.116975216.321-1.3741824717.657-1.7860815515.7220-2.248218715.586-1.184029617.2719-1.317635115.825-2.2460226715.3718-1.5471712216.174二、描述性分析表二:葡萄酒描述性分析结果DescriptiveStatisticsNRangeMinimumMaximumMeanStd.DeviationVariance葡萄酒价格指数282.29-2.29.00-1.3907.63511.403收获季节降雨量28454.00376.00830.00597.1071134.5211918095.951前一年冬季降雨量28254.0038.00292.00148.428670.628104988.328温度282.6714.9817.6516.4264.69091.477酿制年份2827.004.0031.0017.50008.2259867.667酿制时间2827.001958.001985.001971.50008.2259867.667ValidN(listwise)28由表二可知我们的数据属于年度数据,酿酒时间从1958年到1985年,该品种的葡萄酒的年份为五年到三十一年,收获季节平均降雨量和前一年冬季平均降雨量分别为134.52119毫米、70.62810毫米,葡萄酒价格指数从-2.29到0不等。表三:各解释变量与被解释变量散点图从上图我们可以看出,各解释变量lnX与被解释变量Y之间存在一定的线性关系,因此我们可以考虑建立线性回归模型。三、实证分析本研究主要采用多元线性回归的方法,探究葡萄酒价格的影响因素,建立多元线性模型,并对模型进行检验。1、模型建立设变量y与一般变量X1,X2,X3,X4线性模型为:Y=0+1X1+2X2+3X3+4X4+其中0是回归常数,1,…4为回归系数,y为被解释变量(因变量),X1,X2,X3,X4为解释变量(自变量),为随机误差项,显著性水平a=0.05.2、拟合优度检验表四:多元回归分析结果(一)ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.826a.682.627.388032.263a.Predictors:(Constant),前一年冬季降雨量,酿制年份,温度,收获季节降雨量b.DependentVariable:葡萄酒价格指数依照表四进行拟合优度检验。由于此时多元回归分析,方程有多个解释变量,因此参考调整后的判定系数。由于R2=0.627〉0.5,说明被解释变量能被该模型解释。3、回归方程的显著性检验(F检验)表五:多元回归分析(二)ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression7.42841.85712.333.000aResidual3.46323.151Total10.89127a.Predictors:(Constant),前一年冬季降雨量,酿制年份,温度,收获季节降雨量b.DependentVariable:葡萄酒价格指数此表进行回归方程显著性检验。由表可知F检验的观测只为12.333,对应的概率p值近似为噢。小于显著性水平0.05,应拒绝回归方程显著性检验零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系显著,可建立线性模型。4、回归系数显著性检验(t检验)表六:多元回归分析结果(三)CoefficientsaModel1(Constant)温度酿制年份收获季节降雨量前一年冬季降雨量UnstandardizedCoefficientsB-8.002.394.035.000-.004Std.Error1.953.111.009.001.001StandardizedCoefficientsBeta.429.458.056-.478t-4.0983.5623.821.441-3.867Sig..000.002.001.663.001CorrelationsZero-order.497.480.036-.517Partial.596.623.092-.628Part.419.449.052-.455CollinearityStatisticsTolerance.955.961.861.906VIF1.0471.0401.1621.104由表六可知,除了收获季节降雨量t检验的概率p值大于显著性水平,其他变量均小于显著性水平,说明该模型存在问题,应重新建立模型。5、多重共线性诊断由表六可知该模型的容忍的均为0.9左右,接近于1,说明模型的多重共线性很弱;又各个变量方差膨胀因子均小于10,说明各解释变量间不存在多重共线性6、残差分析图一:多元回归分析的残差累计概率图表七:标准化残差的非参数检验结果One-SampleKolmogorov-SmirnovTestStandardizedResidualN28NormalParametersa,bMean.0000000Std.Deviation.92295821MostExtremeDifferencesAbsolute.115Positive.115Negative-.111Kolmogorov-SmirnovZ.609Asymp.Sig.(2-tailed).852a.TestdistributionisNormal.b.Calculatedfromdata.图一中:数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验(表七)概率p值为0.852大于显著性水平,表明标准化参禅与标准正态分布不存在显著差异,可以认为残差满足线性模型的前提要求。图二:多元回归分析的残差图图二中,随着标准化预测值的变化,残差点在0线周围随机分布,方差并没有明显的增大或减小的趋势,所以可以为模型没有明显的异方差。另外通过观察数据窗口的库克距离(表八),库克距离均小于1,认为没有异常值表八:库克距离0.600890.085420.201620.054880.02040.0930.054040.032140.075550.031170.039790.00040.0350.020540.125650.011870.020310.012350.0480.0040.006160.000140.002460.015010.001650.01240.0050.000157、自相关检验表九:DW检验结果ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.826a.682.627.388032.263a.Predictors:(Constant),收获季节降雨量,温度,酿制时间,前一年冬季降雨量b.DependentVariable:葡萄酒价格指数由图可知,5%显著水平下,4k,查DW统计表可知,dL=1.104,dU=1.747,模型中DW=2.26294-dU=2.253,在不确定区域,不能拒绝有负自相关。8、模型优化若剔除收获季节的降雨量变量作回归,得到表十:新模型回归结果(一)ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.824a.679.639.381461.562a.Predictors:(Constant),酿制年份,前一年冬季降雨量,温度b.DependentVariable:葡萄酒价格指数表十一:新模型回归结果(二)CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)61.29217.9313.418.002酿制时间-.035.009-.449-3.867.001前一年冬季降雨量-.004.001-.494-4.262.000温度.385.107.4193.601.0015%显著水平下,3k,查DW统计表可知,dL=1.181,dU=1.650,模型中dU=1.650DW=2.18114-dU=2.350,表明不存在自相关。其他各个解释变量均显著。显然此模型效果更好。四、研究结论由以上分析可知,最终模型为:Y=-0.04*X2+0.385*X3+0.035*X4+61.292对系数估计值得解释如下:在其他变量保持不变的情况下,如果去一年冬季降雨量每增加1%,则葡萄糖价格指数下降0.04%;如果温度每增加1%,葡萄糖价格指数上升0.385%;如果酿制年份每增加1%,葡萄糖价格指数上升0.035%。所有解释变量的符号与先验预期相一致,即降雨量与葡萄糖价格指数呈负相关,温度、酿制年份与葡萄糖价格指数呈正相关。五、展望在本次研究中,模型的可决系数只有0.639,目前的解释变量不能完全解释葡萄糖价格指数,在以后的工作中,我们会丰富我们的数据,找出影响葡萄糖价格指数的所有影响因素,完善我们的模型。