实习报告书学生姓名:学号:学院名称:专业名称:实习时间:2014年06月05日第六次实验报告要求实验目的:掌握多元线性回归模型的原理,多元线性回归模型的建立、估计、检验及解释变量的增减的方法,以及运用相应的Matlab软件的函数计算。实验内容:已知某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据,见表1。请选择恰当的解释变量和恰当的模型,建立粮食年销售量的回归模型,并对其进行估计和检验。表1某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据年份粮食年销售量Y/万吨常住人口X2/万人人均收入X3/元肉销售量X4/万吨蛋销售量X5/万吨鱼虾销售量X6/万吨197498.45560.20153.206.531.231.891975100.70603.11190.009.121.302.031976102.80668.05240.308.101.802.711977133.95715.47301.1210.102.093.001978140.13724.27361.0010.932.393.291979143.11736.13420.0011.853.905.241980146.15748.91491.7612.285.136.831981144.60760.32501.0013.505.418.361982148.94774.92529.2015.296.0910.071983158.55785.30552.7218.107.9712.571984169.68795.50771.1619.6110.1815.121985162.14804.80811.8017.2211.7918.251986170.09814.94988.4318.6011.5420.591987178.69828.731094.6523.5311.6823.37实验要求:撰写实验报告,参考第10章中牙膏销售量,软件开发人员的薪金两个案例,写出建模过程,包括以下步骤1.分析影响因变量Y的主要影响因素及经济意义;影响因变量Y的主要影响因素有常住人口数量,城市中人口越多,需要的粮食数量就越多,粮食的年销售量就会相应增加。粮食销量还和人均收入有关,人均收入增加了,居民所能购买的粮食数量也会相应增加。另外,肉类销量、蛋销售量、鱼虾销售量也会对粮食的销售量有影响,这些销量增加了,也表示居民的饮食结构也在发生变化,生活水平在提高,所以相应的,生活水平提升了,居民也有能力购买更多的粮食。2.建立散点图考察Y与每一个自变量之间的相关关系从上述散点图,我们可以看出,当x2增大时,y有向上增加的趋势,图中的曲线是用二次函数模型。随着x3,x4,x5,x6的增加,y的值都有比较明显的线性增长趋势,直线是用线性模型3.建立多元线性回归模型,并计算回归系数和统计量;综合上述分析,可以建立如下回归模型:参数参数估计值参数置信区间-3.6113-72.557365.33480.1255-0.01030.26140.0737-0.01350.16092.6752-0.21965.57003.4654-2.17219.1029-4.4987-9.59530.5979210xy510xy2R=0.9705F=52.6601p=0.0000表1初始模型的计算结果我们用逐步回归法,在Matlab中用stepwise,运行出下面图根据上图可以看出,变量x3,x5,x6对Y值影响不大,可以舍弃,所以该模型建的不合理,应该只和x2,x4有关,改进后的模型为:42210yxx,利用Matlab求解,得到的结果如下:参数参数估计值参数置信区间-39.7948[-94.854015.2644]0.2115[0.11180.3113]1.9092[0.31543.5031]2R=0.9539F=113.9220P=0.0000表2新模型的计算结果检验:表2与表1的结果相比,2R有所提高,说明新模型比初始模型有所改进。F的值从52.6601提高到113.9220,超过了临界的检验值,P=0.0000α。并且改进后,所有的置信区间都不包含零点,所以新模型更好,更符合实际。所以最后的模型为:4.对多元回归模型进行统计检验;统计检验:用新模型对粮食的销售量作预测。假设在某年,该市的人口数量是736.13万人,肉销售量是11.85万吨。所以粮食年销量y=-39.7948+0.2115*736.13+1.9092*11.85=138.5171万吨。与实际销量143.11万吨误差不大,模型效果比较好。5.分析回归模型对应的经济含义。经济分析:由x2,x4变量的回归系数都大于零,同经济理论分析得到的结论是一致的。说明回归方程的经济含义是:当肉销售量不变时,城市的人口每增加1万人,粮食的销量就增加0.2115万吨。当城市人口数量不变时,肉类销量每增加1万吨,粮食的销量就增加1.9092万吨。程序附录//画散点图%functionuntitled1(x2,y)%y=[98.45100.70102.80133.95140.13143.11146.15144.60148.94158.55169.68162.14170.09178.69]'%x2=[560.20603.11668.05715.47724.27736.13748.91760.32774.92785.30795.50804.80814.94828.73]'%x3=[153.20190.00240.30301.12361.00420.00491.76501.00529.20552.72771.16811.80988.431094.65]'%x4=[6.539.128.1010.1010.9311.8512.2813.5015.2918.1019.6117.2218.6023.53]'%x5=[1.231.301.802.092.393.905.135.416.097.9710.1811.7911.5411.68]'%x6=[1.892.032.713.003.295.246.838.3610.0712.5715.1218.2520.5923.37]'%n=1%a=polyfit(x2,y,n)%y2=polyval(a,x2)%plot(x2,y2)%holdon%plot(x2,y,'.k')%title('x2和y的散点图')%xlabel('x2')%ylabel('y')//计算参数估计值,参数置信区间,进行逐步回归%clc;%clear;%%y=[98.45100.70102.80133.95140.13143.11146.15144.60148.94158.55169.68162.14170.09178.69]';%x2=[560.20603.11668.05715.47724.27736.13748.91760.32774.92785.30795.50804.80814.94828.73]';%x3=[153.20190.00240.30301.12361.00420.00491.76501.00529.20552.72771.16811.80988.431094.65]';%x4=[6.539.128.1010.1010.9311.8512.2813.5015.2918.1019.6117.2218.6023.53]';%x5=[1.231.301.802.092.393.905.135.416.097.9710.1811.7911.5411.68]';%x6=[1.892.032.713.003.295.246.838.3610.0712.5715.1218.2520.5923.37]';%z=ones(14,1);%x=[zx2x4]%[b,bint,r,rint,stats]=regress(y,x)%stepwise(x,y)