数学论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数学实践与建模课程论文学号:201412110姓名:杨露明任课教师:张广强题目来源:题库华北水利水电大学自动咖啡售货机数量与咖啡销售量之间的关系摘要针对问题一,做出自动咖啡售货机数量与咖啡销量两个变量的一元线性回归模型,利用最小二乘法来估计参数,写出线性回归方程,来说明两个变量的线性相关性。针对问题二,使用多项式回归模型,利用最小二乘拟合方法来估计参数,得出一元多项式回归方程,从而得出两个变量的关系。针对问题三,将所给的自动咖啡售货机数量与咖啡销售量数据画出散点图,并用做出两个变量的一元线性拟合曲线和一元多项式拟合曲线。针对问题四,结合相关系数R值和判断系数R2的值来分析拟合优度,根据Sig值来分析显著性,根据RMSE值来分析标准误差。关键词:最小二乘法;一元线性回归模型;一元多项式回归模型;曲线拟合;第1页共6页一、问题重述为研究自助餐馆中的自动咖啡售货机数量与咖啡销售量之间的关系,随机抽取了14家餐馆调查自动售货机数量和咖啡销售量的数据表。为了找出两个变量的线性相关性,做出一元线回归模型,通过其中参数来研究线性相关性;同时为了更好地描述两个变量的关系,做出多项式模型。分别做出线性回归方程和多项式回归方程的拟合曲线,比较拟合度,显著性和标准误差来分析两种模型的优缺。二、模型假设2.1基本假设:假设1:抽查的14家餐厅是随机的。假设2:14家餐馆在营业额、顾客类型和地理位置方面都是相近的,且随机分配到每家餐馆。2.2符号(变量)说明表:符号类型单位含义Y浮点型无咖啡销售量X整型台自动售货机数量三、模型的建立与求解3.1一元线性回归模型的建立:对于所给的咖啡销售量Y和自动售货机数量X的统计数据,为了探讨其关系,我们建立一元回归的数学模型表达式:Y=β0+β1·X+ε(其中β0为常量,β1为线性系数。β0+β1·X是X的线性变化部分,ε是随机误差项,由随机因素引起。)一般ε是不可观测的的随机误差,通过对观察数据对参数β0和β1进行估计,^y,^β0,^β1为Y,β0,β1的估计值并称^y=^β0+^β1·X为Y关于X的一元线第2页共6页性经验回归模型。基本假设:假设1:误差项ε是一个期望值为零的随机变量,即E(ε)=0。对于一个给定的X值,Y的期望值为E(y)=β0+β1·x;假设2:对于所有的x值,ε的方差σ²都相同,即var(εi²)=σ²;假设3:误差项之间不存在自相关关系,其协方差为0,即Cov(εi,εj)=E(εi,εj)=0(i≠j);假设4:误差项ε是一个服从正态分布的随机变量,即ε≈N(0,σ²);假设5:自变量是给定的变量,与随机误差项线性无关。为了求出β0,β1的值,本文采用最小二乘法。即^β1=(n·Σxiyj-ΣxiΣyj)/(n·Σxi^2-(Σxi)^2)^β0=y(平均)-^β1·x(平均)使用MATLAB软件做回归分析得出一元线性回归方程为:Y=51.13·X+531.4。其拟合曲线为:第3页共6页其数据见下:模型汇总RR方调整R方估计值的标准误0.9770.9540.95025.759自变量为售货机数量。残差的直方图见下:近似的服从正态分布。3.2一元多项式回归模型建立:在一元回归分析中,如果因变量Y与自变量X的关系是非线性的,但是又找不到合适的函数曲线来拟合,则可以采用一元多项式拟合。它的优点是可以通过增加ANOVA平方和df均方FSig.回归164490.5791164490.579247.9110.000残差7962.08412663.507总计172452.66413自变量为售货机数量。第4页共6页X的高次项对实测点进行逼近,直到满意为止。多项式回归的基本方法是,设有一组观测值(xt,yt)t=1,2,3......存在非线性关系,则多项式的回归方程为:^y=b0+b1x+b2x2+........+bpxp为使离回归平方和SSQ=Σ(y-^y)2最小,采用最小二乘法原理得出以下方程组:b0n+b1Σx+b2Σx2+......+bpΣxp=Σyb0Σx+b1Σx2+b3Σx3+......+bpΣxp+1=Σxy......b0Σxp+b1Σxp+1+b2Σxp+2+......+bpΣx2p=Σxk解方程组便可以解出b0,b1,b2......bp。针对以上问题,先做出数据的散点图,见下图:从散点图可以看出回归方程大致为二次多项型,则假设其回归方程^y=b0+b1x+b2x2解得:b2=-5.145;b1=84.65;b0=500.1;则回归方程为:Y=500.1+84.65X-5.145X2。其拟合曲线为:第5页共6页其数据为:模型汇总RR方调整R方估计值的标准误0.9970.9950.9949.059自变量为售货机数量。四、结论与分析ANOVA平方和df均方FSig.回归171549.917285774.9591045.1710.000残差902.7471182.068总计172452.66413自变量为售货机数量。第6页共6页对于线性回归模型,其R值为0.977,R2的值为0.954,说明拟合优度较高,能够较好地描述两个变量的线性相关性,Sig值近似为零,远小于0.05,说明显著水平较高。残差值为:7962.084。对于多项式回归模型,其R值为0.997,R2的值为0.995,都大于线性回归的R值和R2的值,因此多项式比线性回归的拟合度更高。其Sig值也近似为零,显著水平较高,其残差值为902.747,远小于线性模型的残差,所以相比线性回归其误差更小。综上所述,多项式的回归模型比线性回归模型的拟合度高,残差值要小得多,因此多项式回归要优于线性回归模型,在该模型中用多项式模型能更准确地描述自动售货机和咖啡销量的关系。参考文献:[1]周凯宋军全邬学军《数学建模竞赛入门与提高》浙江大学出版社[2]艾冬梅李艳晴张丽静刘琳《MATLAB与数学实验》机械工业出版社[3]陈垚光毛涛涛王正林王玲《精通MATLAB》电子工业出版社[4]深继红施久玉高振滨《数学建模》哈尔滨工业大学[5]张玉张洪瑞李艳玲《数学实践与建模》华北水利水电大学数学与信息科学实验中心附录:自动咖啡售货机数量与咖啡销售量数据餐馆售货机数量咖啡销售量餐馆售货机数量咖啡销售量1234560508.10498.41568.21577.32651.72657.089101112133697.54755.34758.95787.65792.16841.4第7页共6页73713.4147831.8

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功