1统计回归模型的研究论文作者:林成家专业:信息与计算科学班级:050803学号:20052005指导教师:杨孝英2摘要统计回归模型是用一个或多个其他变数来预测另一个变量。通过现在或过去事件的信息来预测现在和未来的事项,同时统计回归模型在现实中的应用更是有着广泛和实际的意义。本论文主要研究统计回归模型在现实生活中的应用,以达到学以致用的目的。文章分三个部分,第一部分,统计回归模型的概念以及基础知识;第二部分是统计回归模型在现实生活中实际应用的示范举例,例如在电信行业、化工行业、农业等方面;第三部分是文章的总结。文章涉及到最小二乘法解法以及t检验,F检验,误差分析,残差分析,区间估计等本科学习中的一些知识,这也是对以前所学知识的一种复习与巩固,希望通过研究能真正达到将理论知识应用到现实生活中的效果,为社会更好的服务。关键词:统计回归模型最小二乘法t检验区间估计3AbstractStatisticalregressionmodelsareusedtopredictonevariablefromoneormoreothervariables.Regressionmodelsprovidethescientistwithapowerfultool,allowingpredictionsaboutpast,present,orfutureeventstobemadewithinformationaboutpastorpresentevents.Atthesametime,thestatisticalregressionmodelisabroadandpracticalsignificanceapplicationinreality.Thispapermajorresearchtheapplicationofstatisticalregressionmodelinreallife,thepurposeisapplywhattheyhavelearned.Thearticleisdividedintothreeparts:thefirstpartistheconceptofstatisticalregressionmodelandbasicknowledge;thesecondpartistheexamplesofstatisticalregressionmodelinreallife,forexample,inthetelecommunicationsindustry,chemicalindustry,agriculture,etc;thethirdpartisasummaryofthearticle.Articlesrelatedtosomeknowledgeinundergraduatestudy,suchasleastsquaressolutionandthettest,Ftest,erroranalysis,residualsanalysis,intervalestimation.Thisisareviewandconsolidationtothepreviouslylearnedknowledge.Hopethroughresearchtobeabletoreallyachievethedesiredeffectthattheoreticalknowledgeapplytoreallife,betterserviceforthecommunity.Keywords:statisticalregressionmodel,leastsquares,ttest,intervalestimation4目录一、绪论…………………………………………………………………………1二、统计回归模型的应用………………………………………………………31、统计回归模型在电信行业的应用………………………………………51.1指标选取及小组划分…………………………………………51.2各组电信业务收入回归模型及其检验………………………61.3各组影响因素分析…………………………………………71.4结论及研究意义……………………………………………82、统计回归模型在化工行业的应用…………………………………92.1统计回归模型在酮苯脱蜡脱油装置上的应用………………92.2酮苯脱蜡模型建立…………………………………………102.3模型验证……………………………………………………112.4蜡收率模型验证……………………………………………132.5结论……………………………………………………………153、统计回归模型在农业中的应用………………………………………153.1建模背景………………………………………………………153.2组建统计回归模型……………………………………………163.3回归值的统计精度分析………………………………………183.4概率预报及其区间估计…………………………………………183.5结语…………………………………………………………19三、参考文献………………………………………………………………215一、绪论当人们对研究对象的内在特性和各因素的关系有比较充分的认识时,一般用机理分析方法建立数学模型,如果由于客观事物内部规律的复杂性以及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的办法是搜索大量的数据,基于对数据的统计分析去建立模型,而统计回归模型是一种用途非常广泛的一类随机模型。同时统计回归模型在现实应用中应用更加广泛。本论文就是基于统计回归模型的理论在现实生活中各行各业的实际应用来加以研究。二、统计回归模型在现实中的应用1.统计回归模型在电信业务的应用目前,我国各大电信集团的业务发展及收入多呈自然地域的特点,而电信业务的发展受当地经济发展状况、消费者文化程度及消费水平等因素的影响和制约,集团在制定收入计划时能否可以参考当地经济发展指标的变动而客观地制定集团宏观和微观的业务收入计划,并根据当地社会发展规划进行必要的调整。通过2002年-2004年一些社会指标,建立了各组电信业务收入与社会经济指标之间的回归模型。1.1指标选取及小组划分各地区经济指标种类繁多,总体来看,主要包括国民经济核算、人口、教育、劳动就业、固定资产投资、能源生产与消费、财政、物价及各行业指标。在众多指标中,难免会存在相关性较高的指标,在回归分析中,这种多重共线性的存在不仅使得回归模型难以真实的反映各指标与电信业务收入的关系,而且指标间的相互扭曲会导致部分指标统计量不显著。选取人均电信业务收入为电信发展水平被解释变量,以人均GDP、最终消费与资本形成总额的比值、人口数、大专以上人口占6岁以上人口的比值四项指标分别代表当地经济发展水平、消费水平、人口总量、文化程度,如表1,并进行了人均电信业务收入和人均GDP及人口数的对数处理。在指标和量纲的选取思路是,人均指标与比例指标的选取避免了多重共线性问题,又很好地表现了经济属性,并对人均指标和人口数量进行了对数处理,对数的选择既平衡了各统计量的数值悬殊问题,又平衡了指标中实际值与比例值的差别。根据人均GDP和人均电信业务收入2002-2004年指标,经过聚类分析得到四组,如表26所示。1.2各组电信业务收入回归模型及其检验对于2002-2004年的数据,我们视为截面数据,直接采用多元回归模型进行拟合,并对其结果进行检验。在确定了具有代表性而且不存在多种共线性问题的经济指标的基础上,对各个小组分别进行回归分析,建立多元线性回归方程如下:y=β0+β1x1+β2x2+β3x3+β4x4+ε其中,y,x1,x2,x3,x4如表1所述,将各组中某地区2002-2004年的各指标作为一个统计量,通过最小二乘估计得到以下各组回归方程第一组:y=-1.135+1.0033X+5.8264X,2R=0.989F=267.07第二组:y=-14.417+2.0051X+1.1762X,2R=0.831F=36.98第三组:y=-3.3+1.1311X+0.4072X-0.2623X+3.5254X2R=0.787F=96.14第四组:y=0.895+0.7401X-0.12X-0.253X,2R=0.848F=88.45各组均经F检验有效,对所有回归方程的残差分析,无异常值出现,并进行了拟合,得到了良好的回归误差分析效果,回归模型误差分析结果略。1.3各组影响因素分析回归模型不仅从数量上反映了各指标因素与电信行业收入指标的关系,7而且确定了各地区电信业务收入指标的影响质量。每一组的模型中,影响电信业务收入指标的各因素的解释能力各不同,而且影响的正负方向也不同,如表3通过提高经济发展水平可以促进除第一组外的其它三组的电信发展水平,它们与电信发展水平之间具有强的乘数效应;提高消费水平可以促进第二组和第三组的电信发展水平,但却将减少第四组的电信发展水平;提高文化程度可以增加和第一组和第三组的电信发展水平扩大人口数量将提高第一组电信发展水平,却减少第三组电信发展水平。(1)具有电信发展水平高、经济发达、消费水平高、人口文化程度高的特点从回归模型的结果来看,人口规模和文化程度两个因素同时对电信发展有显著的正向影响作用,其中,人口规模对人均电信业务收入的弹性系数略大于1,文化程度每增长1单位则促进人均电信业务收入增长5.826单位。经济发展和消费水平两个因素对电信发展的影响不显著,表明该组的经济水平的提高已经很难再对电信发展做出新贡献,即电信发展水平的提高已经不依赖于当地经济发展水平和消费水平的提高,而且较大程度地依赖当地人口文化程度的提高,同时,随着人口规模的扩大,促进电信发展水平的提高。因此,建议第一组以吸引高层次人才的方式提高人口文化程度,扩大人口规模,这正与目前的政策相吻合。(2)具有经济较发达且人口众多、文化程度较高、消费水平较高的特点对于经济发达的省份,经济发展水平和消费水平两个因素对电信的发展有显著地正向影响,而其它的两个因素作用不显著,经济发展水平对电信发展水平的弹性系数是2,消费水平对电信发展水平的弹性系数是1.176,相比8之下,说明电信发展水平的提高更多地依赖经济发展水平的提高,建议在提高消费水平的同时,大力提高经济发展水平,以提高电信发展水平,而人口规模和文化程度对电信发展水平的提高不显著,因此,不能依赖人口的增加和人口文化程度的提高的方式促进电信发展水平的提高。(3)经济整体实力较低,多数边远省份,人口数量少,人口文化程度普遍不高,消费水平较低四个因素都对电信的发展有显著的影响,其中,人口规模因素是负的影响,这可能是由于这些地区的地理区域大,人口却很稀少,导致对电信发展的束缚,而其它因素都是正向的,影响最大的是人口文化程度,因此,建议该组以不扩大人口规模、快速提高文化程度、加快经济发展水平、提高消费水平的方式来增加电信发展水平,特别是电信发展水平对人口文化程度的变化最敏感。(4)经济发展对电信发展产生正的影响作用,消费水平和人口规模均对电信的发展有负的影响作用,人口文化程度的影响作用不显著相比之下,经济发展是该组促进电信发展的唯一正向动力,其落后已经严重制约了电信发展水平,同时要控制人口规模的增长,降低消费与资本形成的比值,即相对最终消费而言,适度扩大资本总量的方式促进电信发展。1.4结论及研究意义我国电信业务收入水平依赖当地经济发展水平、消费水平、人口总量及文化教育程度方面的影响和制约,各影响因素的影响程度分小组而不同。通过建立和分析各小组电信业务收入回归模型,得到各组电信业务收入的主要影响作用指标和依赖程度。因此,在制定微观收入分配计划时,可以参照或跟踪当地经济发展水平提高的幅度、参考当地消费水平的变化幅度、或者根据人口总量和文化程度的变化做相应的调整,得到较为客观、可依赖的、现实的社会经济指标量化的依据。2.统计回归模型在化工上的应用2.1统计回归模型在酮苯脱蜡脱油装置上的应用在相关文献资料的基础上,应用SPSS统计软件、采取多元线性回归方法9找出影响酮苯脱蜡装置200SN正序油