Excel求解线性回归详解(LINEST-函数)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1/111Excel函数线性回归LINEST函数本文介绍MicrosoftOfficeExcel中LINEST函数(函数:函数是预先编写的公式,可以对一个或多个值执行运算,并返回一个或多个值。函数可以简化和缩短工作表中的公式,尤其在用公式执行很长或复杂的计算时。)的公式语法和用法。有关绘制图表和执行回归分析的详细信息,请点击“请参阅”部分中的链接。说明LINEST函数可通过使用最小二乘法计算与现有数据最佳拟合的直线,来计算某直线的统计值,然后返回描述此直线的数组。也可以将LINEST与其他函数结合使用来计算未知参数中其他类型的线性模型的统计值,包括多项式、对数、指数和幂级数。因为此函数返回数值数组,所以必须以数组公式的形式输入。请按照本文中的示例使用此函数。直线的公式为:y=mx+b-或-y=m1x1+m2x2+...+b(如果有多个区域的x值)其中,因变量y是自变量x的函数值。m值是与每个x值相对应的系数,b为常量。注意,y、x和m可以是向量。LINEST函数返回的数组为{mn,mn-1,...,m1,b}。LINEST函数还可返回附加回归统计值。语法LINEST(known_y's,[known_x's],[const],[stats])LINEST函数语法具有以下参数(参数:为操作、事件、方法、属性、函数或过程提供信息的值。):Known_y's必需。关系表达式y=mx+b中已知的y值集合。如果known_y's对应的单元格区域在单独一列中,则known_x's的每一列被视为一个独立的变量。如果known_y's对应的单元格区域在单独一行中,则known_x's的每一行被视为一个独立的变量。Known_x's可选。关系表达式y=mx+b中已知的x值集合。2/112Excel函数线性回归known_x's对应的单元格区域可以包含一组或多组变量。如果仅使用一个变量,那么只要known_y's和known_x's具有相同的维数,则它们可以是任何形状的区域。如果使用多个变量,则known_y's必须为向量(即必须为一行或一列)。如果省略known_x's,则假设该数组为{1,2,3,...},其大小与known_y's相同。const可选。一个逻辑值,用于指定是否将常量b强制设为0。如果const为TRUE或被省略,b将按通常方式计算。如果const为FALSE,b将被设为0,并同时调整m值使y=mx。stats可选。一个逻辑值,用于指定是否返回附加回归统计值。如果stats为TRUE,则LINEST函数返回附加回归统计值,这时返回的数组为{mn,mn-1,...,m1,b;sen,sen-1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}。如果stats为FALSE或被省略,LINEST函数只返回系数m和常量b。附加回归统计值如下:统计值说明se1,se2,...,sen系数m1,m2,...,mn的标准误差值。seb常量b的标准误差值(当const为FALSE时,seb=#N/A)。r2判定系数。y的估计值与实际值之比,范围在0到1之间。如果为1,则样本有很好的相关性,y的估计值与实际值之间没有差别。相反,如果判定系数为0,则回归公式不能用来预测y值。有关如何计算r2的信息,请参阅本主题下文中的“说明”。seyY估计值的标准误差。FF统计或F观察值。使用F统计可以判断因变量和自变量之间是否偶尔发生过可观察到的关系。df自由度。用于在统计表上查找F临界值。将从表中查得的值与LINEST函数返回的F统计值进行比较可确定模型的置信区间。有关如何计算df的信息,请参阅本主题下文中的“说明”。示例4说明了F和df的用法。ssreg回归平方和。ssresid残差平方和。有关如何计算ssreg和ssresid的信息,请参阅本主题下文中的“说明”。下面的图示显示了附加回归统计值返回的顺序。3/113Excel函数线性回归说明可以使用斜率和y轴截距描述任何直线:斜率(m):通常记为m,如果需要计算斜率,则选取直线上的两点,(x1,y1)和(x2,y2);斜率等于(y2-y1)/(x2-x1)。Y轴截距(b):通常记为b,直线的y轴的截距为直线通过y轴时与y轴交点的数值。直线的公式为y=mx+b。如果知道了m和b的值,将y或x的值代入公式就可计算出直线上的任意一点。还可以使用TREND函数。当只有一个自变量x时,可直接利用下面公式得到斜率和y轴截距值:斜率:=INDEX(LINEST(known_y's,known_x's),1)Y轴截距:=INDEX(LINEST(known_y's,known_x's),2)数据的离散程度决定了LINEST函数计算的直线的精确度。数据越接近线性,LINEST模型就越精确。LINEST函数使用最小二乘法来判定数据的最佳拟合。当只有一个自变量x时,m和b是根据下面的公式计算出的:其中,x和y是样本平均值;即,x=AVERAGE(knownx's),y=AVERAGE(known_y's)。直线和曲线拟合函数LINEST和LOGEST可用来计算与给定数据拟合程度最高的直线或指数曲线,但需要判断两者中哪一个与数据拟合程度最高。可以用函数TREND(known_y's,known_x's)来计算直线,或用函数GROWTH(known_y's,known_x's)来计算指数曲线。这些不带new_x's参数的函数可在实际数据点4/114Excel函数线性回归上根据直线或曲线来返回y预测值的数组,然后可以将预测值与实际值进行比较。可能需要用图表方式来直观地比较二者。回归分析时,Excel会计算每一点的y的估计值和实际值的平方差。这些平方差之和称为残差平方和(ssresid)。然后Excel会计算总平方和(sstotal)。当参数const=TRUE或被省略时,总平方和是y的实际值和平均值的平方差之和。当参数const=FALSE时,总平方和是y的实际值的平方和(不需要从每个y值中减去平均值)。回归平方和(ssreg)可通过公式ssreg=sstotal-ssresid计算出来。残差平方和与总平方和的比值越小,判定系数r2的值就越大,r2是用来判断从回归分析求得的公式是否足以说明变量之间关系的指示器。r2=ssreg/sstotal。在某些情况下,一个或多个X列可能没有出现在其他X列中的附加预测值(假设Y's和X's位于列中)。换句话说,删除一个或多个X列可能会得到同样精度的y预测值。在这种情况下,应从回归模型中省略这些多余的X列。这种现象被称为“共线”,因为任何多余的X列都可被表示为多个非多余X列的和。LINEST函数会检查是否存在共线,并在识别出多余的X列之后从回归模型中删除所有这些列。由于包含0系数以及0se数值,因此已删除的X列能在LINEST输出中被识别出来。如果一个或多个多余的列被删除,则将影响df,原因是df取决于实际用于预测目的的X列的数量。有关计算df的详细信息,请参阅示例4。如果由于删除多余的X列而更改了df,则也会影响sey和F的值。实际上,出现共线的情况应该相对很少。但是,如果某些X列仅包含0和1数值作为实验中的对象是否属于特定组成员的指示器,则很可能引起共线。如果const=TRUE或被省略,则LINEST函数可有效地插入所有1数值的其他X列以便为截距建立模型。如果在一列中,1对应于每个男性对象,0对应于女性对象;而在另一列中,1对应于每个女性对象,0对应于男性对象,那么后一列就是多余的,因为其中的项可通过从所有1值的另一列(通过LINEST函数添加)中减去“男性指示器”列中的项来获得。在没有X列因共线而被从模型中删除时,请用以下方法计算df的值:如果known_x’s有k列且const=TRUE或被省略,那么df=n–k–1。如果const=FALSE,那么df=n-k。在这两种情况下,每次由于共线而删除一个X列都会使df的值加1。对于返回结果为数组的公式,必须以数组公式的形式输入。当输入一个数组常量(如known_x's)作为参数时,请使用逗号分隔同一行中的各值,使用分号分隔各行。分隔符可能会因“控制面板”的“区域和语言选项”中区域设置的不同而有所不同。注意,如果y的回归分析预测值超出了用来计算公式的y值的范围,它们可能是无效的。LINEST函数中使用的下层算法与SLOPE和INTERCEPT函数中使用的下层算法不同。当数据未定且共线时,这些算法之间的差异会导致不同的结果。例如,如果参数known_y's的数据点为0,参数known_x's的数据点为1:LINEST会返回值0。LINEST函数的算法用来返回共线数据的合理结果,在这种情况下至少可找到一个答案。5/115Excel函数线性回归SLOPE和INTERCEPT会返回错误#DIV/0!。SLOPE和INTERCEPT函数的算法只用来查找一个答案,在这种情况下可能有多个答案。除了使用LOGEST计算其他回归分析类型的统计值外,还可以使用LINEST计算其他回归分析类型的范围,方法是将x和y变量的函数作为LINEST的x和y系列输入。例如,下面的公式:=LINEST(yvalues,xvalues^COLUMN($A:$C))将在您使用y值的单个列和x值的单个列计算下面的方程式的近似立方(多项式次数3)值时运行:y=m1*x+m2*x^2+m3*x^3+b可以调整此公式以计算其他类型的回归,但是在某些情况下,需要调整输出值和其他统计值。示例1斜率和Y轴截距如果将示例复制到一个空白工作表中,可能会更容易理解该示例。如何复制示例?选择本文中的示例。要点不要选择行或列标题。从“帮助”中选择示例按Ctrl+C。在Excel中,创建一个空白工作簿或工作表。在工作表中,选择单元格A1,然后按Ctrl+V。要点若要使该示例能够正常工作,必须将其粘贴到工作表的单元格A1中。6/116Excel函数线性回归要在查看结果和查看返回结果的公式之间进行切换,请按Ctrl+`(重音符),或在“公式”选项卡上的“公式审核”组中,单击“显示公式”按钮。将示例复制到一个空白工作表中后,可以按照您的需要改编示例。1234567ABC已知y已知x10945273公式公式结果=LINEST(A2:A5,B2:B5,,FALSE)A7=2,B7=1要点示例中的公式必须以数组公式的形式输入。将本示例复制到空白工作表后,选择以公式单元格开始的区域A7:B7。按F2,然后按Ctrl+Shift+Enter。如果公式不是以数组公式输入,则返回单个结果值2。当以数组输入时,将返回斜率2和y轴截距1。示例2简单线性回归如果将示例复制到一个空白工作表中,可能会更容易理解该示例。如何复制示例?选择本文中的示例。要点不要选择行或列标题。7/117Excel函数线性回归从“帮助”中选择示例按Ctrl+C。在Excel中,创建一个空白工作簿或工作表。在工作表中,选择单元格A1,然后按Ctrl+V。要点若要使该示例能够正常工作,必须将其粘贴到工作表的单元格A1中。要在查看结果和查看返回结果的公式之间进行切换,请按Ctrl+`(重音符),或在“公式”选项卡上的“公式审核”组中,单击“显示公式”按钮。将示例复制到一个空白工作表中后,可以按照您的需要改编示例。123456789ABC月份销售额131002450034400454005750068100公式说明结果=SUM(LINEST(B2:B7,A2:A7)*{9,1})估算九月份的销售额11000通常,SUM({m,b}*{x,1})等于mx+b,即给定x值的y的估计值。还可以使用TREND函数。8/118Excel函数线性回归示例3多重线性回归假设有开发商正在考虑购买商业区里的一组小型办公楼。开发商可以根据下列变量,采用多重线性回归的方法来估算给定地区内的办公楼的价值。变量代表y办公楼的评估值x1底层面积(平方英尺)x2办公室的个数x3入口个数x4办公楼的

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功