一元线性回归分析预测法的基本数学模型为

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一元线性回归分析预测法的基本数学模型为:bxayˆ此式又称为一元线性回归方程式中:x为自变量;yˆ为因变量,线性回归分析估计值,或预测值;a,b为待定回归参数;a为回归直线的截距;b为回归直线的斜率。一元线性回归分析模型的几何图形如图所示。图直线回归分析模型的几何图形(三)一元线性回归分析预测法参数a,b的确定一元线性回归分析预测法用最小二乘法求回归方程的参数。假设有n期的历史观察资料:t123…nxtx1x2x3…xnyty1y2y3…yn用最小二乘法求回归参数的基本原则是,对于确定的方程,要使观察值y与估计值yˆ的偏差的平方和最小。由此方法可求出:b=22)(xxnyxxyn(6-1)a=xnbyn11(6-2)只需将历史资料自变量x和对应的因变量y的数据代入上面的两式,即可求0x0xyˆyˆaab0b00得回归参数a,b。(四)一元线性回归分析预测法模型的建立将利用历史资料数据和参数公式(6-1)和(6-2)求得的a,b值,代入一元回归方程式,既可得预测模型:bxayˆ(6-3)此时虽已求除预测模型,但不能将预测模型直接用于实际预测,还必须对模型进行检验。(五)一元线性回归分析预测法预测模型的检验对预测模型的检验主要包括以下几个方面:1、回归标准差检验。一般情况下,从观察值y与估计值yˆ的对比来看,回归直线上的各点(估计值)同对应的观察期各点(观察值)之间,均存在着一定的离差,即观察值曲线上各点的y值均偏离回归直线。离差越大,拟合程度越差。因而需要测定估计值的标准差,而回归标准差s就是用来估计y值在回归直线两侧的离差程度,以便在进行实际预测时为预测值建立一个置信区间范围。回归标准差的计算公式为:Sy=knyytt2ˆ(6-4)式中:Sy为回归标准差;y为因变量第t期的观察值;yˆ为因变量第t期的估计值;n为观察期的个数;k为自由度,为变量的个数(包括因变量和自变量)。Sy值越小,表明回归直线拟合越好。Sy值越小,说明回归方程能解释的总离差部分越大,也意味着x与y之间的相关程度越高。判断回归标准差能否通过检验,常常采用以下公式:ySy×100%(6-5)式中:Sy为回归标准差;y为因变量观察值的平均值。若依此式计算出的值小于15%,即为预测模型通过了回归标准差检验。2、相关系数检验。相关系数是描述两个变量x与y之间线性关系密切程度的一个数量指标。在一元线性回归分析预测法中,相关系数只对一个自变量与一个因变量进行相关程度分析,所以又称为单相关系数。相关系数r的基本公式为:r=22)()())((yyxxyyxx(6-6)或r=2222)(·)(yynxxnyxxyn(6-7)式中:x为自变量的观察值;y为因变量的观察值;x为自变量观察值的平均值;y为因变量观察值的平均值;n为观察期的个数。通过数学证明我们可以发现相关系数r具有这样的性质:0≤r≤1,r的值反映了x与y之间的内在联系,可以得出以下结论:其中:若r越接近0,x与y的线性相关程度越小;若r越接近1,x与y的线性相关程度越大。(1)当r=0时,回归直线方程中b=0,回归直线平行于x轴,说明y取值与x无关,二者之间无线性相关关系。此时称y与x毫无线性关系。在通常情况下,这时三点的分布是不规则的。(2)当r=±1时,所有的散点完全在回归直线上。此时称y与x完全线性相关。当r=1时,称完全正相关;当r=-1时,称完全负相关。附录一相关系数检验表n-20.100.050.020.010.0011234567891011121314151617181920253035404550607080901000.987690.900000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.44090.42590.41240.40000.38870.37830.36870.35980.32330.29600.27460.25730.24280.23060.21080.19540.18290.17260.16380.996920.950000.87838.81140.75450.70670.66640.63190.60210.57600.55290.53240.51390.49730.48210.46830.45550.44380.43290.44270.38090.34940.32460.30440.28750.27320.25000.23190.21720.20500.19460.9995070.980000.934330.88220.83290.78870.74980.71550.68510.65810.63390.61200.59230.57420.55770.54250.52850.51550.50340.49210.44510.40930.38100.35780.33840.32180.29480.27370.25650.24220.23010.9998770.990000.958730.917200.87450.83430.79770.76460.73480.70790.68350.66140.64110.62260.60550.58970.57510.56140.54870.53680.48690.44870.41820.39320.37210.53410.32480.30170.28300.26730.25400.99999880.999000.991160.974060.950740.924930.89820.87210.84710.82330.80100.78000.76030.74200.72460.70840.69320.67870.66520.65240.59740.55410.51890.48960.46480.44330.40780.37990.35680.33750.3211注:表中给出了满足rrP的r的数值。其中n-2是自由度相关系数的值到底取多大,才可以确定y与x之间具有线性关系呢?一般情况下,当r≥0.8时,认为y与x高度线性相关;当0.5r0.8时,认为y与x中度线性相关;当0.3r≤0.5时,认为y与x低度相关;当r≤0.3时,认为y与x不相关。(六)预测并确定置信区间在上述检验通过以后,将已判断除的未来的自变量x的值代入预测模型,就可计算出预测值。由于实际计算中难免出现误差,预测值不可能是一个确定值,而应该是一个范围或区间,一般要求实际值位于这个区间范围的可靠程度应达到95%以上。若给定可靠度1-,可以证明0y的预测区间为:(020020ˆ,ˆStySty)(6-8)其中:niniiiniiyxxnnxxnnSS12122100/11式中:)2(22ntt,可由t分布表查得;0x为预测点x值;Sy是估计标准差,其计算公式见(6-4);ix为统计数据。利用公式(6-8)来确定预测区间,在计算上颇为麻烦,在实际应用中可以做一些简化。事实上,预测值0ˆy的可靠度为68.27%时的预测区间为:(0ˆy-Sy,0ˆy+Sy)预测值0ˆy的可靠度为95.45%时的预测区间为:(0ˆy-2Sy,0ˆy+2Sy)预测值0ˆy的可靠度为99.73%时的预测区间为:(0ˆy-3Sy,0ˆy+3Sy)预测区间的长度直接关系到预测的准确性。显然,预测区间越长,精度越差,反之则越好。例:某地区居民的收入与社会商品零售总额近10年的统计资料如表17-2所示。表17-2社会商品零售总额与居民收入统计资料单位:亿元序号居民收入商品零售总额序号居民收入商品零售总额123456470778292566066707867891010712514316518988102118136155讨论社会商品零售总额与居民收入的关系。并以此预测下一年居民收入达到213亿元时的社会商品零售总额。解:第一步,因为预测目标是社会商品零售总额,所以令社会商品零售总额为y,居民收入为x。依据统计资料,做出散点图。见图17-3020406080100120140160180406080100120140160180200图17-3统计资料散点图第二步,建立数学模型。从图17-3可见,y与x呈线性关系,故设预测模型为:bxayˆ第三步,估计参数a,b。为了便于计算,列出计算表,如表17-4所示表17-4线性回归计算表序号ixiyiiyx2ix2iy1234567891064707782921071251431651895660667078881021181361553584420050825740717694161275016874224402929540964900592967248464114491562520449272253572131363600435649006084774410404139241849624025合计111492911655714058296669将所得数字代入公式(8-2)和(8-3)可得b=22)(xxnyxxyn=2111414058210929111411655710=13066.4/16482.4=0.7927a=xnbyn11=929/10-0.7927×1114/10=4.593由此,得回归预测方程式:yˆ=4.593+0.7927x这个模型表明:居民的平均收入每增加1元,平均就有约0.79元用于商品消费。第四步,进行相关性检验。首先,求相关系数r=2222)(·)(yynxxnyxxyn=0.9997显然,y与x具有高度线性相关性。其次,再用估计标准差验证。因为估计标准差Sy=knyytt2ˆ=22nyxbyayiiii=2101165577927.0929593.496669=0.9598y=92.9Sy/y=0.0115%所以y与x的线性相关性是较强的。第五步,预测当居民收入达到213亿元时,社会商品零售总额,得点估计值:0ˆy=4.593+0.7927×213=173.438(亿元)0ˆy可靠度为95%的预测区间为:(173.438-2×0.9598,173.438+2×0.9598)即(171.52,175.36)就是说,下一年社会商品零售总额的预测范围在171.52~175.36亿元。总黄酮生物总黄酮是指黄酮类化合物,是一大类天然产物,广泛存在于植物界,是许多中草药的有效成分。在自然界中最常见的是黄酮和黄酮醇,其它包括双氢黄(醇)、异黄酮、双黄酮、黄烷醇、查尔酮、橙酮、花色苷及新黄酮类等。简介近年来,由于自由基生命科学的进展,使具有很强的抗氧化和消除自由基作用的类黄酮受到空前的重视。类黄酮参与了磷酸与花生四烯酸的代谢、蛋白质的磷酸化、钙离子的转移、自由基的清除、抗氧化活力的增强、氧化还原作用、螯合作用和基因的表达。它们对健康的好处有:(1)抗炎症(2)抗过敏(3)抑制细菌(4)抑制寄生虫(5)抑制病毒(6)防治肝病(7)防治血管疾病(8)防治血管栓塞(9)防治心与脑血管疾病(10)抗肿瘤(11)抗化学毒物等。天然来源的生物黄酮分子量小,能被人体迅速吸收,能通过血脑屏障,能时入脂肪组织,进而体现出如下功能:消除疲劳、保护血管、防动脉硬化、扩张毛细血管、疏通微循环、活化大脑及其他脏器细胞的功能、抗脂肪氧化、抗衰老。近年来国内外对茶多酚、银杏类黄酮等的药理和营养性的广泛深入的研究和临床试验,证实类黄酮既是药理因子,又是重要的营养因子为一种新发现的营养素,对人体具有重要的生理保健功效。目前,很多著名的抗氧化剂和自由基清除剂都是类黄酮。例如,茶叶提取物和银杏提取物。葛根总黄酮在国内外研究和应用也已有多年,其防治动脉硬化、治偏瘫、防止大脑萎缩、降血脂、降血压、防治糖尿病、突发性耳聋乃至醒酒等不乏数例较多的临床报告。从法国松

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功