线性回归方程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

线性回归方程有些教师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题”按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?物理成绩数学成绩学习兴趣学习时间其他因素结论:变量之间除了函数关系外,还有。问题引入:函数关系---变量之间是一种确定性的关系.如:圆的面积S和半径r之间的关系.相关关系—变量之间有一定的联系,但不能完全的用函数来表达.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.(非确定性关系)变量之间的关系函数关系是一种确定的关系;相关关系与函数关系的异同点:均是指两个变量的关系.问题:举一两个现实生活中的问题,问题所涉及的变量之间存在一定的相关关系。(1)父母的身高与子女身高之间的关系(2)商品销售收入与广告支出经费之间的关系(3)粮食产量与施肥量之间的关系例:相关关系是一种非确定关系.相同点:不同点:问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/0C261813104-1杯数202434385064如果某天的气温是-50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系.将表中数据构成的6个数对表示的点在坐标系内标出,得到下图。今后我们称这样的图为散点图(scatterplot).选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;………………怎样的直线最好呢?这两点的直线;建构数学ˆybxaˆybxa1.最小二乘法:用方程为的点,应使得该直线与散点图中的点最接近那么,怎样衡量直线与图中六个点的接近程度呢?的直线拟合散点图中ˆyx26,18,13,10,4,babababababa我们将表中给出的自变量代入直线方程,得到相应的六个值:的六个值它们与表中相应的实际值应该越接近越好.22222222(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Qabbababababababaabba所以,我们用类似于估计平均数时的思想,考虑离差的平方和ˆybxa,ab(,)Qab与图中六个点的接近程度,所以,设法取达到最小值.的值,使这种方法叫做最小平方法(又称最小二乘法).(,)Qabˆybxa是直线在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线与各散点222222(,)128661403820460101721286(1403820)64601017214038201286(...........)12867019101286()...........1286701910()1286Qabbaabbababaaabbababfb把a看作常数,那么Q是关于b的二次函数记为f(b)f(b)当时,取最小值2222()6(140460)12863820101721404606(...........)6702306()...........670230()6faababbbaababafa把b看作常数,那么Q是关于a的二次函数记为f(a)当时,取最小值070191012867023061.6477,57.5568ˆ1.647757.5568ˆ566566abQbabayxxyC当时,(a,b)取最小值解得所求直线方程为当时,故当气温为时,热茶销量约为杯。线性相关关系:像这样能用直线方程ˆybxa近似表示的相关关系叫做线性相关关系.如果散点图中的点分布从整体上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系x1x2x3xnxy1y2y3yny线性回归方程:一般地,设有n个观察数据如下:……2221122()()...()nnQybxaybxaybxaˆybxa当a,b使取得最小值时,就称这n对数据的线性回归方程,该方程所表示的直线称为回归直线.为拟合2221122222211111()()...()222nnnnnnniiiiiiiiiiiQybxaybxaybxaybxyaybxabxna类似地,我们可以推得,求回归方程中系数a,b的一般公式:ˆybxa1122211()(),()nniiiiiinniiiixynxyxxyybxnxxxaybx以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。求解线性回归问题的步骤:1.列表(),画散点图.2.计算:3.代入公式求a,b4.列出直线方程iiiiyxyx,,211,,,nniiiiixyxxy例题1:下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.02468101214050100150200系列188118821181822211031,128.875,71.6,8.95,137835,9611.79611.78128.8758.951378358128.8758.95128.875iiiiiiiiiiiiiixxyyxxyxynxybxnxaybx将它们代入*式:0.07740.0774-1.0241所以,所求线性回归方程为y0.0774x-1.0241y=0.0774x-1.024102468101214050100150200系列1线性(系列1)线性(系列1)P75练习2回归分析的基本步骤:画散点图求回归方程预报、决策问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?相关系数•1.计算公式•2.相关系数的性质•(1)|r|≤1.•(2)|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.niii=1nn22iii=1i=1(x-x)(y-y)r=(x-x)(y-y)2_n1i2i2_n1i2in1i__iiynyxnxyxnyx超级链接散点图只是形象地描述点的分布情况,要想把握其特征,必须进行定量的研究.相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况小结:1.变量之间的两种关系:确定性关系与相关关系2。对于线性相关的两个变量用什么方法来刻画之间的关系呢?最小二乘法最小二乘法估计线性回归方程:ˆybxa1122211()(),()nniiiiiinniiiixynxyxxyybxnxxxaybx数学3——统计1.画散点图2.了解最小二乘法的思想3.求回归直线方程4.用回归直线方程解决应用问题

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功