最小二乘估计问题导入:上一节课我们学习了人的身高与右手一拃长之间近似存在着线性关系,这种线性关系可以有多种方法来进行刻画,那么用什么样的线性关系刻画会更好?这就是本节课我们要讨论的问题。最小二乘估计用什么样的线性关系刻画会更好一些?问题1:想法:保证这条直线与所有点都近(也就是距离最小)。最小二乘法就是基于这种想法。问题2:用什么样的方法刻画点与直线的距离会方便有效?设直线方程为y=a+bx,样本点A(xi,yi)方法一、点到直线的距离公式12baybxdii方法二、2iibxayy0iiyx,iibxax,bxay显然方法二能有效地表示点A与直线y=a+bx的距离,而且比方法一更方便计算,所以我们用它来表示二者之间的接近程度问题3:怎样刻画多个点与直线的接近程度?例如有5个样本点,其坐标分别为(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)与直线y=a+bx的接近程度:255244233222211bxaybxaybxaybxaybxay若有n个样本点:(x1,y1),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:2211)]([)]([nnbxaybxay使上式达到最小值的直线y=a+bx就是所求的直线,这种方法称为最小二乘法。xbyaxnxxyxnyxyxbnnn,......2221111212......x,ynnnxxxyyyn如果用表示用表示则可得到抽象概括:这样得到的直线方程称为线性回归方程,a,b为其系数。1、在回归直线方程中,b是回归直线方程的斜率,a是截距;b的含义容易理解成增加的单位数,而实际上,它代表x每增加一个单位,y的平均增加单位数。一般的说,当回归系数b>0时,说明两个变量呈正相关关系,它的意义是:当x每增加一个单位时,y就增加b个单位;当b<0时,说明两个变量呈负相关关系,它的意义是:当x每增加一个单位时,y就减少b个单位。2、回归直线必经过点),(yx注:求线性回归方程的系数:xbyaxnxyxnyxxnxxyxnyxyxbniiniiinnn1221222111)(线性回归方程:abxyxx1x2x3x4….xnyy1y2y3y4….yn3.例题1从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。1.散点图;2.回归方程:172.85849.0xy分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.ˆ学身高172cm女大生体重y=0.849×172-85.712=60.316(kg)例2:上节中的练习热茶的杯数(y)与气温(x)之间是线性相关的1)求线性回归方程2)如果某天的气温是-30C,预测这天能卖热茶多少杯?气温261813104-1杯数20243438506411.41.71.962.3821.51.792.252.68531.61.882.563.00841.71.952.893.31551.82.033.243.65461.92.13.613.99722.1644.3282.12.214.414.64124.9227.9931.750.7333333331.97750.6941666672.050833333回归方程预测值ixiiy2ixiiyxxy222111xnxxyxnyxyxbnnnxbya课堂练习:1.设一个回归方程为y=3-1.2x,则变量x增加一个单位时()A.y平均增加1.2个单位B.y平均增加1.2个单位C.y平均减少3个单位D.y平均减少3个单位2.在一次实验中,测得(x,y)的四组值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y=x+1B.y=x+2C.y=2x+1D.y=x-1.5.35.2,,5.3,5.244321代入各个选项检验知,所以把点)(而回归直线必过点解析:因为yxyxAA1.如何求线性回归方程(公式法)小结:2.线性回归方程系数的含义3.线性回归方程的应用