线性回归问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455一、有关概念当施肥量x一定时,水稻产量y的值带有一定的随机性自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、相关关系:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2、回归分析:水稻产量y与施肥量x之间大致有何规律?探索1:相同点:均是指两个变量的关系不同点:函数关系是一种确定性的关系;而相关关系是一种非确定性关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性2):相关关系与函数关系的异同点如下:1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近。施化肥量x15202530354045水稻产量y330345365405445450455xy散点图施化肥量水稻产量3、表示具有相关关系的两个变量的一组数据的图形叫做散点图.在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?探索2:2、回归直线方程:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线的附近,求在整体上与这n个点最接近的一条直线?探求步骤:①设定直线方程:y=bx+a(a,b为待定系数)②计算各组偏差:(i=1,2,…,n)yi-yi=yi-(bxi+a)③对偏差求平方和:Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2④求Q取的最小值:Q=∑(yi-bxi-a)2i=1n⑤将b,a代入①中式子得所求直线方程。时a、b的值b=∑(x-x)(y-y)i=1nii__∑(x-x)i=1ni_2=2∑x-nxi=1ni_2∑xi=1nii_nxyy__a=y–bx--1、所求直线方程叫做回归直线方程;即相应的直线叫做回归直线。2、对两个变量进行的线性分析叫做线性回归分析。注:应用:例1:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y3303453654054454504551)、求水稻产量y与施肥量x之间的回归直线方程;2)、估计当施肥量为70时水稻的产量是多少?y=bx+ai1234567xi15202530354045yi330345365405445450455xiyi49506900912512150155751800020475x=30y=399.3∑xi2=7000∑yi2=1132725∑xiyi=87175i=1i=177i=17b=(∑xiyi–nxy)/(∑xi2-nx2)i=177i=1=(87175-7×30×399.3)/(7000-7×302)≈4.75a=y-bx=399.3-4.75×30≈257所求的回归直线方程为:y=4.75x+257阅读P38例b=(∑xiyi–10xy)/(∑xi2-10x2)i=11010i=1i12345678910x32.231.132.935.837.138.938.039.043.044.6y25.030.034.037.039.041.042.044.048.051.0xiyi8059331118.61324.61446.91558163818922140.82346=(15202.9-10×37.97×39.1)/(14663.67-10×37.972)≈1.447a=y-bx=39.1-1.447×37.97≈-15.843x=37.97y=39.1∑xi2=14663.67∑yi2=15857∑xiyi=15202.9i=1i=11010i=110练习:P40小结作业:P42:1