3.1《回归分析的基本思想及其初步应用》教学目标•通过典型案例,掌握回归分析的基本步骤。•教学重点:熟练掌握回归分析的步骤。•教学难点:求回归系数a,b•教学方法:讲练。必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析统计的基本思想y=f(x)y=f(x)y=f(x)实际样本模拟抽样分析1、两个变量的关系不相关相关关系函数关系线性相关非线性相关问题1:现实生活中两个变量间的关系有哪些呢?相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?2、最小二乘估计最小二乘估计下的线性回归方程:ˆˆˆybxa121()()ˆ()niiiniixXyYbXXˆˆaYbX对一作直线运动的质点的运动过程作了8次观测,得到下表,试估计x=9s时的位置y的值。时刻x/s12345678位置观测值y/cm5.547.5210.0211.7315.6916.1216.9821.06例如:05101520250246810系列1i12345678xi123456784.50yi5.547.5210.0211.7315.6916.1216.9821.0613.08xiyi5.5415.0430.0646.9278.4596.72118.9168.5560.1xi214916253649642043、回归分析的基本步骤:画散点图求回归方程预报、决策数学3——统计1.画散点图2.求出b,a的值。3.求回归直线方程4.用回归直线方程解决应用问题4、线性回归模型yabx其中a+bx是确定性函数,是随机误差注:产生的主要原因:(1)所用确定性函数不恰当;(2)忽略了某些因素的影响;(3)观测误差。思考:在时刻x=9s时,质点运动位置一定是22.6287cm吗?对于线性回归模型应注意以下两个问题:I模型的合理性;II在模型合理的情况下,如何估计a,b.yabx例1.下表给出我国从1949至1999年人口数据资料,试根据表中数据估计我国2004年的人口数。年份4954596469747984899499人口数/百万5426036727058079099751035110711771246年份05101520253035404550人口数/百万5426036727058079099751035110711771246分析:先画图例题2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:零件数(x)个102030405060708090100加工时间y626875818995102108115122(1)y与x是否具有线性相关?(2)若y与x具有线性相关关系,求回归直线方程(3)预测加工200个零件需花费多少时间?050100150050100150系列1分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x与y是否具有线性相关才可以求解后面的问题。作散点图如下:不难看出x,y成线性相关。解(1)列出下表:i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?请看下节课分解