学习目标预习导学典例精析栏目链接目录学习目标预习导学典例精析栏目链接1.1回归分析的基本思想及其初步应用学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟合效果.3.掌握建立回归模型的步骤.4.了解回归分析的基本思想方法和初步应用.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接题型一线性回归模型的求解及应用学习目标预习导学典例精析栏目链接例1一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,收集的数据如下:零件个数x/个1234加工时间y/小时2358(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)现需生产20件此零件,预测需用多长时间?(注:用最小二乘法求线性回归方程系数公式学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接分析:解答过程如下:解析:(1)根据表中提供的数据可作出散点图如下:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接(2)x-=1+2+3+44=2.5,y-=2+3+5+84=4.5,学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接a^=y--b^x-=4.5-2×2.5=-0.5,所以所求回归方程为:y^=2x-0.5.(3)因y^=2×20-0.5=39.5(小时),所以生产20件此零件,预测需用39.5小时.点评:若已知两个变量x与y具有线性相关关系,可直接根据数据套用公式求出b^、a^,便可得到x与y间的回归直线方程.若没有明确说明两个变量x与y是否具有线性相关关系,则可通过散点图进行直观判断,只有当两个变量具有线性相关关系时,才有必要求回归直线方程,并用这个方程进行估计和预报.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接►变式训练1.某种产品的广告费用支出x与销售额y之间有如下的对应数据(单位:万元):x/万元24568y/万元3040605070(1)画出散点图;(2)求回归方程;(3)据此估计广告费用支出为10万元时销售额y的值.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:(1)作出散点图如下图所示:(2)x-=15×(2+4+5+6+8)=5,y-=15×(30+40+60+50+70)=50,学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接题型二模型拟合效果的分析学习目标预习导学典例精析栏目链接例2一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:零件数x/个102030405060708090100加工时间y/分钟626875818995102108115122(1)如果y与x具有线性相关关系,求回归直线方程.(2)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?(3)求出相关指数R2,作出残差图,并对模型拟合效果进行分析.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:(1)列出下表:i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接a^=y--b^x-=91.7-0.668×55=54.96,因此,所求的回归直线方程为y^=0.668x+54.96.(2)这个回归直线方程的意义是当x每增加1时,y的值约增加0.668,而54.96是y不随x的增加而变化的部分,因此,当x=200时,y的估计值为y^=0.668×200+54.96=188.56≈189.因此,加工200个零件所用的时间约为189分钟.(3)列出残差表:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接yi626875818995102108115122i61.668.375.081.788.495.0101.7108.4115.1121.8yi--29.7-23.7-16.7-10.7-2.73.310.316.323.330.3yi-i0.40-0.300-0.700.6000.30-0.40-0.100.20学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接注:横坐标为零件个数,纵坐标为残差.由R2≈0.99962非常接近于1,可知回归直线模型拟合效果较好.残差图中的残差点比较均匀地落在水平的带状区域中,也说明选用的线性回归模型较为合适,带状区域的宽度比较狭窄,说明了模型拟合精度较高.点评:解决本题的关键在于公式的运用.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接►变式训练2.关于x与y有如下数据:x24568y3040605070为了对x、y两个变量进行统计分析,现有以下两种线性模型:甲模型y^=6.5x+17.5,乙模型y^=7x+17,试比较哪一个模型拟合的效果好.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接题型三非线性回归分析学习目标预习导学典例精析栏目链接例3在化学反应过程中某化学物质的反应速率y(g/min)与一种催化剂的量x(g)有关,现收集了8组数据列于下表中,试建立y与x之间的回归方程.x1518212427303336y6830277020565350学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:根据收集的数据作散点图如下图所示,根据样本点分布情况可选用两种曲线模型来拟合.(1)可认为样本点集中在某二次曲线y=c1x2+c2的附近,令t=x2,则变换后样本点应该分布在直线y=bt+a,a=c2)的周围.由题意得变换后t与y样本数据表:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接t22532444157672990010891296y6830277020565350作y与t的散点图如下:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接由y与t的散点图可观察到样本数据点并不分布在一条直线的周围,因此不宜用线性回归方程y=bt+a(b=c1,)来拟合,也不宜用二次曲线y=c1x2+c2来拟合y与x之间的关系.(2)根据x与y散点图也可以认为样本点集中在某一条指数型函数y=c1ec2x的周围.令z=lny,则z=c2x+lnc1.即变换后样本点应该分布在直线z=bx+a(a=lnc1,)的周围.由y与x的数据表可得z与x的数据表:x1518212427303336z1.7922.0793.4013.2964.2485.3234.1745.858学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接作出z与x的散点图:由散点图可观察到大致在一条直线上,所以可用线性回归方程z^=bx+a来拟合.由z与x数据表得到线性回归方程:z^=0.1812x-0.8485,所以非线性回归方程为y^=e0.1812x-0.8485.因此,该化学物质反应速率对催化剂的量的非线性回归方程为y^=e0.1812x-0.8485.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接点评:非线性回归分析有时并不给出检验公式,这时我们可以画出已知数据的散点图,把它与教材必修1中学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量置换,把非线性回归问题转化为线性回归问题.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接►变式训练3.下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立y与x的关系式,并利用所得模型,预报x=40时的值.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:(1)利用表中数据,作出散点图如下:从散点图可以看出x与y不是线性相关关系,根据所学知识可以发现样本点分布在一条指数函数曲线y=aebx的周围,其中a,b为常数.(2)对y=aebx取自然对数,lny=lna+bx,令u=lny,c=lna,则变换为线性回归模型,u=c+bx.数据可转化为:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接x21232527293235u1.9462.3983.0453.1784.1904.7455.784散点图如下图所示:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接由散点图知,这些样本点基本分布在一条直线附近,两变量u,x呈线性相关.利用表中数据求得回归直线方程为u^=0.272x-3.849,∴y^=e0.272x-3.849,当x=40时,y=e0.272x×40-3.849≈1131.学习目标预习导学典例精析栏目链接1.2独立性检验的基本思想及其初步应用学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接1.了解独立性检验(只要求2×2列联表)的基本思想,记住K2的计算公式.2.了解实际推断原理和假设检验的基本思想及其初步应用.3.通过实际问题培养学生的学习兴趣,激发学生学习的积极性和主动性,增强社会实践能力,培养分析问题、解决问题的能力.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接题型一利用图形分析两分类变量的相关性学习目标预习导学典例精析栏目链接例1打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每晚都打鼾与患心脏病有关吗?用图加以分析.患心脏病未患心脏病合计每晚都打鼾30224254不打鼾2413551379合计5415791633学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:利用等高条形图定性分析两个分类变量之间是否有关系,图形如下:学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接比较来说,两者差距大,由此我们可以在某种程度上认为“每晚都打鼾与患心脏病”有关系.点评:利用等高条形图可粗略地判断两个分类变量是否有关系,这种判断可加深对独立性检验基本思想的理解.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接►变式训练1.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:患病未患病总计服用药104555没有服用药203050总计3075105试用图形判断服用药和患病之间是否有关系.学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:相应的等高条形图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系.学习目标预习导学典例精析栏目链接题型二独立性检验方法——K2公式学习目标预习导学典例精析栏目链接例2调查者询问了72名大学生在购买食品时是否看营养说明得到下表所示的数据,从表中数据分析看不看说明书与大学生的性别之间有没有关系.看营养说明不看营养说明合计男大学生28836女大学生132036合计442872学习目标预习导学典例精析栏目链接学习目标预习导学典例精析栏目链接解析:∵a=28,b=8,c=16,d=20,a+b=36,c+d=36,a+c=44,b+d=28,n=a+b+c+d=72,代入公式得K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=72×(28×20-8×16)236×36×44×28=134369281596672≈8.416,∵k≈8.416>7.879.