第1课时统计案例知识网络要点梳理思考辨析答案:①回归分析②可线性化回归分析③相关系数④条件概率⑤2×2列联表的独立性检验知识网络要点梳理思考辨析两个基本思想1.回归分析的基本思想回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想.知识网络要点梳理思考辨析注意理解以下几点:(1)确定线性相关关系线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系.判断是否线性相关的依据是观察样本点的散点图或计算相关系数.(2)回归方程的预报精度简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.知识网络要点梳理思考辨析2.独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算统计量χ2的值,最后由χ2的值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:根据2×2列联表计算|ad-bc|,值越大关系越强;(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.知识网络要点梳理思考辨析判断下列说法是否正确,正确的在后面的括号内打“√”,错误的打“×”.(1)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系.()(2)在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图.()(3)散点图是判断两个变量是否相关的一种重要方法和手段.()(4)任何一组观测值都能得到具有代表意义的回归直线方程.()(5)具有相关关系的两个变量是非确定关系.()(6)散点图中的点越集中,两个变量的线性相关性越强.()(7)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()知识网络要点梳理思考辨析(8)若两个变量具有线性相关关系,则线性回归方程最能代表观测值x,y之间的关系.()(9)回归直线方程y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(10)对于分类变量X与Y,它们的随机变量χ2的值越小.“X与Y有关联”的把握程度越大.()答案:(1)×(2)×(3)√(4)×(5)√(6)×(7)√(8)×(9)×(10)×专题归纳高考体验专题一回归分析思想的应用【例1】某厂节能技术改造后,生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据如表所示.x3456y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(2)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?专题归纳高考体验解:(1)∑𝑖=14xiyi=66.5,∑i=14𝑥𝑖2=32+42+52+62=86,𝑥=4.5,𝑦=3.5,b=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a=𝑦-b𝑥=3.5-0.7×4.5=0.35,所求的回归方程为y=0.7x+0.35.(2)当x=100时,y=0.7×100+0.35=70.35.预测生产100吨甲产品的生产能耗比技术改造前降低90-70.35=19.65(吨标准煤).专题归纳高考体验反思感悟1.正确理解计算b,a的公式和准确地计算是求线性回归方程的关键.2.回归直线方程y=bx+a必过样本点中心.3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.(𝑥,𝑦)专题归纳高考体验变式训练1以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据.房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)求线性回归方程;(2)根据(1)的结果估计当房屋面积为150m2时的销售价格.解:(1)𝑥=15×(115+110+80+135+105)=109,𝑦=15×(24.8+21.6+18.4+29.2+22)=23.2.设所求回归直线方程为y=bx+a,则b=3081570≈0.1962,∴a=𝑦-b𝑥=23.2-109×3081570≈1.8166.∴所求回归直线方程为y=0.1962x+1.8166.(2)由第(1)问可知,当x=150m2时,销售价格的估计值为y=0.1962×150+1.8166=31.2466(万元).专题归纳高考体验专题二独立性检验应用【例2】为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查.得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数525302515表2:女生上网时间与频数分布表上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数1020402010专题归纳高考体验(1)从这200名学生中任抽1人,求上网时间在[50,60)间的概率.(2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”?上网时间少于60分钟上网时间不少于60分钟合计男生女生合计附:χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)P0.1000.0500.0250.0100.005χ22.7063.8415.0246.6357.879专题归纳高考体验思路分析:(1)根据古典概型求概率.(2)列2×2列联表,计算χ2确定把握度.解:(1)男女上网时间在[50,60)间的人数为30+40=70,由频率知为其概率.(2)70200=720上网时间少于60分钟上网时间不少于60分钟合计男生6040100女生7030100合计13070200χ2=200×(1800-2800)2100×100×130×70=20091≈2.20,∵χ2≈2.202.706.∴没有90%的把握认为“大学生上网时间与性别有关”.专题归纳高考体验反思感悟1.独立性检验的关键是正确列出2×2列联表,并计算出χ2的值.2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.专题归纳高考体验变式训练2某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:赞同反对总计男198217415女476109585总计6743261000根据表中数据,能否有99%的把握认为对这一问题的看法与性别有关系?解:假设“对这一问题的看法与性别无关”,由列联表中的数据,可以得到:χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)=1000×(198×109-217×476)2415×585×674×326≈125.16110.828,故有99%的把握认为对“男女同龄退休”这一问题的看法与性别有关.专题归纳高考体验专题三数形结合思想【例3】某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:月人均收入x(元)300390420520570月人均生活费y(元)255324335360450月人均收入x(元)7007608008501080月人均生活费y(元)520580600630750(1)作出散点图;(2)求出线性回归方程;(3)试预测月人均收入为1100元和月人均收入为1200元的两个家庭的月人均生活费.专题归纳高考体验解:(1)作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系.(2)通过计算可知𝑥=639,𝑦=480.4,∑𝑖=110xi2=4610300,∑i=110xiyi=3417560,∴b=∑𝑖=110𝑥𝑖𝑦𝑖-10𝑥·𝑦∑𝑖=110𝑥𝑖2-10𝑥2≈0.6599,a=𝑦-b𝑥=58.7239,∴线性回归方程为y=0.6599x+58.7239.专题归纳高考体验(3)由以上分析可知,我们可以利用线性回归方程y=0.6599x+58.7239来计算月人均生活费的预测值.将x=1100代入,得y≈784.61,将x=1200代入,得y≈850.60.故预测月人均收入分别为1100元和1200元的两个家庭的月人均生活费分别为784.61元和850.60元.反思感悟通过散点图可以判断回归方程的大致类型和相关关系的强弱.专题归纳高考体验变式训练3假设某农作物基本苗数x与有效穗数y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)作出散点图;(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗数.专题归纳高考体验解:(1)散点图如图所示.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程来建立两个变量之间的关系.设线性回归方程为y=bx+a,由表中数据可得b≈0.291,故所求的线性回归方程为y=0.291x+34.67.当x=56.7时,y=0.291×56.7+34.67=51.1697.估计有效穗数为51.1697.a=𝑦-b𝑥≈34.67,专题归纳高考体验专题四转化与化归思想在回归分析中的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,那么我们可以通过对变量进行变换,转化为线性相关问题.【例4】某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出y对x的回归方程.1𝑥专题归纳高考体验解:把1𝑥置换为z,则有z=1𝑥,从而z与y的数据为z10.50.3330.20.10.050.0330.020.010.005y10.155.524.082.852.111.621.411.301.211.15可作出散点图(图略),从图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.𝑧=110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.2251,𝑦=110×(10.15+5.52+4.08+…+1.15)=3.14,∑𝑖=110zi2=12+0.52+0.3332+…+0.012+0.0052≈1.415,∑i=110ziyi=1×10.15+0.5×5.52+…+0.005×1.15=15.22102,专题归纳高考体验所以b=∑𝑖=110𝑧𝑖𝑦𝑖-10𝑧𝑦∑𝑖=110𝑧𝑖2-10𝑧2≈8.976,a=𝑦-b𝑧=3.14-8.976×0.2251≈1.120,所以所求的z与y的线性回归方程为y=8.976z+1.120.又因为z=1𝑥,所以y=8.976𝑥+1.120.反思感悟若两个变量非线性相关,可以先通过散点图观察确定用幂函数、指数函数、对数函数、二次函数模型来拟合两个变量间的关系,再通过变换转化为线性相关问题.专题归纳高考体验变式训练4