§11.3变量间的相关关系、统计案例数学RA(理)第十一章统计、统计案例基础知识·自主学习难点正本疑点清源要点梳理1.两个变量的线性相关(1)正相关在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从到的区域,两个变量的这种相关关系称为负相关.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.1.相关关系与函数关系的区别左下角右上角左上角右下角基础知识·自主学习难点正本疑点清源要点梳理(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的的方法叫做最小二乘法.相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.1.相关关系与函数关系的区别一条直线附近距离的平方和最小基础知识·自主学习难点正本疑点清源要点梳理(2)回归方程方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数.回归分析是处理变量相关关系的一种数学方法,它主要解决三个问题:(1)确定两个变量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式,否则求出的回归方程没有意义;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.对回归分析的理解基础知识·自主学习难点正本疑点清源要点梳理3.回归分析(1)定义:对具有的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中(x,y)称为样本点的中心.(3)相关系数当r0时,表明两个变量;当r0时,表明两个变量.回归分析是处理变量相关关系的一种数学方法,它主要解决三个问题:(1)确定两个变量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式,否则求出的回归方程没有意义;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.对回归分析的理解相关关系正相关负相关基础知识·自主学习难点正本疑点清源要点梳理r的绝对值越接近于1,表明两个变量的线性相关性.r的绝对值越接近于0,表明两个变量之间.通常|r|大于时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.回归分析是处理变量相关关系的一种数学方法,它主要解决三个问题:(1)确定两个变量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式,否则求出的回归方程没有意义;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.对回归分析的理解越强几乎不存在线性相关关系0.75不同类别基础知识·自主学习难点正本疑点清源要点梳理(2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d频数表(1)独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式计算K2的值;③比较K2与临界值的大小关系作统计推断.(2)K2的值可以确定在多大程度上可以认为“两个分类变量有关系”;K2值越大,认为“两个分类变量有关系”的把握越大.3.独立性检验的理解基础知识·自主学习难点正本疑点清源要点梳理构造一个随机变量K2=,其中n=为样本容量.(3)独立性检验利用随机变量来判断“两个分类变量”的方法称为独立性检验.(1)独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式计算K2的值;③比较K2与临界值的大小关系作统计推断.(2)K2的值可以确定在多大程度上可以认为“两个分类变量有关系”;K2值越大,认为“两个分类变量有关系”的把握越大.3.独立性检验的理解nad-bc2a+bc+da+cb+da+b+c+dK2有关系题号答案解析12345D基础知识·自主学习基础自测2.60.254AD题型分类·深度剖析题型一两个变量间的相关关系【例1】5个学生的数学和物理成绩如下表:画出散点图,并判断它们是否具有相关关系.解析思维启迪探究提高学生学科ABCDE数学8075706560物理7066686462题型分类·深度剖析题型一将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系.解析思维启迪探究提高两个变量间的相关关系【例1】5个学生的数学和物理成绩如下表:画出散点图,并判断它们是否具有相关关系.学生学科ABCDE数学8075706560物理7066686462【例1】5个学生的数学和物理成绩如下表:画出散点图,并判断它们是否具有相关关系.学生学科ABCDE数学8075706560物理7066686462题型分类·深度剖析题型一解析思维启迪探究提高两个变量间的相关关系解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.题型分类·深度剖析题型一判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.解析思维启迪探究提高两个变量间的相关关系【例1】5个学生的数学和物理成绩如下表:画出散点图,并判断它们是否具有相关关系.学生学科ABCDE数学8075706560物理7066686462变式训练1对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关题型分类·深度剖析题型分类·深度剖析解析由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关.题型分类·深度剖析题型二线性回归分析思维启迪解析探究提高【例2】(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)题型分类·深度剖析题型二根据回归直线过样本点中心来求线性回归方程,然后利用回归方程求最大利润.思维启迪解析探究提高线性回归分析【例2】(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【例2】(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)题型分类·深度剖析题型二思维启迪解析探究提高解(1)由于x=16(8+8.2+8.4+8.6+8.8+9)=8.5,y=16(90+84+83+80+75+68)=80,又b^=-20,所以a^=y-b^x=80+20×8.5=250,线性回归分析从而线性回归方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.题型分类·深度剖析题型二回归直线过样本点中心(x,y)是一条重要性质;利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.思维启迪解析探究提高线性回归分析【例2】(2012·福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)题型分类·深度剖析变式训练2(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.解析小李这5天的平均投篮命中率y=0.4+0.5+0.6+0.6+0.45=0.5,可求得小李这5天的平均打篮球时间x=3.根据表中数据可求得b^=0.01,a^=0.47,故线性回归方程为y^=0.01x+0.47,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.0.50.53【例3】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.题型分类·深度剖析题型三独立性检验思维启迪解析探究提高题型分类·深度剖析题型三直接计算K2的值,然后利用表格下结论.思维启迪解析探究提高【例3】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.独立性检验【例3】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样