变量间的相关关系变量之间的相关关系►变量之间也存在很多关系,看下面的例子1、公鸡打鸣与太阳升起2、数学成绩与物理成绩3、龙生龙、凤生凤、老鼠儿子打地洞(生物意义上解释)4、某数列满足an+1=2an+1中,a1与a5的关系5、三角形三边长与三角形面积的关系6、父亲和儿子的身高体重7、你是学数学的?那你很聪明哦。►这些变量之间的关系,你能分类说明吗?变量之间的相关关系►确定关系:(3)(4)(5)一个量确定,另一个也确定特殊确定关系:函数关系►相关关系:(1)(2)(6)(7)两个变量是有关联的,但关系不确定著名案例:吸烟与肺癌有关?常见的说法:数学好,物理肯定没有问题►客观现象之间存在的互相依存关系叫相关关系,全称为统计相关关系,两个特点:1.现象之间确实存在着数量上的依存关系2.现象之间数量上的关系是不确定、不严格的依存关系相关关系与函数关系的异同►相同点:均是两个变量之间的关系。►不同点:(1)函数关系是确定性关系,相关关系是一种非随机变量与随机变量之间的关系,非确定性关系。(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是一种伴随关系。如儿童鞋子的大小与阅读能力之间有很强的相关关系,然而不会因多记住几个新词汇脚脚变大,而是涉及到第三个因素-年龄。当儿童长大一些,阅读能力会有所提高,当然随着身体的长大,脚也变大。回归分析►由于相关关系的不确定性,在寻找变量之间的相关关系的过程中,统计发挥着重要作用。我们可以通过收集大量的数据,在对数据分析统计的基础上,发现其中的规律,对它们之间的关系做出判断。►对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析就是寻找相关关系中非确定关系的某种确定性。线性相关——最简单的相关关系►在一次对人体脂肪含量和年龄关系的研究,获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6思考1:年龄与脂肪含量有没有关系?依据是什么?思考2:有没有更加定量的分析方法,进行定量研究?散点图►在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图051015202530354020253035404550556065年龄脂肪含量►上例中散点图从左下角到右上角,即一个变量从小到大变化时,另一个变量小大到大变化。这种关系称为正相关关系。否则称为负相关关系。思考1:上述散点图能否给我们的思考1提供理论支持?思考2:上述散点图还有什么样的特点?回归直线►若散点图中各点大致分布在一条直线附近,就称这两个变量具有线性相关关系,这条直线叫做回归直线►显然根据不同标准可以画出不同直线来近似表示这种线性关系。那么在这众多的直线中哪个(或哪些)最能表示这种线性关系?阅读课本87页的几种想法►考虑两点:合理性和操作性►各点与直线的整体偏差最小,实际值与理论上值得偏差最小符号说明及思想.,,,,..ˆ,,),,,(.ˆ,ˆ.bababxayxyynixxyyybxayiiiii关键是求回归系数求回归直线方程叫做回归系数的纵坐标是对于而直线上相应的观察值为时的取值为即当的实际取值是为了区别于这里设回归直线方程为2211niiiniiiiiiiiiiiiiiiyyyyyynyybxayyybxayyynixx121654213.)ˆ(,..ˆ,,ˆ..ˆ..)(ˆ,ˆ,,),,,(.最终改用为运算方便来表示用为了避免互相抵消可正可负由于小个偏差构成的总偏差最的与希望来刻画偏差用上的对应回归直线的观察值为时的取值为当最小二乘法取值如下:取最小值时可求得应用配方法二次多项式的展开后是关于设baQbabxayyyQniniiiii,,,,,,)()ˆ(11221122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnx►上述方法称为最小二乘法►回归直线方程是否过定点?你知道是哪个点吗?).,(,)(ˆ,,ˆyxyxxbxbybxyxbyaabxy所以回归直线方程过点代入得线性回归方程计算步骤►第一步,计算平均数►第二步,求和►第三步,计算►第四步,写出回归方程xy1niiixy21niix1122211()(),()nniiiiiinniiiixxyyxynxybaybxxxxnxbxayˆ高考不允许使用计算器,为了减少计算错误,建议采用列表的方式分步计算i12……nxix1x2……xnyiy1y2……ynxiyix1y1x2y2……xnynxi2x12x22……xn2xy1niiixy21niix关于回归方程的几点思考►如果给出了,当某人37岁时,代表什么?►能不能说,当我到了37岁时,体内脂肪含量一定是20.90%?►如果随便给出任意关系的两个变量的一组数据,能否也用上述方法求出回归直线方程?有没有意义?448.0577.0ˆxy课本例题:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响。经过统计,得到一个卖出的饮料杯数与当天气温对比表:温度(℃)-504712杯数15615013212813015192327313611610489937654(1)画出散点图;(2)从散点图中发现气温与热饮杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数.练习►1.已知关于某设备的使用年限x和所支出的维修费y(万元)有如下统计资料:(1)画出散点图并判断两变量是否成线性关系?(2)求回归直线方程并预测使用年限为10年时维修费用。解:(1)做出散点图如下:由图中可以看出两变量成线性关系。(2)根据公式可求得1.23,0.08ba故所求回归直线方程为0.081.23yx当x=10时,y=12.38(万元)变量间的相关关系习题部分知识点回顾►两个变量的线性相关(对具有相关关系的两个变量进行统计分析的方法叫回归分析,回归分析是寻找相关关系中非确定性关系的某种确定性)►散点图(将样本中n个数据点描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形)►最小二乘法►线性回归方程xbyaxnxyxnyxbbxayniiniii1221,^线性回归方程►1.线性回归方程表示的直线必定过()A.点B.点C.点D.点►2、为了考查两个变量x、y之间的线性相关性,A、B两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别是l1、l2,已知两人所得的试验数据中,变量x、y的数据的平均值都相等,且分别都是s、t,那么下列说法正确的是())0,0(),0(y)0,(x),(yxA.直线l1和l2一定有公共点(s、t)B.直线l1和l2相交,但交点不一定是(s、t)C.必有l1∥l2D.l1与l2必定重合最小二乘法►下列说法正确的有()1)最小二乘法指的是把各个离差加起来作总离差,并使之达到最小值的方法;2)最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;3)线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;4)因为由任何一组观测值都可以求得一个回归直线方程,所以没必要进行相关性检验;07广东高考的一道出人意料的题解:(1)做出散点图如下:(2)根据散点图可知变量x和y成线性关系,根据表格数据可求得4421112214.5,3.5,66.5,860.7,0.35iiiiiniiiniixyxyxxynxybaybxxnx故所求回归直线方程为0.70.35yx(3)当x=100时,y=0.7×100+0.35=70.35,故可降低90-70.35=19.65(吨)煤。