当前位置:首页 > 商业/管理/HR > 公司方案 > 《2.3.1+2变量之间的相关关系、两个变量的线性相关》ppt课件
成才之路·数学路漫漫其修远兮吾将上下而求索人教A版·必修3统计第二章2.3变量间的相关关系第二章2.3.1变量之间的相关关系2.3.2两个变量的线性相关•互动课堂•2•随堂测评•3•课后精练•4•预习导学•1预习导学●课标展示1.了解相关关系、线性相关、回归直线、最小二乘法的定义.2.会作散点图,能判断两个变量之间是否具有相关关系.3.会求回归直线方程,并能用回归直线方程解决有关问题.●温故知新旧知再现1.下列数字特征一定是样本数据中的数据是()A.众数B.中位数C.标准差D.平均数[答案]A2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A.平均数中位数众数B.平均数中位数众数C.中位数众数平均数D.众数=中位数=平均数[答案]D3.某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均数为________,方差为________.[答案]7050[解析]因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2=148[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=148[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.新知导学1.相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从_______角到_______角的区域,那么这两个变量的相关关系称为负相关.随机左下右上左上右下[归纳总结]两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.2.线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条_______附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做___________.(2)最小二乘法:求线性回归直线方程y^=b^x+a^时,使得样本数据的点到它的______________最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:距离的平方和直线回归直线b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2a^=y--b^x-,其中,b^是回归方程的_________,a^是回归方程在y轴上的_________.斜率截距[破疑点]线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.●自我检测1.下列语句所表示的事件中的因素不具有相关关系的是()A.瑞雪兆丰年B.上梁不正下梁歪C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧[答案]D[解析]选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.规律总结:函数关系是一种确定性关系,相关关系是一种非确定性关系,判断两个变量间的关系是否为相关关系的关键是看这个关系是否具有不确定性.2.观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应的是()A.①②③B.②③①C.②①③D.①③②[答案]D3.下列有关回归方程y^=b^x+a^的叙述正确的是()①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①②B.②③C.③④D.①④[答案]D[解析]y^=b^x+a^表示y^与x之间的函数关系,而不是y与x之间的函数关系.但它所反映的关系最接近y与x之间的真实关系.故选D.规律总结:回归直线是对原数量关系的一种拟合,如果两个变量不具有线性相关关系,即使求出回归方程也是毫无意义的,而且由其得到估计和预测的值也是不可信的.•互动课堂变量之间的相关关系的判断●典例探究(1)下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量(2)现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:学号12345678910x12010811710410311010410599108y84648468696869465771请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系.[分析]1.判断两个变量之间具有相关关系的关键是什么?2.利用散点图判断两个变量是否具有相关关系的依据是什么?[解析](1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,匀通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A.(2)两次数学考试成绩散点图如图所示,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系.[答案](1)A规律总结:两个变量x与y相关关系的判断方法:(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.(2)表格、关系式法:结合表格或关系式进行判断;(3)经验法:借助积累的经验进行分析判断.[特别提醒]如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案]C[解析]图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关.回归直线方程随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如下的数据资料:使用年限x23456总费用y2.23.85.56.57.0若由资料,知y对x呈线性相关关系.试求:(1)线性回归方程y^=b^x+a^的回归系数a^、b^;(2)估计使用年限为10年时,车的使用总费用是多少?[分析]第一步,列表xi,yi,xiyi;第二步,计算x-,y-,i=1nx2i,i=1ny2i,i=1nxiyi;第三步,代入公式计算b,a的值;第四步,写出回归直线方程.(1)利用公式:b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2a^=y--b^x-,来计算回归系数.有时为了方便常列表,对应列出xiyi、x2i,以利于求和.(2)获得线性回归方程后,取x=10,即得所求.[解析](1)列表:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0x2i49162536x-=4,y-=5,i=15x2i=90,i=15xiyi=112.3于是b^=112.3-5×4×590-5×42=12.310=1.23;a^=y--bx-=5-1.23×4=0.08.(2)线性回归直线方程是y^=1.23x+0.08,当x=10(年)时,y^=1.23×10+0.08=12.38(万元),即估计使用10年时,支出总费用是12.38万元.规律总结:求回归直线方程的一般步骤:①收集样本数据,设为(xi,yi),(i=1,2,…,n)(数据一般由题目给出).②作出散点图,确定x,y具有线性相关关系.③把数据制成表格xi,yi,x2i,xiyi.④计算x,y,i=1nx2i,i=1nxiyi,⑤代入公式计算b^,a^,公式为b^=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y-b^x-.⑥写出回归直线方程y^=b^x+a^.(1)(2013~2014·石家庄高二检测)已知回归直线的斜率的估计值是1.23,样本点中心(即(x,y))为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23(2)某公司的广告费支出x(单位:万元)与销售额x(单位:万元)之间有下列对应数据:x24568y3040605070资料显示y对x呈线性相关关系.根据上表提供的数据得到回归方程y^=b^x+a^中的b^=6.5,预测销售额为115万元时约需________万元广告费.[答案](1)C(2)15[解析](1)由题意知,可设此回归直线的方程为y^=1.23x+a^,又因为回归直线必过点(x,y),所以点(4,5)在直线y^=1.23x+a^上,所以5=1.23×4+a^,a^=0.08,故回归直线的方程是y^=1.23x+0.08.(2)x=2+4+5+6+85=5,y=30+40+60+50+705=50.因为回归方程过样本中心(5,50),代入y^=6.5x+a^,得a^=17.5,所以y^=6.5x+17.5,当y^=115时,x=15.●误区警示有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童年数量,如下表:人均GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归直线方程为y^=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?[错解](1)根据表中数据画散点图,如图所示,从图可以看出,虽然后5个点大致分布在一条直线的附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关关系.(2)将x=12代入y^=23.25x+102.15,得y^=23.25×12+102.15=381.15380.所以上述断言是正确的.[错因分析]在第(1)问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局的”,所以可断定这两个变量具有线性相关关系.在第(2)问中,381.15只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人,如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护得得很好,则人数就有可能远远低于380.[正解](1)根据表中数据画散点图,如图所示,从圈可以看出,在6个点中,虽
本文标题:《2.3.1+2变量之间的相关关系、两个变量的线性相关》ppt课件
链接地址:https://www.777doc.com/doc-4259085 .html