2011高中数学总复习课件:变量间的相关关系、统计案例

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1.下列两变量具有相关关系的是()A.正方体的体积与边长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力A、B均为函数关系,D则无相关关系,选C.C2.对两个变量y和x进行回归分析,得到一组样本数据(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程=bx+a必过点()B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系,xyˆyC相关指数刻画回归效果,相关指数R2越大,说明模型的拟合效果越好,所以C错误,选C.易错点:相关指数R2的功能理解.3.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m1061151103则哪位同学的试验结果体现A、B两变量更强的线性相关性.()A.甲B.乙C.丙D.丁因为0.850.820.780.69,由相关系数r的含义知,丁具有更强的线性相关性,选D.易错点:残差平方和、相关系数r的区别.残差平方和可以刻画回归效果,相关系数用于判断两变量相关关系的强弱.D4.已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为.y=0.50×25-0.81=11.69.ˆy11.695.下面是一个2×2列联表y1y2合计x1a2173x222527总计b46100则表中a、b处的值分别为()A.94、96B.52、50C.52、54D.54、52由a+21=73,a+2=b,解得a=52,b=54,故选C.易错点:2×2列联表的意义.C1.变量间的相关关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种非确定关系.2.两个变量的线性相关(1)从散点图上看,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)直线方程为=bx+a,其中,回归直线系数a,b的值可以由下列公式给出:(3)通过求的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.1122211().nniiiiiinniiiixxyyxynxybaybxxxxnx,ˆyn2i1Qiiybxa3.回归分析(1)在统计中,对具有相关关系的两个变量进行统计分析叫做回归分析.回归分析是寻找相关关系中非确定关系的某种确定性.(2)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计公式分别为:其中称为样本点的中心.121()()ˆˆ,()niiiniixxyybabxxx,1111,,(,)nniiiixxyyxynn4.独立性检验(1)变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量.(2)一般地,假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表如下表:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d称为2×2列表(3)利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.其中22.nadbcKabacbdcd重点突破:两个变量的线性相关性、散点图某学校5个学生的数学和物理成绩如下表:例1ABCDE数学成绩8075706560物理成绩7066686462判断它们是否有相关关系.可以以数学成绩为自变量x,考察因变量物理成绩y的变化趋势,作出散点图,从而作出判断.以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:由散点图可见,图中的点大致在一条直线附近,故两者之间具有相关关系.另解:=80×70+75×66+70×68+65×64+60×62=23190,807570656070,5x7066686462665y,52222221807570656024750iix,52222221706668646221820iiy,51iiixy所以,相关系数为由0.90.75知,数学考试成绩和物理考试成绩有显著性的线性相关关系.222319057066r0.9(24750570)(21820566),变量之间是否具有线性相关性,直观的方法就是作出散点图,如果散点图中的点呈现在一条直线附近,说明两个变量之间具有线性相关.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.另外,利用相关系数进行研究,若相关系数r0.75,认为两个变量之间具有很强的线性关系.某某公司利润y与销售总额x(单位:千万元)之间有如下对应数据:变式练习1x10151720252832y11.31.822.62.73.3判断y与x散点图如下:由散点图可以看出利润随销售总额的增加而增大,它们之间不仅具有相关关系,而且是正相关.重点突破:线性回归分析一机器可以按各种不同速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多少,随机器运转的速度而变化.下列即为试验结果:例2速度(转/秒)每小时生产有问题物件数851281491611(Ⅰ)求出机器运转速度影响每小时生产有问题物件数的回归直线方程;(Ⅱ)若实际生产中所允许机器每小时生产的最大问题物件数为10,那么,机器的运转速度不得超过多少转/秒?本题已默认“运转速度”与“有问题的物件数”两变量具有线性相关关系,故可以直接根据求回归方程的一般步骤求解.(Ⅰ)用x表示机器运转速度,y表示每小时生产的有问题的物件数,则有(x1,y1)=(8,5),(x2,y2)=(12,8),(x3,y3)=(14,9),(x4,y4)=(16,11),故所以回归直线的斜率为截距所以回归直线方程为=0.7286x-0.8575.12.5,8.25,xy41422144iiiiixyxybxx0.7286,0.8575,aybxˆy(Ⅱ)由≤10,得0.7286x-0.8575≤10,所以x≤14.9013.即机器的运转速度不能超过14.9013转/秒.求出回归直线方程后,往往用来作为观实生产中的变量之间相关关系的近似关系,从而可以用来指导生产实践.ˆy研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:(Ⅰ)求y对x的回归直线方程;(Ⅱ)预测水深为1.95m时水的流速是多少?变式练习2水深x(m)1.401.501.601.701.801.902.002.10流速y(m/s)1.701.791.881.952.032.102.162.21(Ⅰ)作出散点图,如图所示由散点图可观察到大致在一条直线上,所以可用线性回归方程来拟合它.所以b≈0.733,所以y对x的回归直线方程为y=0.6948+0.733x.8822111.75,1.9775,24.92,iiiixyxy8131.5116,27.993iiixy,1.97750.733aybx1.750.6948,(Ⅱ)在本题中回归系数b=0.733的意思是:在此灌溉渠道中,水深每增加0.1m,水的流速平均增加0.733m/s,a=0.6948可以解释为水的流速中不受水深影响的部分,把x=1.95代入得到y=0.6948+0.733×1.95≈2.12m/s,计算结果表明:当水深为1.95m时可以预报渠水的流速约为2.12m/s.例3重点突破:独立性检验下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总汁146684830(Ⅰ)这种传染病是否与饮用水的卫生程度有关,请说明理由;(Ⅱ)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人,按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.判断两个分类变量是否有关,可以通过作出等高条形图及K2公式的应用.但从图形上只可以粗略的估计两个分类变量的关系,它不能给我们两个分类变量有关或无关的精确的判断,若要作出精确的判断,可以进行独立性检验的有关计算.本题要求比较两种样本在反映总体时的差异,故应选用K2公式的应用.(Ⅰ)假设传染病与饮用水无关,由公式计算得:因此我们有99.9%的把握认为该地区的传染病与饮用水有关.22830(5221846694)54.2110.828146684518312K(Ⅱ)依题意得2×2列联表:此时所以我们有90%的把握认为该地区的传染病与饮用不干净水有关.得病不得病总计干净水55055不干净水92231总计14728622865225095.7852.70614725531K()由上可知,两个样本都能得到传染病与饮用不干净的水有关这一相同的结论,但(Ⅰ)问中我们有99.9%的把握肯定结论的正确性,而(Ⅱ)问中我们只有90%的把握肯定结论的正确性.样本的不同(包括样本容量的不同)可能导致不同的结论,至少影响正确(或不正确)的程度.解答此类题目的关键在于正确利用公式计算K2的值,再利用临界值的大小关系来判断假设检验是否成立,从而把问题解决.22()nadbcKabacbdcd有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.变式练习3优秀非优秀总计甲班10乙班30合计105已知在全部105人中随机抽取1人为优秀的概率为.(Ⅰ)请完成上面的列联表;(Ⅱ)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”.27(Ⅰ)从全部105人中随机抽取1人为优秀的概率为,所以成绩优秀的总人数为×105=30,从而可得下表:2727优秀非优秀总计甲班104555乙班203050合计3075105(Ⅱ)根据列联表中的数据,得到因此有95%的把握认为“成绩与班级有关系”.2105(10302045)6.1093.84155503075k,为了对某市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学(已折算为百分制)、物理、化学分数对应如下表,例4学生编号12345678数学分数x6065707580859095理分数y7277808588909395化学分数z6772768084879092(Ⅰ)用变量y与x、z与x的相关系数说明物理与数学、化学与数学的相关程度;(Ⅱ)求y与x、z与x的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.参考数据:8211050iixx,882211456iiiiyyzz,8811()685()iiiiiixxyyxxzz,882211ˆˆ794105032.4,iiiiiiyyzz,,77.58581xyz,,,550,755,45621.4,55023.5.相关关系的强弱可以用回归模型的效果可由相关指数12211()niiinniiiixxyyrxxyy来描述.22121ˆ1niiiniiiyyRyy来刻画.(Ⅰ)变量y与x的相关系数分别是z与x的相关系数可以看出,物理与数学、化学与数学的成绩都是高度正相关.6850.9932.421.4r,7550.99.32.423.5r(Ⅱ)设y与x、z与x的线性回归方程分别是根据所给

1 / 63
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功