第三节变量间的相关关系与统计案例(1)一、基础知识批注——理解深一点1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是________,另一类是________;与函数关系不同,相关关系是一种非确定性关系.体现的不一定是因果关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________;点散布在左上角到右下角的区域内,两个变量的这种相关关系为________2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为y^=b^x+a^,其中b^=________=________,a^=y-b^x.回归直线y^=b^x+a^必过样本点的中心x,y,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(3)通过求Q=i=1nyi-bxi-a2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量________;当r<0时,表明两个变量________r的绝对值越接近于1,表明两个变量的线性相关性________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验:利用随机变量K2(也可表示为χ2)的观测值k=nad-bc2a+bc+da+cb+d(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、常用结论汇总——规律多一点(1)求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点(x,y).(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.(3)根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.三、基础小题强化——功底牢一点一判一判对的打“√”,错的打“×”(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)回归直线方程y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()(二)选一选:1.已知变量x和y满足关系y^=-0.1x+1,变量y^与z正相关.则下列结论中正确的是()A.x与y^负相关,x与z负相关B.x与y^正相关,x与z正相关C.x与y^正相关,x与z负相关D.x与y^负相关,x与z正相关2.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25(三)填一填3.已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为y^=0.95x+a^,则a^=__.x0134y2.24.34.86.74.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.考点一回归分析考法(一)求线性回归方程[典例](2019·湘东五校联考)已知具有相关关系的两个变量x,y的几组数据如下表所示:x246810y3671012(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^,并估计当x=20时y的值.