2021高考数学一轮复习 第10章 算法初步、统计与统计案例 第4节 变量间的相关关系、统计案例课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章算法初步、统计与统计案例第四节变量间的相关关系、统计案例2[最新考纲]1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及简单应用.3课前自主回顾41.相关性(1)线性相关若两个变量x和y的散点图中,所有点看上去都在附近波动,则称变量间是线性相关的.(2)非线性相关若所有点看上去都在附近波动,则称此相关为非线性相关的.某条曲线(不是一条直线)一条直线5(3)不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.62.最小二乘估计(1)最小二乘法如果有n个点(x1,y1),(x2,y2),…,(xn,yn)可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:.使得上式达到的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2最小值7(2)线性回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的线性回归方程,其中a,b是待定参数.83.回归分析(1)定义:对具有的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,___________称为样本点的中心.相关关系(x,y)9(3)相关系数r①r=i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny2;②当r0时,称两个变量.当r0时,称两个变量.当r=0时,称两个变量.正相关线性不相关负相关104.独立性检验若一个2×2列联表为:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d11则统计量χ2为:χ2=_________________________.(1)当χ2≤2.706时,可以认为变量A,B是的;(2)当χ22.706时,有的把握判定变量A,B有关联;(3)当χ23.841时,有的把握判定变量A,B有关联;(4)当χ26.635时,有的把握判定变量A,B有关联.没有关联90%95%99%nad-bc2a+bc+da+cb+d12[常用结论]1.线性回归方程y=bx+a一定过样本点的中心(x,y).2.由回归直线求出的数据是估算值,不是精确值.13一、思考辨析(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)只有两个变量有相关关系,所得到的回归模型才有预测价值.()14(3)回归直线方程y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(4)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.()[答案](1)√(2)√(3)×(4)×15二、教材改编1.下面是2×2列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A.94,72B.52,50C.52,74D.74,52C[∵a+21=73,∴a=52.又a+22=b,∴b=74.]162.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4A[因为变量x和y正相关,排除选项C,D.又样本中心(3,3.5)在回归直线上,排除B,选项A满足.]173.已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为y^=0.95x+a^,则a^=________.x0134y2.24.34.86.72.6[∵回归直线必过样本点的中心(x,y),又x=2,y=4.5,代入回归方程,得a^=2.6.]184.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:理科文科男1310女72019已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2的观测值为50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.205%[χ2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.]21课堂考点探究22⊙考点1变量间的相关关系的判断判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关;r0时,负相关.(3)线性回归方程中:b^0时,正相关;b^0时,负相关.231.观察下列各图形,①②③④其中两个变量x,y具有相关关系的图是()A.①②B.①④C.③④D.②③24C[图形③具有正线性相关关系,图形④具有非线性相关关系,故选C.]252.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关26C[因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^>0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.]273.某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()28A.r4<r2<0<r1<r3B.r2<r4<0<r1<r3C.r2<r4<0<r3<r1D.r4<r2<0<r3<r129C[根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条直线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关;故r10,r30;r20,r4<0;又(1)与(2)中散点图更接近于一条直线,故r1r3,r2r4,因此,r2r40r3r1,故选C.]30(1)变量间的相关关系分线性相关关系和非线性相关关系,如T1.(2)对相关系数r来说,|r|越接近于1,散点图越接近于一条直线,如T3.31⊙考点2线性回归分析线性回归分析问题的类型及解题方法(1)求回归方程①利用公式,求出回归系数b^.②利用回归直线过样本点的中心求系数a^.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.32(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.33下图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2012~2018.34(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2020年我国生活垃圾无害化处理量.35附注:参考数据:∑7i=1yi=9.32,∑7i=1tiyi=40.17,∑7i=1yi-y2=0.55,7≈2.646.36回归方程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为:37[解](1)由折线图中数据和附注中参考数据得38因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.39(2)由y=9.327≈1.331及(1)得所以y关于t的回归方程为40y^=0.93+0.10t.将2020年对应的t=9代入回归方程得y^=0.93+0.10×9=1.83.所以预测2020年我国生活垃圾无害化处理量约为1.83亿吨.41在计算时,应根据所给数据对公式进行合理变形,如421.经过对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:记忆能力x46810识图能力y3568由表中数据,求得线性回归方程为y^=45x+a^,若某中学生的记忆能力为14,则该中学生的识图能力为()A.7B.9.5C.11.1D.1243C[x的平均数x=14(4+6+8+10)=284=7,y的平均数y=14(3+5+6+8)=224=112=5.5,回归方程过点(x,y),即(7,5.5),则5.5=0.8×7+a^,得a^=-0.1,则y^=0.8x-0.1,则当x=14时,y=0.8×14-0.1=11.2-0.1=11.1,即该中学生的识图能力为11.1,故选C.]442.二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x234567售价y201286.44.43z=lny3.002.482.081.861.481.1045z关于x的折线图,如图所示:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少.(b^,a^小数点后保留两位有效数字)464748[解](1)由题意,知x=16×(2+3+4+5+6+7)=4.5,z=16×(3+2.48+2.08+1.86+1.48+1.10)=2,∴r=47.64-6×4.5×24.18×1.53=-6.366.3954≈-0.99,∴z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.49(2)b^=47.64-6×4.5×2139-6×4.52=-6.3617.5≈-0.36,∴a^=z-b^x=2+0.36×4.5=3.62,∴z与x的线性回归方程是z^=-0.36x+3.62,又z=lny,∴y关于x的回归方程是y^=e-0.36x+3.62.50令x=9,得y^=e-0.36×9+3.62=e0.38,∵ln1.46≈0.38,∴y^=1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.51⊙考点3独立性检验独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式χ2=nad-bc2a+bc+da+cb+d,计算χ2的观测值k的值;(3)查表比较χ2的观测值k与临界值的大小关系,作统计判断.52(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客302053(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:χ2=nad-bc2a+bc+da+cb+dP(χ2≥k)0.0500.0100.001k3.8416.63510.82854[解](1)由调查数据知,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.55(2)χ2的观测值k=100×40×20-30×10250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.56对于“估计概率”问题,一般是用频率代替概率.57(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:5859(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功