当前位置:首页 > 中学教育 > 高中教育 > 2023年高考数学二轮复习(全国版理) 第1部分 专题突破 专题5 第3讲 统计与统计案例
第3讲统计与统计案例[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、线性回归方程的求解与运用、独立性检验等问题,常与概率综合考查,中等难度.考点一用样本估计总体核心提炼1.用样本的频率分布估计总体的分布(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)在频率分布直方图中各小长方形的面积之和为1.2.用样本的数字特征估计总体的数字特征样本数据:x1,x2,…,xn.(1)标准差:样本数据到平均数的一种平均距离,s=1n[x1-x2+x2-x2+…+xn-x2].(2)方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2](xn是样本数据,n是样本容量,x是样本平均数).(3)若a0,数据ax1+b,ax2+b,…,axn+b的标准差为as,方差为a2s2.例1(1)某学校为了解男生身体发育情况,从2000名男生中抽查了100名男生的体重情况,根据数据绘制样本的频率分布直方图,如图所示,下列说法中错误的是()A.样本的众数约为6712B.样本的中位数约为6623C.样本的平均值约为66D.体重超过75kg的学生频数约为200人答案C解析对于A,样本的众数为65+702=6712,故A正确;对于B,设样本的中位数为x,则5×0.03+5×0.05+(x-65)×0.06=0.5,解得x=6623,故B正确;对于C,由直方图估计样本平均值可得57.5×0.15+62.5×0.25+67.5×0.30+72.5×0.20+77.5×0.10=66.75,故C错误;对于D,2000名男生中体重超过75kg的人数大约为2000×5×0.02=200,故D正确.(2)(2022·张家口模拟)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量比2020年的消费量增长了5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍答案D解析设2020年该地区一次能源消费总量为a,2020年煤的消费量为0.6a,规划2030年煤的消费量为a×2.5×0.3=0.75a0.6a,故A错误;2020年天然气的消费量为0.1a,规划2030年天然气的消费量为a×2.5×0.2=0.5a,增长了0.4a=4·0.1a,增长了4倍,故B错误;2020年石油的消费量为0.2a,规划2030年石油的消费量为a×2.5×0.2=0.5a0.2a,故C错误;2020年水、核、风能的消费量为0.1a,规划2030年水、核、风能的消费量为a×2.5×0.3=0.75a=7.5×0.1a,故D正确.规律方法利用频率分布直方图求众数、中位数与平均数.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.跟踪演练1(1)(2022·兰州模拟)2021年7月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》.各地积极推进“双减”工作,义务教育阶段学生负担得到有效减轻.下表是某校七年级10名学生“双减”前后课外自主活动时间的随机调查情况(单位:小时).学生编号12345678910“双减”前1.31.21.51.61.21.31.51.11.11“双减”后1.52.5231.522.40.91.41.2设“双减”前、后这两组数据的平均数分别是x1,x2,标准差分别是s1,s2,则下列关系正确的是()A.x2=x1+0.56,s1s2B.x2=x1+0.56,s1s2C.x2=x1+0.65,s1s2D.x2=x1+0.65,s1s2答案A解析x1=110×(1.3+1.2+1.5+1.6+1.2+1.3+1.5+1.1+1.1+1)=1.28,x2=110×(1.5+2.5+2+3+1.5+2+2.4+0.9+1.4+1.2)=1.84,所以x2=x1+0.56;由表格知,“双减”前的数据比较集中,“双减”后的数据比较分散,故“双减”前的标准差小于“双减”后的标准差,即s1s2.(2)(2022·赤峰模拟)如图所示的是国家统计局官网发布的2021年3月到2022年3月全国居民消费价格的涨跌幅情况.关于这个时间段的折线图,有下列说法:①所有月份的同比增长率都是正数;②环比增长率为正数的月份比为负数的月份多;③2021年9月到10月的同比增长率的增幅等于10月到11月的同比增长率的增幅;④同比增长率的极差为0.9.其中正确说法的个数为()A.1B.2C.3D.4答案C解析①显然正确;②环比增长率为正数的月份有6个,为负数的月份有5个,故②正确;③2021年9月到10月的同比增长率的增幅为1.5-0.7=0.8,10月到11月的同比增长率增幅为2.3-1.5=0.8,所以同比增长率的增幅相等,③的说法正确;④同比增长率的极差为2.3-0.4=1.9,所以④的说法错误.考点二回归分析核心提炼求线性回归方程的步骤(1)依据样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).(2)计算出x,y,a^,b^.(3)写出线性回归方程.例2(2022·长沙模拟)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:万人)的数据如下表:日期7月10日7月11日7月12日7月13日7月14日第x天12345人数y(单位:万人)75849398100(1)依据表中的统计数据,请判断该电商平台的第x天与到该电商平台专营店购物的人数y(单位:万人)是否具有较高的线性相关程度?(参考:若0.3|r|0.75,则线性相关程度一般,若|r|0.75,则线性相关程度较高,计算r时精确度为0.01)(2)求购买人数y与直播的第x天的线性回归方程;用样本估计总体,请预测从2022年7月10日起的第38天到该专营店购物的人数(单位:万人).参考数据:i=15(yi-y)2=434,i=15(xi-x)(yi-y)=64,4340≈65.879.附:相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2,线性回归方程的斜率b^=i=1nxi-xyi-yi=1nxi-x2,截距a^=y-b^x.解(1)由表中数据可得x=3,y=90,所以i=15(xi-x)2=10,又i=15(yi-y)2=434,i=15(xi-x)(yi-y)=64,所以r=i=15xi-xyi-yi=15xi-x2i=15yi-y2=644340≈0.970.75,所以该电商平台直播黄金时段的天数x与购买人数y具有较高的线性相关程度.(2)由表中数据可得b^=i=15xi-xyi-yi=15xi-x2=6410=6.4,则a^=y-b^x=90-6.4×3=70.8,所以y^=6.4x+70.8,令x=38,可得y^=6.4×38+70.8=314(万人).预测从2022年7月10日起的第38天到该专营店购物的人数为314万.易错提醒(1)样本点不一定在回归直线上,但点(x,y)一定在回归直线上.(2)求b^时,灵活选择公式,注意公式的推导和记忆.(3)利用相关系数判断相关性强弱,看|r|的大小,而不是r的大小.(4)区分相关系数r与相关指数R2.(5)通过线性回归方程求的都是估计值,而不是真实值.跟踪演练2(1)(2022·汕头模拟)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是()A.相关系数r变小B.残差平方和变大C.相关指数R2变小D.解释变量x与预报变量y的相关性变强答案D解析由散点图知,去掉离群点D后,解释变量x与预报变量y的相关性变强,且为正相关,所以相关系数r的值变大,相关指数R2的值变大,残差平方和变小.(2)(2022·重庆市育才中学模拟)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如表所示:x1015202530y1110865根据表中的数据可得线性回归方程y^=b^x+14.4,则以下正确的是________.(填序号)①相关系数r0;②b^=-0.32;③若该产品价格为35元/kg,则日需求量大约为3.2kg;④第四个样本点对应的残差为-0.4.答案②③④解析由表中的数据,x=10+15+20+25+305=20,y=11+10+8+6+55=8,将x,y代入y^=b^x+14.4得b^=-0.32,所以①错误,②正确;对③,由题意将x=35代入y^=-0.32x+14.4得y^=3.2,所以日需求量大约为3.2kg,所以③正确;对④第四个样本点对应的残差为y4-y^4=6-(-0.32×25+14.4)=-0.4,所以④正确.考点三独立性检验核心提炼独立性检验的一般步骤(1)根据样本数据列2×2列联表;(2)根据公式K2=nad-bc2a+bc+da+cb+d,计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.K2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.例3(2022·济宁模拟)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活做调查,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%.学校为了考查学生对寄宿生活适应与否是否与性别有关,构建了2×2列联表.不适应寄宿生活适应寄宿生活总计男生女生总计(1)请将2×2列联表补充完整,并判断能否有99%的把握认为“适应寄宿生活与否”与性别有关;(2)从男生中以“是否适应寄宿生活”为标准采用分层抽样的方法随机抽取10人,再从这10人中随机抽取2人,若所选2名学生中“不适应寄宿生活”的人数为X,求随机变量X的分布列及均值.附:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.P(K2≥k0)0.0250.010.001k05.0246.63510.828解(1)补充列联表如下:不适应寄宿生活适应寄宿生活总计男生83240女生322860总计4060100根据列联表中的数据,K2=100×8×28-32×32240×60×40×60≈11.1116.635,所以有99%的把握认为“适应寄宿生活与否”与性别有关.(2)抽取的10人中,有2人不适应寄宿生活,有8人适应寄宿生活,故随机变量X的取值可以是0,1,2,P(X=0)=C28C210=2845,P(X=1)=C18C12C210=1645,P(X=2)=C22C210=145,随机变量X的分布列如下:X012P28451645145因此,E(X)=0×2845+1×1645+2×145=25.易错提醒(1)K2越大,两分类变量无关的可能性越小,推断犯错误的概率越小,
本文标题:2023年高考数学二轮复习(全国版理) 第1部分 专题突破 专题5 第3讲 统计与统计案例
链接地址:https://www.777doc.com/doc-12798829 .html