专题五 第1讲 统计与统计案例 (26)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第1讲统计与统计案例[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、线性回归方程的求解与运用、独立性检验等问题,常与概率综合考查,中等难度.考点一用样本估计总体核心提炼1.用样本的频率分布估计总体的分布(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)在频率分布直方图中各小长方形的面积之和为1.2.用样本的数字特征估计总体的数字特征样本数据:x1,x2,…,xn.(1)标准差:样本数据到平均数的一种平均距离,s=1n[x1-x2+x2-x2+…+xn-x2].(2)方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2](xn是样本数据,n是样本容量,x是样本平均数).(3)若a0,数据ax1+b,ax2+b,…,axn+b的标准差为as,方差为a2s2.例1(1)某学校为了解男生身体发育情况,从2000名男生中抽查了100名男生的体重情况,根据数据绘制样本的频率分布直方图,如图所示,下列说法中错误的是()A.样本的众数约为6712B.样本的中位数约为6623C.样本的平均值约为66D.体重超过75kg的学生频数约为200人(2)(2022·张家口模拟)2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区()A.2030年煤的消费量相对2020年减少了B.2030年天然气的消费量比2020年的消费量增长了5倍C.2030年石油的消费量相对2020年不变D.2030年水、核、风能的消费量是2020年的7.5倍规律方法利用频率分布直方图求众数、中位数与平均数.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.跟踪演练1(1)(2022·兰州模拟)2021年7月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》.各地积极推进“双减”工作,义务教育阶段学生负担得到有效减轻.下表是某校七年级10名学生“双减”前后课外自主活动时间的随机调查情况(单位:小时).学生编号12345678910“双减”前1.31.21.51.61.21.31.51.11.11“双减”后1.52.5231.522.40.91.41.2设“双减”前、后这两组数据的平均数分别是x1,x2,标准差分别是s1,s2,则下列关系正确的是()A.x2=x1+0.56,s1s2B.x2=x1+0.56,s1s2C.x2=x1+0.65,s1s2D.x2=x1+0.65,s1s2(2)(2022·赤峰模拟)如图所示的是国家统计局官网发布的2021年3月到2022年3月全国居民消费价格的涨跌幅情况.关于这个时间段的折线图,有下列说法:①所有月份的同比增长率都是正数;②环比增长率为正数的月份比为负数的月份多;③2021年9月到10月的同比增长率的增幅等于10月到11月的同比增长率的增幅;④同比增长率的极差为0.9.其中正确说法的个数为()A.1B.2C.3D.4考点二回归分析核心提炼求线性回归方程的步骤(1)依据样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).(2)计算出x,y,a^,b^.(3)写出线性回归方程.例2(2022·长沙模拟)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2022年7月10日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:万人)的数据如下表:日期7月10日7月11日7月12日7月13日7月14日第x天12345人数y(单位:万人)75849398100(1)依据表中的统计数据,请判断该电商平台的第x天与到该电商平台专营店购物的人数y(单位:万人)是否具有较高的线性相关程度?(参考:若0.3|r|0.75,则线性相关程度一般,若|r|0.75,则线性相关程度较高,计算r时精确度为0.01)________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________(2)求购买人数y与直播的第x天的线性回归方程;用样本估计总体,请预测从2022年7月10日起的第38天到该专营店购物的人数(单位:万人).参考数据:i=15(yi-y)2=434,i=15(xi-x)(yi-y)=64,4340≈65.879.附:相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2,线性回归方程的斜率b^=i=1nxi-xyi-yi=1nxi-x2,截距a^=y-b^x.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________易错提醒(1)样本点不一定在回归直线上,但点(x,y)一定在回归直线上.(2)求b^时,灵活选择公式,注意公式的推导和记忆.(3)利用相关系数判断相关性强弱,看|r|的大小,而不是r的大小.(4)区分相关系数r与相关指数R2.(5)通过线性回归方程求的都是估计值,而不是真实值.跟踪演练2(1)(2022·汕头模拟)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是()A.相关系数r变小B.残差平方和变大C.相关指数R2变小D.解释变量x与预报变量y的相关性变强(2)(2022·重庆市育才中学模拟)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如表所示:x1015202530y1110865根据表中的数据可得线性回归方程y^=b^x+14.4,则以下正确的是________.(填序号)①相关系数r0;②b^=-0.32;③若该产品价格为35元/kg,则日需求量大约为3.2kg;④第四个样本点对应的残差为-0.4.考点三独立性检验核心提炼独立性检验的一般步骤(1)根据样本数据列2×2列联表;(2)根据公式K2=nad-bc2a+bc+da+cb+d,计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.K2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.例3(2022·全国甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.P(K2≥k0)0.1000.0500.010k02.7063.8416.635________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________易错提醒(1)K2越大,两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.跟踪演练3(2022·安庆模拟)很多人都爱好短视频,为了调查手机用户每天刷短视频的时间,某通讯公司在一广场随机采访男性、女性用户各50名,将男性、女性平均每天刷短视频的时间(单位:h)分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)求a的值;(2)根据频率分布直方图估计女性平均每天刷短视频的时间;(同一组中的数据用该组区间的中点值为代表)(3)若每天刷短视频超过4h的用户称为“短视频控”,否则称为“非短视频控”,完成如下列联表,判断是否有90%的把握认为是否是“短视频控”与性别有关.短视频控非短视频控总计男性女性总计参考数据:P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828_____________________________________________________________________________________________________________________________________________________________________

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功