2020版高考数学二轮复习 第2部分 专题3 概率与统计 第2讲 统计与统计案例课件 理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二部分讲练篇专题三概率与统计第2讲统计与统计案例自主练考点整合[做小题——激活思维]1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A[记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.]2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,计算得K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握约为()P(K2≥k)0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828A.0.1%B.1%C.99.5%D.99.9%C[因为K2=8.01>7.879,观测值同临界值进行比较可知,有99.5%的把握认为“喜欢乡村音乐与性别有关系”,故选C.]3.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如图所示,则()A.甲篮球运动员比赛得分更稳定,中位数为26B.甲篮球运动员比赛得分更稳定,中位数为27C.乙篮球运动员比赛得分更稳定,中位数为31D.乙篮球运动员比赛得分更稳定,中位数为36D[由茎叶图可知,乙运动员的得分大部分集中在30~40分之间,而甲运动员的得分相对比较分散,故乙篮球运动员比赛得分更稳定.乙篮球运动员共有13个得分,由茎叶图由小到大排列后处于中间第7位的是36,故选D.]4.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图1图2A.100,20B.200,20C.200,10D.100,10B[由题图1可知学生总人数是10000,样本容量为10000×2%=200,抽取的高中生人数是2000×2%=40,由题图2可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.]5.已知x,y的取值如下表所示:x234y546若y与x呈线性相关,且回归方程为y^=b^x+72,则b^等于________.12[由题意,得x=3,y=5.因为线性回归方程必过样本的中心点(3,5),所以5=3b^+72,解得b^=12.]6.数据1,3,5,7的方差为________.5[x=1+3+5+74=4,∴方差s2=14[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.][扣要点——查缺补漏]1.三种抽样方法(1)简单随机抽样;(2)系统抽样(等间隔抽样);(3)分层抽样(按比例抽样).如T4.2.样本数据x1,x2,…,xn的数字特征(1)样本平均数:x=1n(x1+x2+x3+…+xn)=1n∑ni=1xi;(2)样本方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]=1n∑ni=1(xi-x)2=1n(x21+x22+x23+…+x2n-nx2);如T6.(3)样本标准差:s=1n[x1-x2+x2-x2+…+xn-x2]=1n∑ni=1xi-x2;(4)样本数据的性质:若x1,x2,…,xn的平均数为x,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为ax+b,方差为a2s2.3.茎叶图样本数据越集中越稳定,越分散越不稳定,如T3.4.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.5.线性回归方程y^=b^x+a^一定过样本点的中心(x,y).如T5.6.独立性检验的关键在于准确求出K2值,K2=nad-bc2a+bc+da+cb+d的观测值k越大,说明“两个分类变量有关系”的可能性越大.如T2.研考题举题固法变量的相关性及回归分析(5年4考)[高考解读]高考对该点的考查主要立足两点:一是考查学生的数据提取,数据分析能力;二是考查学生的数学建模能力,因此学会从数据中获取有效信息并给予正确的处理是解答此类问题的关键.在备考中,要重视以茎叶图、散点图、折线图、饼状图为载体的题目.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解](1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)求线性回归直线方程的步骤1.[重视题](结合散点图分析问题)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1000个,根据各年龄段平均身高作出如下图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是()A.根据样本数据估计,该地区青少年身高与年龄成正相关B.所抽取数据中,5000名青少年平均身高约为145cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上D[在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A项正确;用样本数据估计总体可得平均数大约是145cm,故B项正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C项正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D项错误.]2.(回归分析与函数交汇)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:吨)和年利润z(单位:千元)的影响,对近13年的年宣传费xi和年销售量yi(i=1,2,…,13)数据作了初步处理,得到如下图所示的散点图及一些统计量的值.由散点图知,按y=a+bx,y=c+dx建立y关于x的回归方程是合理的.令s=x,t=1x,经计算得如下数据:xyst10.15109.943.040.16∑13i=1siyi-13sy∑13i=1tiyi-13ty∑13i=1s2i-13s2∑13i=1t2i-13t2∑13i=1y2i-13y213.94-2.1011.670.2121.22且(si,yi)与(ti,yi)(i=1,2,…,13)的相关系数分别为r1=0.886与r2=-0.995.(1)从以上模型中选择更优的回归方程,并用相关系数加以说明;(2)根据(1)的选择结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=10y-x.根据(2)的结果回答下列问题:①年宣传费x=20时,年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(ui,vi)(i=1,2,…,n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑ni=1uivi-nuv∑ni=1u2i-nu2,α^=v-β^u.[解](1)由于|r1|<|r2|<1,故y=c+dx更优.(2)d^=∑13i=1tiyi-13ty∑13i=1t2i-13t2=-2.100.21=-10,c^=y-d^t=109.94+10×0.16=111.54.则y关于x的回归方程为y^=111.54-10x.(3)由题意,年利润z=10y-x=1115.4-100x+x,①当x=20时,年利润的预报值是z^=1115.4-10020+20=1090.4.②由基本不等式得,年利润的预报值z^=1115.4-100x+x,由于x+100x≥20,当且仅当x=100x,即x=10时等号成立,此时z^max=1115.4-20=1095.4.独立性检验(5年2考)[高考解读]该类问题常以统计图、表为载体,以生活题材为背景,借助独立性检验中的K2公式对两类分类变量的相关性作出判断.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=nad-bc2a+bc+da+cb+d,P(K2≥k)0.0500.0100.001k3.8416.63510.828[解](1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(2)由茎叶图知m=79+812=80.列联表如下:超

1 / 84
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功