1§10.3用样本估计总体最新考纲考情考向分析1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数,标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.1.作频率分布直方图的步骤(1)计算极差(即一组数据中最大值与最小值的差).(2)决定组数与组距.(3)决定分点.(4)列频率分布表.(5)绘制频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图.(2)总体密度曲线:设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边2生长出来的数.4.众数、中位数、平均数数字特征概念优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征中位数把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,xn,那么这n个数的平均数x=x1+x2+…+xnn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低5.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=1n[x1-x2+x2-x2+…+xn-x2].(3)方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2](xn是样本数据,n是样本容量,x是样本平均数).概念方法微思考1.在频率分布直方图中如何确定中位数?提示在频率分布直方图中,中位数左边和右边的直方图的面积是相等的.2.平均数、标准差与方差反映了数据的哪些特征?提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)3(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(√)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)题组二教材改编2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16答案B解析设频数为n,则n32=0.25,∴n=32×14=8.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92答案A解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x=87+89+90+91+92+93+94+968=91.5.4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.答案254解析0.5×0.5×100=25.题组三易错自纠5.若数据x1,x2,x3,…,xn的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为()A.5,2B.16,2C.16,18D.16,9答案C解析∵x1,x2,x3,…,xn的平均数为5,∴x1+x2+x3+…+xnn=5,∴3x1+3x2+3x3+…+3xnn+1=3×5+1=16,∵x1,x2,x3,…,xn的方差为2,∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________.(用“”连接)答案nmx解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故nmx.5题型一统计图表及应用命题点1扇形图例1(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%×2a=74%a增加A错其他收入4%a5%×2a=10%a增加了一倍以上B对养殖收入30%a30%×2a=60%a增加了一倍C对养殖收入+第三产业收入(30%+6%)a=36%a(30%+28%)×2a=116%a超过经济收入2a的一半D对故选A.6命题点2折线图例2(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.命题点3茎叶图例3(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A解析甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.命题点4频率分布直方图例4某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是7()A.56B.60C.120D.140答案D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.思维升华(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(4)①准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练1(1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D解析由题意知,平均最高气温高于20℃的有七月,八月,故选D.8(2)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2500人,在区间[20,30)内的有1200人,则m的值为()A.0.013B.0.13C.0.012D.0.12答案C解析由题意,得年龄在区间[30,40)内的频率为0.025×10=0.25,则赞成高校招生改革的市民有25000.25=10000(人),因为年龄在区间[20,30)内的有1200人,所以m=12001000010=0.012.(3)(2018·沈阳质检)已知某班级部分同学一次测验的成绩统计如图所示,则其中位数和众数分别为()A.95,94B.92,86C.99,86D.95,91答案B解析由题中茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故中位数为92,出现次数最多的为众数,故众数为86,故选B.(4)下图是2017年1~11月汽油、柴油价格走势图(单位:元/吨),据此下列说法错误的是()9A.从1月到11月,三种油里面柴油的价格波动最大B.从7月份开始,汽油、柴油的价格都在上涨,而且柴油价格涨速最快C.92#汽油与95#汽油价格成正相关D.2月份以后,汽油、柴油的价格同时上涨或同时下跌答案D解析由价格折线图,不难发现4月份到5月份汽油价格上涨,而柴油价格下跌.题型二用样本的数字特征估计总体的数字特征例5(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于5