-1-第三节统计图表、数据的数字特征、用样本估计总体[最新考纲]1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.(对应学生用书第179页)1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、象形统计图、茎叶图等.2.数据的数字特征(1)众数、中位数、平均数①众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.③平均数:样本数据x1,x2,…,xn的平均数x=1n(x1+x2+…+xn).(2)方差和标准差①方差:s2=1n[]x1-x2+x2-x2+…+xn-x2.②标准差:s=s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].其中xn是样本数据的第n项,n是样本容量,x是平均数.标准差的单位与原始测量单位相同,在统计中,通常用标准差来刻画数据的离散程度.3.频率分布直方图与频率分布折线图(1)频率分布直方图:每个小矩形的宽度为Δxi(分组的宽度),高为fiΔxi,小矩形的面积恰为相应的频率fi,我们称这样的图形为频率分布直方图.(2)频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加上一个区间,从所加的左边区间的中点开始,用线段依次连接频率分布直方图中各个矩形的顶端中点,直至右边所加区-2-间的中点就得到频率分布折线图.4.用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.[常用结论]1.频率分布直方图的三个结论(1)频率分布直方图中相邻两横坐标之差Δxi称为组距,纵坐标fiΔxi=频率组距,频率=组距×fiΔxi.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx+a.(2)数据x1,x2,…,xn的方差为s2.①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.一、思考辨析(正确的打“√”,错误的打“×”)(1)在频率分布直方图中,小矩形的高表示频率.()(2)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(4)一组数据的方差越大,说明这组数据的波动越大.()[答案](1)×(2)√(3)√(4)√二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16-3-B[设频数为n,则n32=0.25,∴n=32×14=8.]2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92A[∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x=87+89+90+91+92+93+94+968=91.5.]3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人.25[用水量为[2,2.5)的频率为0.5×0.5=0.25,则用水量为[2,2.5)的居民有100×0.25=25(人).]4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1[5个数的平均数x=4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.](对应学生用书第180页)⊙考点1扇形图和折线图(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一-4-倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A[设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.]2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳-5-A[对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.]解答第1题时,理解“经济收入增加了一倍”是解题的关键.⊙考点2茎叶图茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.1.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7A[由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以15×[56+62+65+74+(70+x)]=15×(59+61+67+65+78),解得x=3,故选A.]2.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A.1B.2C.3D.4B[由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2,故选B.]3.甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x甲,x乙,则下列结论正确的是()-6-A.x甲<x乙;乙比甲得分稳定B.x甲>x乙;甲比乙得分稳定C.x甲>x乙;乙比甲得分稳定D.x甲<x乙;甲比乙得分稳定A[因为x甲=2+7+8+16+225=11,x乙=8+12+18+21+255=16.8,所以x甲<x乙且乙比甲成绩稳定,故选A.]第3题,从数据重心位置及数据离散程度,亦可知道答案.⊙考点3频率分布直方图1.由频率分布直方图进行相关计算时,需掌握的两个关系式(1)频率组距×组距=频率.(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.2.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.(1)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是()A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000人-7-C.考生竞赛成绩的平均分约70.5分D.考生竞赛成绩的中位数为75分(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.①求乙离子残留百分比直方图中a,b的值;②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D[由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为4000×0.25=1000,故B正确;由频率分布直方图可得:平均分等于45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为70+10×0.050.3≈71.67,故D错误.故选D.](2)[解]①由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为-8-3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.频率分布直方图中各小长方形的面积之和为1,在求参数的值时,经常用到这个结论.[教师备选例题]某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数.[解](1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.0075.即直方图中x的值为0.0075.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.0095+0.011)×20=0.45<0.5,(0.002+0.0095+0.011+0.0125)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.0125×(a-220)=0.5,解得a=224,即中位数为224.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如