6.2样本特征数估计总体一.频率分布直方图(表)1.频率分布直方图基础概念①纵轴表示频率组距,②频率:数据落在各小组内的频率用各长长方形的面积表示③各小长方形的面积总和等于1.④分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.2.频率分布直方图的步骤如下(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ)列频率分布表;(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.二.茎叶图1.概念:当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).2.两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.三.样本的数字特征【套路秘籍】---千里之行始于足下特征数具体数字算法频率分布直方图(表)众数次数出现最多的数字频率最大或最高组的中间值中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数频率等于0.5时的横坐标平均数所有数字之和除以总个数每个小矩形面积乘以小矩形底边中点的横坐标之和方差s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定考向一茎叶图中的特征数【例1】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.【举一反三】【修炼套路】---为君聊赋《今日诗》,努力请从今日始1.如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.84B.84,1.6C.85,1.6D.85,4【答案】C【解析】由茎叶图知,去掉一个最高分93和一个最低分79后,所剩数据84,84,86,84,87的平均数为;方差为.故答案为:2.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,8【答案】C【解析】根据茎叶图中的数据可得:甲组数据是9,12,10+x,24,27;它的中位数是15,可得10+x=15,解得:x=5;乙组数据的平均数为:,解得:y=8,所以x,y的值分别为5和8,故选C.3.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示).则该样本的中位数、众数、极差分别是()A.47,45,56B.46,45,53C.45,47,53D.46,45,56【答案】D【解析】把样本中的30个数据从小到大排列,位于中间的两个数据是45,47,所以该样本的中位数为;出现次数最多的数据是45,所以该样本的众数是45;该数据中最小值为12,最大值为68,所以该样本的极差为,故选D.4.甲、乙两人次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数和乙的成绩的中位数分别是()A.B.C.D.【答案】C【解析】根据茎叶图知,甲成绩的平均数为(10+11+14+21+23+23+32+34)=21,乙成绩的中位数为(22+23)=22.5.故选:C.5.一组数据分别为12,16,20,23,20,15,28,23,则这组数据的中位数是()A.19B.20C.21.5D.23【答案】B【解析】将题中所给的数据按从小到大排列可得:12,15,16,20,20,23,23,28,中间的两个数均为20,所以这组数据的中位数为:20,故选B.考向二频率分布直方图【例2】(1)已知200辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则a=________(2)某班全体学生英语测试成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60【答案】(1)0.04(2)B【解析】(1)依题意得,解得.(2)根据频率分布直方图,可知低于分的人数的频率是,所以该班的学生人数是,故选B。【举一反三】1.某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于等于90分的具有复赛资格,某校有800名学生参加了初赛,所有学生的成绩均在区间[30,150]内,其频率分布直方图如图所示.则获得复赛资格的人数为()A.640B.520C.280D.240【答案】B【解析】由频率分布直方图得初赛成绩大于等于90分的频率为,【套路总结】直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.∴获得复赛资格的人数为,故选B.2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(总分为100分)分成6组加以统计,6组的分数分别是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.已知不及格的人数比优秀(不低于90分)的人数多60人,则高一年级共有学生A.300人B.600人C.200人D.700人【答案】B【解析】设高一年级共有购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A.x1,x2,…xn的平均数B.x1,x2,…xn的标准差C.x1,x2,…xn的最大值D.x1,x2,…xn的中位数【答案】B【解析】因为平均数、中位数、众数描述样本数据的集中趋势,方差和标准差描述其波动大小.所以,表示一组数据的稳定程度的是方差或标准差.故选B.12.6.在某项体育比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.92,2B.92,2.8C.93,2D.93,2.8【答案】B【解析】90,89,90,95,93,94,93,去掉一个最高分和一个最低分后是90,90,93,94,93,所以其平均数为,因此方差为.故选B13.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是()A.得分在之间的共有40人B.从这100名参赛者中随机选取1人,其得分在的概率为0.5C.估计得分的众数为55D.这100名参赛者得分的中位数为65【答案】D【解析】根据频率和为1,计算,解得,得分在的频率是0.40,估计得分在的有人,A正确;得分在的频率为0.5,可得这100名参赛者中随机选取一人,得分在的概率为0.5,B正确;根据频率分布直方图知,最高的小矩形对应的底边中点为,即估计众数为55,C正确,故选D.14.为了普及消防知识,增强消防意识,某学校组织消防知识抢答活动,现在随机抽取30名学生参加本次活动,得分情况十分制如图所示,则得分值的众数和中位数分别为A.5,5B.5,C.5,6D.6,【答案】B【解析】由条形图得:众数为5,中位数为:.故选B.15.某公司对下属员工在蛇年春节期间收到的祝福短信数量进行了统计,得到了如图所示的频率分布直方图。如果该公司共有员工200人,则收到125条以上的大约有()A.6人B.7人C.8人D.9人【答案】C【解析】设125条以上的频率为x,根据所求频率和为1可知20×(0.003+0.006+0.0075+0.009+0.0105+0.012)+x=1,解得x=0.04.该公司共有员工200人,则收到125条以上的大约有200×0.004=8.故选:C.16.甲、乙两位同学的5次考试成绩如茎叶图所示,则成绩较稳定的那位学生成绩的方差为______.【答案】2【解析】由茎叶图可得:甲的平均成绩为,所以方差为;乙的平均成绩为,所以方差为;因此,所以甲稳定,方差为2.故答案为217.为参加CCTV举办的中国汉字听写大赛,某中学举行了一次大型选拔活动,随机统计了甲、乙两班各6名学生的汉字听写的成绩如图所示,设甲的众数为x,乙的中位数为y,则x-y=________【答案】1.5【解析】甲班6名学生的汉字听写的成绩:126,128,135,138,138,145,故甲的众数为x=138;乙班6名学生的汉字听写的成绩:127,129,135,138,139,142,故乙的中位数为y=∴x-y=138-136.5=1.5故答案为:1.518.已知一组样本数据,且,平均数,则该组数据的方差s2=________;【答案】2.5【解析】由题意知,又====18.5-32+16=2.5.故答案为2.5.19.某人次上班途中所花的时间(单位:分钟)分别为,,,,.已知这组数据的平均数为,方差为,则的值为__________.【答案】【解析】结合题意,建立方程,得到,计算得到故20.一组数据a1,a2,a3,…,an的方差为1,则数据2a1﹣1,2a2﹣1,2a3﹣1,…,2an﹣1的方差为___________.【答案】4【解析】∵数据的方差为1,∴数据的方差是,故答案为4.21.某商场亲子游乐场由于经营管理不善突然倒闭.在进行资产清算时发现有3000名客户办理的充值会员卡上还有余额.为了了解客户充值卡上的余额情况,从中抽取了300名客户的充值卡余额进行统计.其中余额分组区间为,,,,,其频率分布直方图如图所示,请你解答下列问题:(1)求a的值;(2)求余额不低于900元的客户大约为多少人?(3)根据频率分布直方图,估计客户人均损失多少?(用组中值代替各组数据的平均值).【答案】(1)(2)300人(3)765元【解析】(1)由,解得.(2)余额在之间的频率为0.1,故可估计余额不低于900元的客户大约为(人).(3)客户人均损失的估计值为:(元).22.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到频数分布表和频率分布直方图如下.组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的频率;(2)求频率分布直方图中的a,b的值.【答案】(1)0.9;(2),.【解析】(1)由频数分布表得,100名学生课外阅读时间不少于12小时的共有6+2+2=10(名),所以样本中学生该周课外阅读时间少于12小时的频率P=1–=0.9;则从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的频率是0.9;(2)由频数分布表得,课外阅读时间落在[4,6)的人数为17,则频率是=0.17,所以由频率分布直方图得,a==0.085,同理可得,b==0.125.23.有200名学生参加某次考试,成绩(单位:分)的频率分布直方图如图所示:(1)求频率分布直方图中的值;(2)分别求出成绩落在中的学生人数;(3)用分