§10.3用样本估计总体第十章算法、统计与概率KAOQINGKAOXIANGFENXI考情考向分析主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用;题型以填空题为主,难度为中低档题.NEIRONGSUOYIN内容索引基础知识自主学习题型分类深度剖析课时作业1基础知识自主学习PARTONE知识梳理1.作频率分布直方图的步骤(1)求极差(即一组数据中_______与_______的差).(2)决定_____与_____.(3)将数据_____.(4)列___________.(5)画_______________.ZHISHISHULI最大值最小值组距组数分组频率分布表频率分布直方图2.频率分布折线图和总体密度曲线(1)频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的_____顺次连结起来,那么就得到频率分布折线图.(2)总体分布的密度曲线:如果将_________取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.样本容量中点(3)方差:s2=_________________________________(xn是样本数据,n是样本容量,是样本平均数).x4.标准差和方差(1)标准差是样本数据到平均数的一种_________.1n[x1-x2+x2-x2+…+xn-x2](2)标准差:s=___________________________________.1n[(x1-x)2+(x2-x)2+…+(xn-x)2]平均距离【概念方法微思考】1.在频率分布直方图中如何确定中位数?提示在频率分布直方图中,中位数左边和右边的直方图的面积是相等的.2.平均数、标准差与方差反映了数据的哪些特征?提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.基础自测JICHUZICE题组一思考辨析1234561.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()√×√×√7题组二教材改编2.[P58例4]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有___人.12345625解析0.5×0.5×100=25.7123456解析设频数为n,则n32=0.25,3.[P56练习T3]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为___.8∴n=32×14=8.7123456解析x=4.7+4.8+5.1+5.4+5.55=5.1,4.[P71练习T1]已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是____.0.1则该组数据的方差s2=4.7-5.12+4.8-5.12+5.1-5.12+5.4-5.12+5.5-5.125=0.1.7123456解析因为数据共40个,第5组的频率为0.1,所以第5组的频数为40×0.1=4,所以第6组的频数为40-(10+5+7+6+4)=8.题组三易错自纠5.(2018·徐州模拟)一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6,第5组的频率为0.1,则第6组的频数为___.87x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故nmx.1234566.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为,则m,n,的大小关系为_______.(用“”连接)xxnmx解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现的次数最多,故n=5;71234567.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是____.140解析由频率分布直方图,知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.72题型分类深度剖析PARTTWO故成绩较稳定(方差较小)的那一位同学的方差为2.题型一茎叶图的应用自主演练所以甲、乙两位同学的方差分别为15×(4+1+0+1+4)=2,15×(9+1+0+1+9)=42,1.(2018·南通模拟)如图是甲、乙两位同学在5次测试中得分的茎叶图,则成绩较稳定(方差较小)的那一位同学的方差为___.2解析由于甲、乙两位同学的平均数均为90,2.(2018·江苏淮阴中学月考)如图所示是一次歌唱大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a2+b2的最小值是____.323.空气质量指数(AirQualityIndex,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI大于100的天数约为____.(该年有365天)146思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二频率分布直方图的绘制与应用师生共研例1为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为____.12思维升华(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.由题意得0.10.4=2.5x,得x=10.跟踪训练1(1)某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为___万元.10解析设11时至12时的销售额为x,因为9时至10时的销售额为2.5万元,(2)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示).已知图中从左到右第一、第六小组的频率分别为0.16,0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为____.400题型三用样本的数字特征估计总体的数字特征师生共研例2(1)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为__.2(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价.解由,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.s2甲s2乙思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练2某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),其中a,a分别表示甲组研发成功和失败;b,b分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;解记恰有一组研发成功为事件E,在所抽得的15个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7个.(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.因此事件E发生的频率为715.用频率估计概率,即得所求概率为P(E)=715.3课时作业PARTTHREE解析这组数据的平均数为16(4+6+5+8+7+6)=6.1.(2015·江苏)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为___.基础保分练12345678910111213141516612345678910111213141516则9+15+18+24+10+y5=16.8,求得y=8.2.下面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为____.5,8解析由题意根据甲组数据的中位数为15,可得x=5;乙组数据的平均数为16.8,12345678910111213141516因此,所求的频率为410=0.4.3.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____.0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,123456789101112131415164.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为_____.22.5解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5.123456789101112131415165.(2018·扬州调研)随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为_