公众号:高中试卷君公众号:高中试卷君§9.1随机抽样、统计图表考试要求1.了解获取数据的基本途径.2.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.知识梳理1.总体、个体、样本调查对象的全体(或调查对象的某些指标的全体)称为总体,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为个体,在抽样调查中,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.2.简单随机抽样抽签法和随机数法是比较常用的两种方法.3.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.4.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.常用结论1.利用比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可公众号:高中试卷君公众号:高中试卷君以进行一定的技术处理,比如将结果取成整数等.2.在比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为x,y,样本平均数为w,则w=MM+Nx+NM+Ny=mm+nx+nm+ny.3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.(×)(2)抽签法和随机数法都是简单随机抽样.(√)(3)在比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.(×)(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.(√)教材改编题1.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法错误的是()A.总体指的是该市参加升学考试的全体学生B.样本是指1000名学生C.样本量指的是1000名学生D.个体指的是该市参加升学考试的每一名学生答案C解析对于C,样本量是1000,故C错误.2.为了了解我国某品牌手机的销售情况,小张在某网站上下载了如图所示的统计图.小张是通过________获取数据.答案查询3.已知某一段公路限速70千米/时,现抽取400辆通过这一段公路的汽车的速度,其频率分布直方图如图所示,则这400辆汽车中在该路段超速的有________辆.公众号:高中试卷君公众号:高中试卷君答案80解析速度在(70,80]内的频率为1-(0.01×10+0.03×10+0.04×10)=0.2,所以在(70,80]内的频数为0.2×400=80.故这400辆汽车中在该路段超速的有80辆.题型一抽样方法例1(1)总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()第1行78166232080262426252536997280198第2行32049234493582003623486969387481A.19B.25C.26D.27答案B解析由随机数表法可知,样本的前5个个体的编号分别为23,20,26,24,25,因此,选出的第5个个体的编号为25.(2)某社区为迎接中秋节,组织了隆重的庆祝活动,为全面了解社区居民的文娱喜好,已知参加活动的老年人、中年人、青年人的人数比为10∶13∶12,如果采用比例分配的分层随机抽样方法从所有人中抽取一个70人的样本进行调查,则应抽取的青年人的人数为()A.20B.22C.24D.26答案C解析由比例分配的分层随机抽样的等比例关系,可得1210+13+12×70=24.思维升华(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③等可能抽取.公众号:高中试卷君公众号:高中试卷君(2)在比例分配的分层随机抽样中,抽样比=样本容量总体容量=各层样本容量各层个体总量.跟踪训练1(1)2022年北京冬奥会吉祥物“冰墩墩”设计造型可爱,市场供不应求,某厂的三个车间在一个小时共生产450个冰墩墩,在出厂前要检查这批冰墩墩的质量,决定采用比例分配的分层随机抽样方法进行抽取,若从一、二、三车间中抽取的冰墩墩数量分别为a,b,c且a,b,c构成等差数列,则第二车间生产的冰墩墩的个数为()A.200B.300C.120D.150答案D解析由题意可得a+c=2b,则第二车间生产的冰墩墩数量为ba+b+c×450=b3b×450=150.(2)(2022·广州模拟)假设要考查某公司生产的500g袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个个体的编号是________.(下面摘取了随机数表第7行到第9行)844217533157245506887704744767217633502583921206766301637859169556671998105071751286735807443952387933211234297864560782524207443815510013429966027954答案068解析根据随机数表可得,样本的前4个个体的编号依次为331,572,455,068.题型二统计图表例2(1)(多选)新式茶饮是指以上等茶叶通过萃取浓缩液,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为2022年我国消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.公众号:高中试卷君公众号:高中试卷君根据所给统计图,下列结论中正确的是()A.每周都消费新式茶饮的消费者占比不到90%B.每天都消费新式茶饮的消费者占比超过20%C.月均消费新式茶饮50~200元的消费者占比超过50%D.月均消费新式茶饮超过100元的消费者占比超过60%答案BC解析每周都消费新式茶饮的消费者占比1-9.1%90%,A错误;每天都消费新式茶饮的消费者占比5.4%+16.4%20%,B正确;月均消费新式茶饮50~200元的消费者占比30.5%+25.6%50%,C正确;月均消费新式茶饮超过100元的消费者占比1-14.5%-30.5%60%,D错误.(2)(多选)我国人口老龄化加剧,出现劳动人口不断减少,生育率降低等问题.为了缓解人口压力,我国陆续开放二胎、三胎政策.为了解户籍和性别对生育多胎(二胎或三胎)选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人.绘制不同群体中倾向选择生育多胎与倾向选择不生育多胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育多胎的对应比例,则下列叙述中正确的是()A.是否倾向选择生育多胎与户籍有关B.是否倾向选择生育多胎与性别有关C.倾向选择生育多胎的人员中,男性人数与女性人数相同D.倾向选择不生育多胎的人员中,农村户籍人数少于城镇户籍人数答案AD解析城镇户籍倾向选择生育多胎的比例为40%,农村户籍倾向选择生育多胎的比例为80%,故A正确;公众号:高中试卷君公众号:高中试卷君男性与女性倾向选择生育多胎的比例均为60%,故B错误;男性倾向选择生育多胎的比例为60%,人数为60×60%=36,女性倾向选择生育多胎的比例为60%,人数为40×60%=24,故C错误;倾向选择不生育多胎的人员中,农村户籍人数为50×(1-80%)=10,城镇户籍人数为50×(1-40%)=30,故D正确.思维升华统计图表的主要应用扇形图:直观描述各类数据占总数的比例;折线图:描述数据随时间的变化趋势;条形图和直方图:直观描述不同类别或分组数据的频数和频率.跟踪训练2(1)已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是()A.全国农产品夏季价格比冬季低B.全国农产品批发价格200指数2022年每个月逐渐增加C.2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致D.2022年6月农产品批发价格200指数大于126答案C解析图中给的是批发价格200指数,所以并不能确定农产品的价格变化,故A错误;全国农产品批发价格200指数2022年4~6月呈下降趋势,并未增加,故B错误;根据图中曲线的变化趋势可发现2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致,故C正确;2022年6月农产品批发价格200指数在115附近,故D错误.(2)(多选)某中学组织三个年级的学生进行禁毒知识竞赛.经统计,得到成绩排在前200名学生分布的扇形图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是()公众号:高中试卷君公众号:高中试卷君A.成绩排在前200名的200人中,高二人数比高三人数多10B.成绩排在第1~50名的50人中,高一人数比高二的多C.成绩排在第51~150名的100人中,高三人数占比可能超过13D.成绩排在第51~100名的50人中,高二人数肯定多于23答案AC解析对于A,成绩排在前200名的200人中,高二人数比高三人数多200×(30%-25%)=10,故A正确;对于B,成绩排在第1~50名的50人中,高一人数为200×45%×20%=18,高二和高三的总人数为50-18=32,高二的具体人数不知道,故B错误;对于C,成绩排在第51~150名的100人中,高一人数为90×(0.3+0.4)=63,高二和高三的总人数为100-63=37,所以高三人数占比有可能超过13,故C正确;对于D,成绩排在第51~100名的50人中,高一学生人数为90×0.3=27,高二人数最多有50-27=23,故D不正确.题型三频率分布直方图例3下面是北方某城市2022年1~2月的日平均气温(单位:℃)的记录数据:-32-4-7-11-1789-6-14-18-15-9-6-105-4-9-6-8-12-16-19-15-22-25-24-19-8-6-15-11-12-19-25-24-18-17-14-22-13-9-60-15-4-9-32-4-4-175-6-5公众号:高中试卷君公众号:高中试卷君(1)将数据适当分组,并画出相应的频率分布直方图;(2)试估计该城市2022年1~2月的日平均气温在0℃以下的天数所占的百分比.解(1)经过统计可得频率分布表如下.分组频数频率频率组距[-25,-20)66590.020[-20,-15)77590.024[-15,-10)1010590.034[-10,-5)1313590.044[-5,0)1212590.041[0,5)44590.013[5,10]77590.024合计5910.2频率分布直方图为(2)该城市2022年1~2月的日平均气温在0℃以下的天数为48,2022年1~2月共有59天,所以该城市2022年1~2月的日平均气温在0℃以下的天数所占的百分比为4859×100%≈81%.思维升华频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1.(2)频率分布直方图中纵轴表示频率组距,每组样本的频率为组距×频率组距,即小长方形的面积.(3)频率分布直方图中每组样本的频数为频率×总数.公众号:高中试卷君公众号:高中试卷君跟踪训练3某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,