主攻40个必考点(十四)统计1.(2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生解析:选C由题意知,抽样间隔为1000100=10.因为46号学生被抽到且46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.2.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数解析:选B标准差能反映一组数据的稳定程度.故选B.3.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8解析:选C法一:设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.法二:用Venn图表示调查的100位学生中阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.4.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样5.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.解析:∵x=10×0.97+20×0.98+10×0.9910+20+10=0.98,∴经停该站高铁列车所有车次的平均正点率的估计值为0.98.答案:0.986.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由已知得0.70=a+0.20+0.15,解得a=0.35,所以b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解:(1)频率分布直方图如图所示.(2)根据频率分布直方图知,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).[把脉考情]考什么1.频率分布直方图;2.样本的数字特征;3.抽样方法考多深选择、填空、解答题均有涉及,选择、填空题主要考查随机抽样及用样本估计总体、统计图表,难度较低,解答题中主要考查统计图表的应用,难度中等,分值5~10分考多宽统计常单独命题,以生活中的实际问题为背景,考查随机抽样与用样本估计总体,有时与概率、统计案例结合,考查学生数据分析,读图、辨图的能力,从而培养学生的直观想象、数据分析、数学运算的核心素养抽样方法[典例1](1)(2020届高三·河北六校联考)某中学有高中生3000人,初中生2000人,男、女生所占的比例如图所示.学校为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是()A.12B.15C.20D.21(2)利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为()A.73B.78C.77D.76[解析](1)由题图可知高中生中女生有3000×70%=2100(人),初中生中男生有2000×60%=1200(人),设从初中生中抽取的男生人数是x,则有21001200=21x,解得x=12,故选A.(2)样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.[答案](1)A(2)B增分方略分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)当总体容量为N,样本容量为n时,有下列关系式:某层入样个体数该层个体总数=nN.频率分布直方图的应用[典例2](2019·福州质检)某技术公司新开发一种产品,分别由A,B两条生产线生产.为了检测该产品的某项质量指标值(记为Z),现分别随机抽取这两条生产线的产品各100件,由检测结果得到如图所示的频率分布直方图.(1)该公司规定:当Z≥76时,产品为正品;当Z76时,产品为次品.试估计A,B两条生产线生产的产品的正品率分别是多少?(2)分别估计A,B两条生产线的产品质量指标值的平均数(同一组中的数据用所在区间的中点值代表),从平均数结果看,哪条生产线的产品质量指标值更高?(3)根据(2)的结论,能否认为该公司生产的产品符合“质量指标值不低于84的产品至少要占全部产品的40%”的规定?[解](1)A生产线的产品为正品的概率为(0.05375+0.03500+0.01125)×8=0.8;B生产线的产品为正品的概率为(0.06250+0.03375+0.00250)×8=0.79.(2)设A生产线的产品质量指标值的平均数为x,B生产线的产品质量指标值的平均数为y,由题图可得x=64×(0.00625×8)+72×(0.01875×8)+80×(0.05375×8)+88×(0.03500×8)+96×(0.01125×8)=81.68,y=64×(0.00625×8)+72×(0.02000×8)+80×(0.06250×8)+88×(0.03375×8)+96×(0.00250×8)=80.4,由以上计算结果可得xy,因此A生产线的产品质量指标值更高.(3)由(2)知,A生产线的产品质量指标值更高,且不低于84的产品所占比例的估计值为(0.03500+0.01125)×8=0.370.4,所以B生产线的产品质量指标值的估计值也小于0.4,故不能认为该公司生产的产品符合“质量指标值不低于84的产品至少要占全部产品的40%”的规定.增分方略从频率分布直方图中得出有关数据的方法频率频率分布直方图中横轴表示组数,纵轴表示频率组距,频率=组距×频率组距频率比频率分布直方图中各小长方形的面积之和为1,各小长方形高的比也就是频率比众数最高小长方形底边中点的横坐标中位数平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标平均数频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和用样本的数字特征估计总体的数字特征[典例3](2019·马鞍山三模)某市为调查甲、乙两校学生对分层教学模式的满意度,用简单随机抽样从这两校中分别抽取30名学生,根据他们对分层教学模式的满意度评分(百分制),绘制茎叶图如图.(1)估计甲学校学生对分层教学模式的满意度评分的中位数;(2)设甲、乙两校学生对分层教学模式的满意度评分的平均值分别为x1,x2,估计x1-x2的值.[一题多解](在发散思维中整合知识)(1)样本数据中,甲学校学生对分层教学模式的满意度评分处于最中间的两个数是70,70,所以样本数据中甲学校学生对分层教学模式的满意度评分的中位数是70,由此估计甲学校学生对分层教学模式的满意度评分的中位数是70.(2)法一:直接法设甲、乙两校样本的平均数分别为x1′,x2′,根据样本茎叶图可知,x1′=130×(47+52+53×2+55+60×2+61+63×3+64+65×2+70×2+71×2+72×2+76×2+78+82+84×2+85+87+90+92)=208430,x2′=130×(45+53×2+58+60×3+61×2+62×2+63×2+65+70×2+72×3+73×2+76×2+79+81×2+85×2+88+90)=206930,所以x1′-x2′=2084-206930=0.5,故x1-x2的估计值为0.5.法二:利用平均数的性质设甲、乙两校样本的平均数分别为x1″,x2″,根据样本茎叶图可知,30(x1″-x2″)=30x1″-30x2″=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15,因此x1″-x2″=0.5,故x1-x2的估计值为0.5.增分方略1.破解此类题的关键(1)一是读图,即由茎叶图读出相关数据;(2)会用定义求中位数;三是会用公式,即会利用平均数公式求一组数据的平均数.2.本题的易错点有两处:(1)由茎叶图读数据时读错或漏读,导致所求的平均数出错;(2)运算不认真,导致所求得的结果出错.[典例4](2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前