第26讲统计【知识点总结】一、抽样方法三种抽样方式的对比类型共同点各自特点相互关系使用范围简单随机抽样抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率nPN从总体中随机逐个抽取总体容量较小系统抽样总体均分几段,每段T个,第一段取a1,第二段取a1+T,第三段取a1+2T,……第一段简单随机抽样总体中的个体个数较多分层抽样将总体分成n层,每层按比例抽取每层按简单随机抽样或系统抽样总体由差异明显的几部分组成二、样本分析(1)样本平均值:11niixxn。(2)样本众数:样本数据中出现次数最多的那个数据。(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。(4)样本方差:()2211niisxxn。众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。三、频率分布直方图的解读(1)频率分布直方图的绘制①由频率分布表求出每组频数ni;②求出每组频率iinPN(n为样本容量);③列出样本频率分布表;④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。(2)样本估计总体步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。公式:aXbaxb,s2(aX+b)=a2s2(X)。【典型例题】例1.(2021·云南师大附中高三阶段练习(文))某公司利用随机数表对生产的900支乙肝疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是()167662276656502671073290797853135538585988975414101256859926969668273105037293155712101421882649817655595635643854824622316243099006184432532383013030A.827B.310C.503D.729例2.(2022·全国·高三专题练习)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33B.25,56,19C.20,40,30D.30,50,20例3.(2021·四川省内江市第六中学高三阶段练习(文))某市场新购进某品牌电视机30台,为检测这批品牌电视机的安全系数,现采用系统抽样的方法从中抽取5台进行检测,若第一组抽出的号码是2,则第4组抽出的号码是________.例4.(2022·全国·高三专题练习(理))机床生产一批参考尺寸为的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):序号12345678910尺寸6.35.86.25.96.26.05.85.85.96.1参考数据:取3.21.79.(1)求样本零件尺寸的平均值x与标准差s;(2)估计这批零件尺寸位于,xsxs的百分比.例5.(2019·河北·衡水第一中学高考模拟(理))在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从A,B两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001一900.(1)若采用随机数表法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端.写出样本编号的中位数;(2)若采用系统抽样法抽样,且样本中最小编号为08,求样本中所有编号之和:(3)若采用分层轴样,按照学生选择A题目或B题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4:样本中B题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.例6.(2020·河北·模拟预测(文))为抗击新型冠状病毒肺炎疫情,某口罩生产企业职工在做好自身安全防护的同时,加班加点生产口罩发往疫区.该企业为保证口罩的质量,从某种型号的口罩中随机抽取100个,测量这些口罩的某项质量指标值,其频率分布直方图如图所示,其中该项质量指标值在区间115,125内的口罩恰有8个.(1)求图中a,b的值;(2)用样本估计总体的思想,估计这种型号的口罩该项质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据质量指标标准,该项质量指标值不低于85,则为合格产品,试估计该企业生产这种型号口罩的质量合格率为多少?【技能提升训练】一、单选题1.(2022·全国·高三专题练习)下列说法正确的是()A.投掷一枚硬币1000次,一定有500次“正面朝上”B.若甲组数据的方差是0.03,乙组数据的方差是0.1,则甲组数据比乙组数据稳定C.为了解我国中学生的视力情况,应采取全面调查的方式D.一组数据1、2、5、5、5、3、3的中位数和众数都是52.(2022·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题;“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒内有谷二十八颗,凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.153石B.154石C.169石D.170石3.(2022·全国·高三专题练习)现要完成下列3项抽样调查:①从15种疫苗中抽取5种检测是否合格.②某科研院所共有480名科研人员,其中具有高级职称的有48名,具有中级职称的有360名,具有初级职称的有72名.为了解该科研院所科研人员的创新能力,拟抽取一个样本容量为20的样本.③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.较为合理的抽样方法是()A.①③简单随机抽样,②分层抽样B.①②简单随机抽样,③分层抽样C.②③简单随机抽样,①分层抽样D.①简单随机抽样,②③分层抽样4.(2022·全国·高三专题练习)下面抽样中是简单随机抽样的个数是()①从无数个个体中抽取30个个体作为样本②从100部手机中一次抽取5部进行检测③某班有45名同学,指定个子最高的5名同学参加学校组织的篮球比赛④一彩民买彩票选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽取6个号签A.1B.2C.3D.45.(2022·全国·高三专题练习)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是()A.①简单随机抽样,②系统抽样B.①分层抽样,②简单随机抽样C.①系统抽样,②分层抽样D.①②都用分层抽样6.(2022·全国·高三专题练习)从编号依次为01,02,…,20的20人中选取5人,现从随机数表的第一行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为()53083395550262152702436932181826099478465887352224683748168595271413872714955656A.09B.02C.15D.187.(2022·全国·高三专题练习)为了弘扬文化自信,某中学随机抽取了320个学生,调查其是否阅读过四大名著《三国演义》《西游记/水浒传》及《红楼梦》经统计,其中阅读过《三国演义》或《西游记》的有220人,阅读过《三国演义》的有180人,同时阅读过《三国演义》和《西游记》两本书的有120人.用样本估计总体,则该中学阅读过《西游记》的学生人数与该中学学生总人数之比的估计值为()A.0.5B.0.6C.0.7D.0.88.(2022·全国·高三专题练习)某学校决定从该校的2000名高一学生中采用系统抽样(等距)的方法抽取50名学生进行体质分析,现将2000名学生从1至2000编号,已知样本中第一个编号为7,则抽取的第26个学生的编号为()A.997B.1007C.1047D.10879.(2022·全国·高三专题练习)第十四届全国运动会开幕式,于2021年9月15日20点在西安奥体中心隆重开幕.本次盛会的观众席中有1800名是“西安铁一中”师生,这些师生中还有800名学生参加了文艺演出.开幕式之后,在这1800名师生中,按照“参加了演出”和“未参加演出”分层抽样共抽取了27名师生,参加“陕西电视台”举办的“弘扬十四运精神”座谈会,则抽到的27名师生中“参加了演出”和“未参加演出”的人数分别是()A.11,16B.12,15C.13,14D.14,1310.(2022·全国·高三专题练习)某企业有职工150人,中高级职称15人,中级职称45人,一般职员90人,现抽取30人进行分层抽样,则各职称人数分别为()A.5,10,15B.5,9,16C.3,10,17D.3,9,1811.(2022·全国·高三专题练习)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则在抽取的高中生中,近视人数约为()A.1000B.40C.27D.2012.(2022·全国·高三专题练习)某学校高二年级选择“史政地”、“史政生”和“史地生”这三种组合的学生人数分别为210、90和60.若采用分层抽样的方法从中随机抽取12名学生,则从“史政生”组合中抽取的学生人数为()A.7B.6C.3D.213.(2022·全国·高三专题练习)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为116,124,118,122,120,五名女生的成绩分别为118,123,123,118,123,下列说法一定正确的是A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数14.(2022·全国·高三专题练习(理))如图为2015~2020年中国常温乳酸菌饮品市场规模柱形图及增速折线图(2015-2020年为真实数据,2021年及2022年为预测数据),给出下列判断:①2015-2020年中国常温乳酸菌饮品市场规模逐年增加;②2015-2020年中国常温乳酸菌饮品市场规模增速逐年增加;③由预测可知,2021年中国常温乳酸菌饮品市场规模与2019年相比将增加7.3%,其中正确判断的个数为()A.0B.1C.2D.315.(2022·全国·高三专题练习(理))今年暑假期间,某地从近两年毕业的大学生中招聘了一批高中教师、初中教师、小学教师、小学特岗教师和幼儿教师共五个系列的教师,按分层抽样方法抽取了100名参加面试的教师的数量统计信息如下:①样本中男生占25%;②样本中参加高中教师面试的女生人数比参加初中教师面试的男生人数多;③样本中参加幼儿教师面试的男生与女生的人数多少无法比较.则以上信息正确的个数为()A.0B.1C.2D.316.(2022·全国·高三专题练习(文))如图1为某省2018年1~4月快递业务量统计图,图2是该省2018年1~4月快递业务收入统计图,下列对统计图理解错误..的是()A.2018年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2018年1~4月的业务量同比增