第九章统计与统计案例第1节获取数据的基本途径及随机抽样课程标准考情索引核心素养1.知道获取数据的基本途径,理解随机抽样的必要性与随机性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.2019·全国卷Ⅰ,T62018·全国卷Ⅲ,T142017·江苏卷,T31.数据分析2.数学运算1.获取数据的基本途径获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.2.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.3.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号.(2)确定分段间隔k,对编号进行分段,当Nn是整数时,取k=Nn,当Nn不是整数时,随机从总体中剔除余数,再取k=N′n(N′为从总体中剔除余数后的总数).(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k).(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.4.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个数,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制.2.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n,总体容量为N,每个个体被抽到的概率是nN.3.系统抽样抽取的个体编号从小到大成等差数列.[概念思辨]1.判断下列结论的正误(正确的打“√”,错误的打“×”).(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.()(2)系统抽样在起始部分抽样时采用简单随机抽样.()(3)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()答案:(1)×(2)√(3)×(4)×[教材衍化]2.(人A必修3·习题改编)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本解析:从5000名居民某天的阅读时间中抽取200名居民的阅读时间,样本容量是200,抽取的200名居民的阅读时间是一个样本,每名居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.答案:A3.(人A必修3·习题改编)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为112,则总体中的个体数为()A.40B.60C.80D.120解析:因为用分层抽样方法从总体中抽取一个容量为10的样本.由B层中每个个体被抽到的概率都为112,知道在抽样过程中每个个体被抽到的概率是112,所以总体中的个体数为10112=120.答案:D[典题体验]4.(2020·江门质检)甲、乙、丙、丁四所学校分别有150、120、180、150名高二学生参加某次调研测试.为了解学生的能力水平,需从这600名学生中抽取一个容量为100的样本做卷面分析,记这项调查为①;在丙校有50名培优生,需要从中抽取10名学生进行失分分析,记这项调查为②.完成这两项调查宜采用的抽样方法依次是()A.分层抽样法、系统抽样法B.分层抽样法、简单随机抽样法C.系统抽样法、分层抽样法D.简单随机抽样法、分层抽样法解析:①四所学校,学生有差异,故①使用分层抽样法,②在同一所学校,且人数较少时,使用的是简单随机抽样法.答案:B5.(2020·石家庄一中检测)某学校为响应“平安出行号召”,拟从2019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2000名再按照系统抽样的方法抽取,则每名学生入选的概率()A.不全相等B.均不相等C.都相等,且为140D.都相等,且为502019解析:由题意,每名同学入选的概率都相等,且p=20002019×502000=502019.答案:D6.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样考点1简单随机抽样(自主演练)1.下列抽取样本的方式属于简单随机抽样的个数为()①盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.②从20件玩具中一次性抽取3件进行质量检验.③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0B.1C.2D.3解析:①②③中都不是简单随机抽样,这是因为:①是放回抽样,②中是“一次性”抽取,而不是“逐个”抽取,③中“指定个子最高的5名同学”,不存在随机性,不是等可能抽样.答案:A2.(2020·日照一中月考)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:26357900337091601620388277574950321149197306491676778733997467322748619871644148708628888519162074770111163024042979799196835125A.3B.16C.38D.20解析:按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,….因此选出的第3个个体的编号为20.答案:D3.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为()A.14B.13C.514D.1027解析:根据题意得,9n-1=13,解得n=28.故每个个体被抽到的概率为1028=514.答案:C1.简单随机抽样的特点.(1)抽取的个体数较少;(2)逐个抽取;(3)不放回抽取;(4)等可能抽取;只有四个特点都满足的抽样才是简单随机抽样.2.抽签法与随机数表法的适用情况.(1)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.考点2系统抽样(讲练互动)[典例1](2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生解析:根据题意,系统抽样是等距抽样,所以抽样间隔为1000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.答案:C[典例2](2020·东莞调研)有24名投资者想到某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为1~24号,再用系统抽样方法抽出6名投资者,邀请他们到实施进行考察.其中年龄不超过55岁的人数为()A.1B.2C.3D.4解析:由系统抽样,将24名投资者分成6组,每组4人,根据茎叶图知,投资者中年龄不超过55岁的共8人,共2组.所以根据系统抽样,需抽取年龄不超过55岁的为2人.答案:B1.如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是nN.2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.1.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16B.17C.18D.19解析:因为从1000名学生中抽取一个容量为40的样本,所以系统抽样的分段间隔为100040=25,设第一组随机抽取的号码为x,则抽取的第18组的号码为x+17×25=443,所以x=18.故选C.答案:C2.(2020·华南师大附中月考)将参加夏令营的400名学生编号为001,002,…,400,采用系统抽样的方法抽取一个容量为40的样本,且随机抽得的第1个号码为003,这400名学生分住在三个营区,从001到180在第一营区,从181到295在第二营区,从296到400在第三营区,三个营区被抽中的人数分别为()A.18,12,10B.20,12,8C.17,13,10D.18,11,11解析:根据系统抽样特点,知抽样间隔为40040=10,被抽到的号码为l=10k+3,k∈Z.由题意可知,第一营区可分为18个小组,每组抽取1人,共抽取18人,第二营区的编号为181到295,则181≤10k+3≤295.所以18≤k≤29,且k∈Z,则第二营区抽12人.因此第三营区抽取40-(12+18)=10(人).所以三个营区抽取的人数分别为18人,12人,10人.答案:A考点3分层抽样及其应用(多维探究)角度求某层入样的个体数[典例1](2020·广州名校联考)《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出________钱(所得结果四舍五入,保留整数).解析:依题意,交钱的抽样比为100560+350+180=10109,所以丙应该出钱为180×10109≈17(钱).答案:17角度求总体或样本总量[典例2]某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36解析:根据分层柚样方法知n960+480=24960,解得n=36.答案:D[典例3](2020·江南名校联考)某单位员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是145,则该单位员工总数为()A.110B.100C.900D.800解析:因为员工按年龄分为A,B,C三组,其人数之比为5∶4∶1,所以从中抽取一个容量为20的样本,则抽取的C组人数为11+4+5×20=110×20=2.设C组员工总数为m,则甲、乙二人均被抽到的概率为C22C2m=2m(m-1)=145,则m=10.设员工总数为x,则由10x=15+4+1=110,可得x=100.答案:D1.分层抽样中分多少层,