2020届高考数学一轮总复习 第十单元 计数原理 、概率与统计 第78讲 随机抽样、用样本估计总体课

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

高考总复习第(1)轮理科数学第十单元计数原理、概率与统计第78讲随机抽样、用样本估计总体1.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.概率(机会)逐个不放回抽签法随机数表法均衡较多一个1.随机抽样(1)简单随机抽样:设一个总体的个体数为N,从中抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的都相等,就把这种抽样的方法叫作简单随机抽样.最常用的简单随机抽样的方法有两种——(抓阄法)和.(2)系统抽样:当总体的个体数目时,可将总体分成的几部分,然后按照事先定出的规则,从每一部分抽取个体,得到所需要的样本,称此抽样为系统抽样.(3)分层抽样:在抽样时,将总体分成___的层,然后按照一定的____,从各层独立地抽取一定数量的个体,将各层取出的个体____作为样本,这种抽样方法叫做分层抽样.简单随机抽样、系统抽样、分层抽样的共同特点是在抽样过程中每一个个体被抽取的,体现了这些抽样方法的客观性和公平性.互不交叉概率相等比例合在一起2.用样本估计总体(1)用样本的频率分布估计总体的分布①频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各小组数据在样本容量中所占比例的大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤:a.求极差;b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.②频率分布折线图连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.③茎叶图茎是指中间的一列数,叶是从生长出来的数.茎叶图表示数据有两个突出的优点.其一是统计图上没有的损失,其二是方便记录与表示.中点原始数据茎的旁边(2)用样本的数字特征估计总体的数字特征①众数、中位数、平均数众数:一组数据中出现次数最多的数.中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两个数的平均数是中位数.平均数:样本数据的算术平均数,即x-=1n(x1+x2+…+xn).反映了一组数据的平均水平.②标准差和方差计算公式s=1n[x1-x-2+x2-x-2+…+xn-x-2].s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].标准差和方差都反映了样本数据的离散程度.1.(经典真题)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解:因为三个学段学生的视力情况差别较大,故需要按学段分层抽样.答案:C2.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2p3B.p2=p3p1C.p1=p3p2D.p1=p2=p3解:在简单随机抽样、系统抽样和分层抽样中,每个个体被抽取的概率均为nN,所以p1=p2=p3.答案:D3.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01解:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案:D4.关于频率分布直方图中有关数据,下列说法正确的是()A.直方图的高表示该组上的个体在样本中出现的频率B.直方图的高表示取某数的频率C.直方图的高表示该组上的个体数与组距的比值D.直方图的高表示该组上个体在样本中出现的频率与组距的比值解:直方图的高表示频率组距,矩形的面积表示频率.答案:D5.(经典真题)重庆市2013年各月的平均气温(℃)数据的茎叶图如右图,则这组数据的中位数是()A.19B.20C.21.5D.23解:由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.答案:B抽样方法频率分布直方图茎叶图的应用考点1·抽样方法【例1】(1)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号.按编号平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第1组中用抽签法确定的号码是____________.(2)(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解:(1)设在第1组中用抽签法确定的号码为x0,根据系统抽样的概念,在第2组,应抽出的号码是x0+8,在第3组,应抽出的号码是x0+2×8,……在第n组,应抽出的号码是x0+(n-1)×8,由条件,第16组应抽出的号码为126,则x0+(16-1)×8=126,所以x0=6,故用抽签法在第一组中确定的号码为6.(2)因为抽样比=样本容量总体个数=60200+400+300+100=350,所以应从丙种型号的产品中抽取350×300=18(件).答案:(1)6(2)18【变式探究】1.(1)(经典真题)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是.解:(1)对数据进行分组,在区间[139,151]上,有几组就有几个运动员.因为35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.答案:4(2)(2019·贵州铜仁月考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,20解:(2)由图1知,学生总数为3500+4500+2000=10000人,故样本容量为10000×2%=200.由图2知,高中生近视人数为2000×50%=1000人,按2%的比例抽取,应抽取1000×2%=20人.答案:A点评:(1)系统抽样的四个步骤可简记为“编号——分段——确定起始号——抽取样本”四步.根据系统抽样的概念,若n部分中在第一部分抽取的号码为x0,分段间隔为d,则由等差数列的知识可知,在第k部分中抽取的第k个号码为x0+(k-1)d.(2)分层抽样的步骤:①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④合成样本.采用分层抽样时,要注意公式的准确运用:①抽样比=样本容量个体总量=各层样本容量各层个体数量;②某层抽取的个体数=抽样比×该层个体数.考点2·频率分布直方图【例2】从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示.(1)直方图中x的值为__________;(2)在这些用户中,用电量落在区间[100,250)内的户数为__________.解:(1)由于(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,解得x=0.0044.(2)数据落在[100,250)内的频率是(0.0036+0.0060+0.0044)×50=0.7,所以月用电量在[100,250)内的户数为100×0.7=70.答案:(1)0.0044(2)70【变式探究】2.(2016·山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140解:由直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.答案:D点评:(1)在频率分布直方图中,要注意掌握如下性质:①每一个小矩形的高等于每一组的频率组距;②每个小矩形的面积表示频率;③所有矩形的面积之和等于1.(2)性质的应用:①若纵轴上存在参数值,则根据“所有矩形的面积之和等于1”,列方程即可求得参数值;②每组的频率、频数的计算:每组的频率=这小组的频数样本容量=小矩形的面积;每组的频数=这一小组的频率×样本容量.考点3·茎叶图的应用【例3】高二到高三的5次大型考试中,甲、乙两位同学的数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别为x-甲,x-乙,则下列结果正确的是()A.x-甲x-乙,甲比乙成绩稳定B.x-甲x-乙,乙比甲成绩稳定C.x-甲x-乙,甲比乙成绩稳定D.x-甲x-乙,乙比甲成绩稳定分析:要得到甲、乙两位同学的平均数的大小及稳定程度,可通过计算x-及方差来判断,也可直接观察茎叶图的分布得到.解:(方法1)x-甲=15(72+77+78+86+92)=81,x-乙=15(78+88+88+91+90)=87.x-甲x-乙,s2甲=15[(-9)2+(-4)2+(-3)2+52+112]=50.4,s2乙=15[(-9)2+12+12+42+32]=21.6,因为s2乙s2甲,所以乙的成绩稳定,故选D.(方法2)因为乙的成绩数据的“重心”与甲比较偏下,所以x-甲x-乙,又因为乙的成绩比甲的集中,所以乙的成绩稳定,故选D.答案:D【变式探究】3.(2016·石家庄市一模)为比较甲乙两地某月11时的气温情况,随机选取该月中的5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,有以下结论:甲乙982689210311①甲地该月11时的平均气温低于乙地该月11时的平均气温;②甲地该月11时的平均气温高于乙地该月11时的平均气温;③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差;④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差.其中根据茎叶图能得到的正确结论的编号为()A.①③B.①④C.②③D.②④解:由茎叶图可知甲地5天的气温分别是28℃、29℃、30℃、31℃、32℃,则x-甲=30℃,s2甲=2;乙地5天的气温分别是26℃、28℃、29℃、31℃、31℃,则x-乙=29℃,s2乙=3.6.所以x-甲x-乙,s甲s乙,选C.点评:(1)平均数、中位数、众数与方差、标准差都是重要的数字特征,可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数大,数据集中者方差较小.1.统计的一个基本思想是通过部分的数据来推测全体数据的性质,这就涉及两个基本问题,一是如何获取样本,二是如何通过样本对总体作出估计.2.获取样本的方法是三

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功