【新高考复习】考向50 抽样方法与总体分布的估计-备战2022年高考数学一轮复习考点微专题(新高考地

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

考向50抽样方法与总体分布的估计1.(2021·全国·高考真题)(多选题)有一组样本数据1x,2x,…,nx,由这组数据得到新样本数据1y,2y,…,ny,其中iiyxc(1,2,,),inc为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同【答案】CD【分析】A、C利用两组数据的线性关系有()()EyExc、()()DyDx,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.【详解】A:()()()EyExcExc且0c,故平均数不相同,错误;B:若第一组中位数为ix,则第二组的中位数为iiyxc,显然不相同,错误;C:()()()()DyDxDcDx,故方差相同,正确;D:由极差的定义知:若第一组的极差为maxminxx,则第二组的极差为maxminmaxminmaxmin()()yyxcxcxx,故极差相同,正确;故选:CD2.(2021·山东·高考真题)打算从500名学生中抽取50名进行问卷调查,拟采纳系统抽样方式,为此将他们一一编号为1~500,并对编号进行分段,假设从第一个号码段中随机抽出的号码是2,那么从第五个号码段中抽出的号码应是______.【答案】42【分析】由题设,根据等距抽样的特点确定第五个号码段中抽出的号码即可.【详解】从500名学生中抽取50名,那么每两相邻号码之间的距离是10,第一个号码是2,那么第五个号码段中抽取的号码应是241042.故答案为:421.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体编号②确定分段间隔k,对编号进行分段.nN(n是样本容量)是整数时,取k=nN;③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.2.要点归纳(1)在三种抽样方法中,简单随机抽样是最基本、最简单的抽样方法,其他两种抽样方法都是建立在它的基础之上的.(2)三种抽样方法各有特点和适用范围,在抽样实践中要根据具体情况选取相应的抽样方法.1.简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.3.频率分布直方图(1)纵轴表示组距频率,即小长方形的高=组距频率;(2)小长方形的面积=组距×组距频率=频率;(3)各个小方形的面积总和等于1.4.频率分布表的画法第一步:求极差,决定组数和组距,组距=组数极差;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.5.茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.6.中位数、众数、平均数的定义(1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数.(3)平均数一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=n1(x1+x2+…+xn).7.样本的数字特征如果有n个数据x1,x2,…,xn,那么这n个数的(1)平均数=n1(x1+x2+…+xn).(2)标准差s=1.(3)方差s2=n1[(x1-)2+(x2-)2+…+(xn-)2].【常用结论】1.(2021·宁夏·银川一中三模(文))关于线性回归的描述,有下列命题:①回归直线一定经过样本中心点;②相关系数r的绝对值越大,拟合效果越好;③相关指数2R越接近1拟合效果越好;④残差平方和越小,拟合效果越好.其中正确的命题个数为()A.1B.2C.3D.42.(2021·广东肇庆·模拟预测)(多选题)以下命题是真命题的是()A.当总体是由差异明显的几个部分组成时,通常采用分层抽样B.若m为数据(1ixi,2,3,L,2021)的中位数,则1011mxC.回归直线可能不经过样本点的中心(,)xyD.独立性检验不可以100%确定两个变量之间是否具有某种关系3.(2021·四川省南充市白塔中学模拟预测(理))某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.4.(2021·黑龙江·佳木斯一中三模(文))下列说法正确的是___________.①平面内到定点与定直线的距离相等的点的轨迹是抛物线.②利用最小二乘法原理求回归直线,就是使残差平方和最小的原理求得参数b的.③在线性回归模型中,计算相关指数20.6R,这表明解释变量只解释了60%预报变量的变化.④若存在实数T,使yfx,xR,对xR恒有()()fxTfx+=,则T是fx的一个周期.1.(2021·陕西·模拟预测(文))某乡政府对甲、乙、丙三个村的扶贫对象进行抽样调查,其中甲村30人,乙村25人,丙村40人,用分层抽样的方法抽取19人,则从甲、丙两村共抽取的人数为()A.8B.11C.13D.142.(2021·甘肃·天水市第一中学模拟预测(文))我国古代数学名著《数书九章》中有“米谷粒分”问题;“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒内有谷二十八颗,凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.153石B.154石C.169石D.170石3.(2021·北京·模拟预测)某学校高二年级选择“史政地”、“史政生”和“史地生”这三种组合的学生人数分别为210、90和60.若采用分层抽样的方法从中随机抽取12名学生,则从“史政生”组合中抽取的学生人数为()A.7B.6C.3D.24.(2021·云南大理·模拟预测(理))在发生某公共卫生事件期间,有专业机构认为该事件在一段事件内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:总体平均数为3,中位数为4;乙地:总体平均数为1,总体方差大于0;丙地:中位数为2,众数为3;丁地:总体平均数为2,总体方差为3.则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是()A.甲地B.乙地C.丙地D.丁地5.(2020·四川宜宾·一模(文))某团支部随机抽取甲乙两位同学连续9期“青年大学习”的成绩(单位:分),得到如图所示的成绩茎叶图,关于这9期的成绩,则下列说法正确的是()A.甲成绩的中位数为32B.乙成绩的极差为40C.甲乙两人成绩的众数相等D.甲成绩的平均数高于乙成绩的平均数6.(2021·广东肇庆·模拟预测)(多选题)已知一组数据为-1,1,5,5,0,则该组数据的()A.众数是5B.平均数是2C.中位数是5D.方差是3257.(2021·上海·模拟预测)已知某市A社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人,为了解该社区35岁至65岁居民的身体健康状兄,社区负责人采用分层抽样技术抽取若干人进行体检调查,若这次抽样调查抽取的人数是70人,则从46岁至55岁的居民中随机抽取了_______人.8.(2021·河南驻马店·模拟预测(文))某班级为了解本班48名学生的心理健康情况,将这些学生编号为1,2,3,…,48,从这些学生中用系统抽样方法等距抽取6名学生进行心理健康测试.若33号学生被抽到,则在13-18号学生中被抽到的是______号.9.(2021·新疆·克拉玛依市教育研究所模拟预测(理))2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年.某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断如下:①过去的6年,“甲”的极差小于“乙”的极差;②过去的6年,“甲”的平均值小于“乙”的平均值;③过去的6年,“甲”的中位数小于“乙”的中位数;④过去的6年,“甲”的平均增长率小于“乙”的平均增长率.上述判断中,所有正确结论的序号为_______.10.(2021·四川·成都七中实验学校三模(文))医学统计表明,X疾病在老年人中发病率较高.已知某地区老年人的男女比例为3:2,为了解X疾病在该地区老年人中发病情况,按分层抽样抽取100名老人作为样本,对这100位老人是否患有X疾病进行统计,得条形图如下所示.(1)完成下列2×2列联表,并判断有没有90%的把握认为患X疾病与性别有关?男性女性合计患有X疾病未患X疾病合计(2)在这100个样本中,将未患X疾病老年人按年龄段[60,65),[65,70),[70,75),[75,80),[80,85]分成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).附:22()()()()()nadbcKabcdacbd,其中nabcd.20PKk0.150.100.050.0250.0100.0050.0010k2.0722.7063.8415.0246.6357.87910.82811.(2020·陕西富平·二模(文))在全面建成小康社会的决胜阶段,让贫困地区同全国人民共同进入全面小康社会是我们党的庄严承诺.在“脱真贫,真脱贫”的过程中,精准扶贫助推社会公平显得尤其重要.若某农村地区有200户贫困户,经过一年扶贫后,对该地风的“精准扶贫”的成效检查验收.从这200户贫困户中随机抽出50户,对各户的人均年收入(单位:千元)进行调查得到如下频数表:人均年收入0,22,44,66,88,1010,12频数231020105若人均年收入在4000元以下的判定为贫困户,人均年收入在4000元~8000元的判定为脱贫户,人均年收入达到8000元的判定为小康户.为了了解未脱贫的原因,从抽取的50户中用分层抽样的方法抽10户进行调研.(1)贫困户、脱贫户、小康户分别抽到的户数是多少?(2)从被抽到的脱贫户和小康户中各选1人做经验介绍,求小康户中人均年收入最高的一户被选到的概率.12.(2021·广东肇庆·模拟预测)为了迎接新高考,某校举行物理和化学等选科考试,其中,600名学生化学成绩(满分100分)的频率分布直方图如图所示,其中成绩分组区间是:第一组45,55,第二组55,65,第三组65,75,第四组75,85,第五组85,95.已知图中前三个组的频率依次构成等差数列,第一组和第五组的频率相同.(1)求a,b的值;(2)估算高分(大于等于80分)人数;(3)估计这600名学生化学成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1).1.(2021·湖南·高考真题)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区

1 / 24
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功