第3讲统计与统计案例专题三概率与统计板块三专题突破核心考点[考情考向分析]1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.热点分类突破真题押题精练内容索引热点分类突破热点一抽样方法1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.例1(1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为A.107B.097C.207D.187解析答案√则抽取学生的编号组成以7为首项,20为公差的等差数列,其通项公式为an=7+20(n-1),∴a10=7+20(10-1)=187.解析根据题意组距为100050=20,(2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为_____.43解析由题意可知,在高二年级中抽调的人数为128×860880+860+820=43.解析答案(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.思维升华跟踪演练1(1)(2018·福州检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是A.简单随机抽样B.按性别分层抽样C.按年龄段分层抽样D.系统抽样答案√解析(2)(2018·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,10,18,26,34答案√解析由系统抽样方法的概念可知,抽取5位,必须每层都有,则每10个里面有1个,所以符合要求的编号可能是3,13,23,33,43.解析热点二用样本估计总体2.频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例2(1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为A.-11B.3C.9D.17答案√解析(2)(2018·齐齐哈尔模拟)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这320名学生中每周的自习时间不足22.5小时的人数约是A.68B.72C.76D.80答案√解析解析由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数约是320×(0.02+0.07)×2.5=72.(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.思维升华跟踪演练2(1)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列说法正确的是A.x甲x乙,乙比甲成绩稳定,应选乙参加比赛B.x甲x乙,甲比乙成绩稳定,应选甲参加比赛C.x甲x乙,甲比乙成绩稳定,应选甲参加比赛D.x甲x乙,乙比甲成绩稳定,应选乙参加比赛答案√解析(2)(2018·大庆质检)下面是追踪调查200个某种电子元件寿命(单位:h)的频率分布直方图,其中300~400,400~500的两组数据丢失,下列四个说法中有且只有一个与原数据相符,这个说法是①寿命在300~400的频数是90;②寿命在400~500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为150×0.1+250×0.15+350×0.45+450×0.15+550×0.15;④寿命超过400h的频率为0.3.A.①B.②C.③D.④答案√解析1.线性回归方程热点三统计案例方程y^=b^x+a^称为线性回归方程,其中b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=y-b^x,(x,y)称为样本点的中心.2.随机变量K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.解答例3(2018·广东省省际名校联考)某高三理科班共有60名同学参加某次考试,从中随机挑选出5名同学,他们的数学成绩x与物理成绩y如下表:数学成绩x145130120105100物理成绩y110901027870数据表明y与x之间有较强的线性关系.(1)求y关于x的线性回归方程;解答(2)该班一名同学的数学成绩为110分,利用(1)中的回归方程,估计该同学的物理成绩;解将x=110代入上述方程,得y^=0.8×110-6=82.K2=nad-bc2a+bc+da+cb+d,PK2≥6.635=0.01,PK2≥10.828=0.001.(3)本次考试中,规定数学成绩达到125分为优秀,物理成绩达到100分为优秀.若该班数学优秀率与物理优秀率分别为50%和60%,且除去抽走的5名同学外,剩下的同学中数学优秀但物理不优秀的同学共有5人.能否在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关?参考数据:回归直线的系数b^=∑ni=1xi-xyi-y∑ni=1xi-x2,a^=y-b^x.解答(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(),应引起关注.(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K2即可.思维升华x,y跟踪演练3(2018·河南省中原名校质检)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x=年份-2013.年份代码x1234线下销售额y95165230310(1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2019年该百货零售企业的线下销售额;解答(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据:b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x,解答K2=nad-bc2a+bc+da+cb+d,n=a+b+c+d.P(K2≥k0)0.150.100.050.0250.0100.005k02.0722.7063.8415.0246.6357.879真题押题精练1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为________.真题体验解析3,5答案2.(2017·山东改编)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为y^=b^x+a^.已知∑10i=1xi=225,∑10i=1yi=1600,b^=4.该班某学生的脚长为24,据此估计其身高为________.解析166答案3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下列叙述不正确的是_____.(填序号)①各月的平均最低气温都在0℃以上;②七月的平均温差比一月的平均温差大;③三月和十一月的平均最高气温基本相同;④平均最高气温高于20℃的月份有5个.④解析答案解析由题意知,平均最高气温高于20℃的有七月,八月,故④不正确.4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______件.18解析答案解析∵样本容量总体个数=60200+400+300+100=350,∴应从丙种型号的产品中抽取350×300=18(件).押题预测1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图,如图所示.设甲、乙两地的满意度分数的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则A.x甲x乙,m甲m乙B.x甲x乙,m甲m乙C.x甲x乙,m甲m乙D.x甲x乙,m甲m乙押题依据从茎叶图中提取数字的特征(如平均数、众数、中位数等)是高考命题的热点题型.解析押题依据答案√解析由题图知,(0.04+0.12+x+0.14+0.05)×2=1,解得x=0.15,所以学习时间在6至10小时之间的频率是(0.15+0.14)×2=0.58,所求人数为100×0.58=58.2.某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘制成频率分布直方图,如图所示,则这100名学生中学习时间在6至10小时之间的人数为________.押题依据频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查学生的基本分析能力,是高考的热点.58解析押题依据答案3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;押题依据线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点.解答押题依据解答(2)求出y关于x的线性回归方程y^=b^x+a^,并在坐标系中画出回归直线;解答(注:b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x)(3)试预测加工10个零件大约需要多少小时?得y^=0.7×10+1.05=8.0