第十一章概率与统计专题2统计与统计案例【三年高考】1.【2017江苏】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.4.【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳5.【2017山东,理5】为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为ˆˆˆybxa.已知101225iix,1011600iiy,ˆ4b.该班某学生的脚长为24,据此估计其身高为(A)160(B)163(C)166(D)1706.【2017课标1,文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数7.【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5B.5,5C.3,7D.5,78.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C,B点表示四月的平均最低气温约为5C.下面叙述不正确的是.①各月的平均最低气温都在0C以上②七月的平均温差比一月的平均温差大③三月和十一月的平均最高气温基本相同④平均气温高于20C的月份有5个9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下0891258200338312则这组数据中的中位数是.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为.(高中部)(初中部)男男女女60%70%13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为石.14.【2015高考广东,文12】已知样本数据1x,2x,,nx的均值5x,则样本数据121x,221x,,21nx的均值为.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.甲乙丙丁100√×√√[来源:学#科#网Z#X#X#K]217×√×√200√√√×300√×√×85√×[来源:学,科,网]××98×√××(I)估计顾客同时购买乙和丙的概率;(II)估计顾客在甲、乙、丙、丁中同时购买3中商品的概率;[来源:学科网](III)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大?16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图2.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240,240,260,260,280,280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240的用户中应抽取多少户?【2018年高考命题预测】商品顾客人数概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验(2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为,平均数为.13015017019021023000.0020.0030.0050.0150.020频率/组距月用电量1102.某城市100户居民的月平均用电量(单位:度),以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240,240,260,260,280,280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240的用户中应抽取多少户?【考点2】相关性、最小二乘估计与统计案例【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.回归方程(1)最小二乘法如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用表达式[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.(2)回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.niniiniiiniixnxyxnyxxxyyxxb12211121)())((,xbya3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘法估计分别为:niniiniiiniixnxyxnyxxxyyxxb12211121)())((,xbya).其中x=1ni=1nxi,y=1ni=1nyi,(x,y)称为样本点的中心.(3)相关系数①11122221111()()()()()()nniiiiinnnniiiiiiiixxyyxynxyrxxyyxxyy,②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.4.独立性检验(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1.2×2列联表BAB1B2总计A1aba+bA2cdc+d总计a+cb+da+b+c+d构造一个随机变量22()()()()()nadbcKabcdacbd错误!未找到引用源。其中错误!未找到引用源。为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验.(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;②当χ2>2.706时,有90%的把握判定变量A,B有关联;③当χ2>3.841时,有95%的把握判定变量A,B有关联;④当χ2>6.635时,有99%的把握判定变量A,B有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒:一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概