第2讲统计与统计案例专题六概率、统计、复数、算法、推理与证明2016考向导航——适用于全国卷Ⅱ统计的主要内容包括随机抽样、用样本估计总体、变量的相关性.该部分在高考中主要是以选择题或填空题的形式考查随机抽样方法,根据样本的频率分布表和频率分布直方图考查用样本估计总体,根据茎叶图考查数据特征数的计算及变量的相关性等,近年来把统计和概率结合起来命制解答题是高考考查的一个趋势.由于高考中一般不允许使用计算器,对统计案例考查一般以选择题或填空题的形式出现.专题六概率、统计、复数、算法、推理与证明栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明1.必记概念与定理(1)抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.(2)统计中的四个数据特征①众数:在样本数据中,出现次数最多的数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明③平均数:样本数据的算术平均数,即x=1n(x1+x2+…+xn).④方差与标准差方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].标准差:s=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明2.活用公式与结论(1)直方图的三个结论①小长方形的面积=组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形高的和为1组距.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明(2)线性回归方程方程y^=b^x+a^称为线性回归方程,其中b^=,a^=y--b^x;(x,y-)称为样本中心点.(3)独立性检验K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明3.辨明易错易混点(1)不能正确地从频率分布直方图中提取相关信息,混淆了频数与频率.(2)回归直线方程中一次项系数为b^,常数项为a^,这与一次函数的习惯表示不同.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明考点一抽样方法[命题角度]1.系统抽样的概念.2.分层抽样中的数值计算.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明(1)(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.C4栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明[思路点拨](1)分别计算出初中部、高中部的女教师人数,然后求和.(2)对数据进行分组,在区间[139,151]上有几组就有几个运动员.[解析](1)初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137.(2)35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明方法归纳(1)在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔即为Nn(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明1.某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250解析:法一:由题意可得70n-70=35001500,解得n=100,故选A.法二:由题意,抽样比为703500=150,总体容量为3500+1500=5000,故n=5000×150=100.A栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明2.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,则三个营区被抽中的人数依次为()A.26,16,8B.25,17,8C.25,16,9D.24,17,9B栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明解析:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300,得k≤1034,因此A营区被抽中的人数是25;令3003+12(k-1)≤495,得1034k≤42,因此B营区被抽中的人数是42-25=17.结合各选项知,选B.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明3.(2015·沈阳预测)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________.解析:根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为805=16.又其中有1个为28,则与之相邻的为12和44,故所取5个数依次为12,28,44,60,76,即最大的编号为76.76栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明考点二用样本估计总体[命题角度]1.用统计图表估计总体.2.用样本的数字特征估计总体特征.(1)(2015·高考安徽卷)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32C栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明[思路点拨](1)利用样本数据标准差的计算公式和性质求解.(2)利用各小矩形的面积和为1,建立关于a的方程,解方程求a.(2)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示,则直方图中的a=________.3栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明[解析](1)已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16.(2)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明1.在本例(2)条件下,在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为___________.解析:区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.6000栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明2.在本例(2)条件下,求消费金额的众数和中位数.解:消费金额的众数是0.5+0.62=0.55.因为(1.5+2.5)×0.1=0.4<0.5,所以消费金额的中位数在[0.5,0.6)内,设中位数为b,则(1.5+2.5)×0.1+3(b-0.5)=0.5,所以b=815,即中位数为815.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明3.(2015·西安地区八校联考)如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x,y的值分别为()A.2,4B.4,4C.5,6D.6,4解析:x甲=75+82+84+(80+x)+90+936=85,解得x=6,由题图可知y=4,故选D.D栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明方法归纳(1)众数、中位数、平均数与直方图的关系①众数为频率分布直方图中最高矩形的底边中点的横坐标.②中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.③平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.(2)方差的计算与含义计算方差首先要计算平均数,然后再按照方差的计算公式进行计算,方差和标准差是描述一个样本和总体的波动大小的特征数,标准差大说明波动大.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明考点三变量的相关性与统计案例[命题角度]1.求线性回归方程问题.2.利用回归分析对有关变量作出估计.3.独立性检验.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程y^=b^t+a^;(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程y^=中,a^=y--b^t-.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明[审题路线图](1)(审图表、数据)数表――→识表n、t-、y-的值―→ltt、lty、b^、a^的值―→方程(2)t=6―→代入方程―→结果栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明[解](1)列表计算如下:itiyit2itiyi11515226412337921448163255102550∑153655120这里n=5,t-=1ni=1nti=155=3,y-=1ni=1nyi=365=7.2.栏目导引要点整合夯基释疑导学导练核心突破专题强化精练提能专题六概率、统计、复数、算法、推理与证明又ltt=∑ni=1t2i-nt-2=55-5×32=10,lty=∑ni=1tiyi-nt-y-=120-5×3×7.2=12,从而b^=ltyltt=1210=1.2,a^=y--b