12016届高三文数佛一模复习专题——概率统计整理人:许少彤2014—1—4一、2011——2015年课标卷考点回顾2011年,选择题6:古典概型;解答题19:分段函数应用题,用频率估计概率,平均数;2012年,选择题3:线性相关;解答题18:分段函数应用题,频率分布表及互斥事件的概率;2013年,选择题3:古典概型;解答题18:茎叶图,能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理解释;2014年,选择题13:古典概型;解答题18:频率分布直方图,估计特征值,用样本估计总体;2015年,选择题4:古典概型;解答题19:回归分析;通过对近几年课标1卷的考点回顾,可以看出概率统计的考查通常是2道题,一小一大。小题中古典概型为高频考点,侧重高频考点的同时,应注意关注其他考点的复习:如几何概型、抽样方法、特征值、统计图表等,解答题主要考查用样本估计总体、计算或估算特征值、回归分析、独立性检验、概率、频率分布直方图、茎叶图、应用题。有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点,概率与统计结合题,无论是直接描述还是利用频率分布表、分布直方图、茎叶图等给出信息,只需要能够从题中提炼出需要的信息,则此类问题即可解决.注重对统计概率思想理解的同时,应该注重以下三项基本技能的加强:一是读图能力(常考的有直方图、茎叶图);二是计算能力(常考的有均值、方差等);三是阅读理解能力(其中事件的描述(对量词的准确理解,如“至多、至少”))。二、知识点梳理第一部分概率考向1随机事件的频率与概率1、随机事件的概率的基本性质(1)概率的取值范围为0≤P(A)≤1(2)必然事件的概率为1,不可能事件的概率为0.2、频率与概率(1)在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)=nAn为事件A出现的频率.(2)对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率.考向2互斥事件与对立事件的概率1、事件的关系与运算定义符号表示包含关系如果事件A发生,则事件B一定发生,这时称事件B包含A(或称事件A包含于事件B)B⊇A(或A⊆B)相等关系若B⊇A且A⊇BA=B并事件(和事件)若某事件发生当且仅当A发生或事件B发生,称此事件为事件A与事件B的并事件(或和事件)A∪B(或A+B)交事件(积事件)若某事件发生当且仅当事件A发生且事件B发生,则称此事件为事件A与事件B的交事件(或积事件)A∩B(或AB)互斥事件若A∩B为不可能事件,则事件A与事件B互斥A∩B=∅对立事件若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件A∩B=∅P(A∪B)=P(A)+P(B)2=1【方法总结】互斥事件、对立事件概率的求法(1)解决此类问题,首先应该根据互斥事件和对立事件的定义分析是不是互斥事件或对立事件,再选择概率公式进行计算。(2)求复杂的互斥事件的概率一般有两种方法:①直接求解法,将所求事件的概率分解为一些彼此互斥的事件的概率的和,运用互斥事件的求和公式计算.②间接求法,先求此事件的对立事件的概率,再用公式P(A)=1-P(A),即运用逆向思维(正难则反),特别是“至多”,“至少”型题目,用间接求法就显得较简便.考向3古典概型1、古典概型的两个特点(1)有限性:试验中所有可能出现的基本事件只有有限个.(2)等可能性:每个基本事件出现的可能性相等.2、古典概型的概率公式(1)在基本事件总数为n的古典概型中,每个基本事件发生的概率都是相等的,即每个基本事件的概率都是1n.(2)如果随机事件A包含的基本事件数为m,由互斥事件的概率加法公式可得mPAn.即对于古典概型,任何事件的概率为PAA包含的基本事件的个数基本事件的总数.【方法总结】求古典概型概率的步骤(1)反复阅读题目,收集题目中的各种信息,理解题意;(2)判断试验是否为古典概型,并用字母表示所求事件;(3)利用列举法(或列表法或树状图)求出总的基本事件的个数n及事件A中包含的基本事件的个数m;(4)计算事件A的概率mPAn.考向4几何概型1、几何概型的定义如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称为几何概型.2、几何概型的特点(1)无限性:在一次试验中,基本事件的个数是无限的;(2)等可能性:每个基本事件发生的可能性是相等的.3、几何概型的概率计算公式P(A)=构成事件A的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积第二部分统计与统计案例考向1三种抽样方法及其应用1、三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样都是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.从总体中逐个抽到总体中的个数较少系统抽样将总体分成均衡的若干部分,按照事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成2、分层抽样中公式的运用3(1)抽样比=样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.考向2统计图表1、频率分布直方图(1)纵轴表示频率组距,矩形的面积=组距╳频率组距=频率.(2)各矩形的面积总和等于1.【注意】茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数。有单侧茎叶图、双侧茎叶图。考向3用样本估计总体1、通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.2、众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标平均数样本数据的算术平均数,即x=1n(x1+x2+…+xn).每个小长方形的面积乘以小矩形底边中点的横坐标之和.3、方差和标准差方差和标准差反映了数据波动程度的大小.(1)方差2222121nsxxxxxxn(2)标准差s=1n[x1-x2+x2-x2+…+xn-x2]考向4线性回归方程及其应用1、两个变量的线性相关(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.2、相关系数12211()()niiinniiiixxyyrxxyy1222211()()niiinniiiixxyyxnxyny.(1)|r|≤1,当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.(2)|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量的线性相关关系越弱,几乎不存在;通常|r|>0.75时,我们认为两个变量之间存在较强的线性相关关系.3、线性回归直线方程yabx,其中1122211nniiiiiinniiiixxyyxynxybxxxnxaybx.(*)是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.4【注意】回归直线一定经过样本的中心点,xy据此性质可以解决有关的计算问题同时可以应用回归直线方程作出预测。【方法总结】求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)列表求出22111,,,,nnniiiiiiixyxyxy(3)利用公式(*)求得回归系数;(4)写出回归直线方程。考向5独立性检验1、2×2列联表列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:构造一个随机变量K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d为样本容量.2、判断两个分类变量X和Y是否有关系的方法利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.三、经典题型[2014·全国新课标卷Ⅱ]某市为了考核甲、乙两部门的工作情况,随机访问了50位市民。根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(I)分别估计该市的市民对甲、乙两部门评分的中位数;(II)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(III)根据茎叶图分析该市的市民对甲、乙两部门的评价。【考点分析】考查读图能力(茎叶图)、用样本的数字特征估计总体、根据茎叶图进行合理解释。y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d5[2014·全国新课标卷Ⅰ]从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)在答题卡上作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【考点分析】考查作图能力(频率分布直方图)、估计平均值及方差、用样本估计总体.[2016届辽宁省五校协作体]“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;判断是否有90%的把握认为猜对歌曲名称是否与年龄有关;说明你的理由;)(02kKP0.100.050.0100.0050k2.7063.8416.6357.879(2)现计划在这次场外调查中按年龄段用分层抽样的方法选取6名选手,并抽取2名幸运选手,求2名幸运选手中至少有一人在20~30岁之间的概率.(参考公式:))()()(()(22bddccababcadnK.其中dcban.)【考点分析】考查列2×2列联表、独立性检验、古典概型.6[14新课标2理]某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9⑴求y关于t的线性回归方程;⑵利用⑴中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121niiiniittyybtt,ˆˆaybt【考点分析】考查求回归直线方程、利用回归直线方程进行预测[2012·课标全国卷]某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式;(2)花店记录了100天玫瑰花