专题五概率与统计【考试内容】变量的相关性;回归分析;独立性检验;古典概型;互斥事件的概率加法公式;几何概型;概率统计初步综合问题【近6年新课标卷考点统计】年份试卷类型201420152016201720182019新课标Ⅰ卷5551055新课标Ⅱ卷55510510新课标Ⅲ卷1051010重要考点回顾一、三种抽样方法的联系与区别类别共同点不同点相互联系适用范围简单随机抽样都是等概率抽样从总体中逐个抽取总体中个体比较少系统抽样将总体均匀分成若干部分;按事先确定的规则在各部分抽取在起始部分采用简单随机抽样总体中个体比较多分层抽样将总体分成若干层,按个体个数的比例抽取在各层抽样时采用简单随机抽样或系统抽样总体中个体有明显差异1.从含有N个个体的总体中抽取含n个个体的样本,每个个体被抽到的概率为2.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先确定的规则抽取样本..nN3.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样;(4)汇合成样本.4.要懂得从图表中提取有用信息如:在频率分布直方图中①小矩形的面积=组距×=频率;②众数是最高矩形的中点的横坐标;③中位数的左边与右边的直方图的面积相等,可以由此估计中位数的值.频率组距二、用样本的数字特征估计总体的数字特征1.众数:在一组数据中,出现次数最多的数称为众数.在频率分布直方图中用面积最大的矩形的横轴中点对应的数来估计众数.(最高矩形的横坐标中点)2.中位数:在按大小顺序排列的一组数据中,当一组数据有奇数个时,居于中间的数称为中位数;当一组数据有偶数个时,居于中间两数的平均数称为中位数.在频率分布直方图中,是用使图形左右两边面积相等的与横轴垂直的直线所对应的横坐标来估计中位数.3.平均数:是指一组数据的算术平均数.在频率分布直方图中,利用每个小矩形的面积乘以小矩形底边中点的横坐标之和来估计平均数.平均数计算公式:4.极差:在一组数据中,最大值与最小值的差.12...nxxxxn5.标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差越大,数据的离散程度就越大;标准差越小,数据的离散程度就越小.标准差计算公式:6.方差:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.样本方差计算公式:222212()()...()nxxxxxxssn222212()()...()nxxxxxxsn三、古典概型和几何概型的概率1.古典概型的解题步骤(1)求出总的基本事件数;(2)求出事件A所包含的基本事件数,然后利用公式()APA包含的基本事件数总的基本事件数2.几何概型及均匀随机数的产生(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;(2)几何概型的概率公式:几何概型的特点:①试验中所有可能出现的结果(基本事件)有无限多个;②每个基本事件出现的可能性相等.()()()APA构成时间的区域长度面积或体积;试验的全部结果所构成的区域长度面积或体积四、两个变量的线性相关1.两个相关变量数据的散点图,会利用散点图认识变量的相关关系.2.求回归直线方程:注意:线性回归直线经过定点(,)xy1122211()(),()nniiiiiinniiiixxyyxynxybyabxxxxnxaybx其中五、独立性检验(分类变量关系)独立性检验为了研究事件X与Y的关系,经调查得到一张2×2列联表,如下表所示Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是:经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的k3.841时,有95%的把握说事件A与B有关;当k6.635时,有99%的把握说事件A与B有关;当k≤3.841时,认为事件A与B是无关的.22()()()()()nadbcKkabcdacbd【规律总结】独立性检验解题的步骤为:第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系;第二步,根据2×2列联表和公式计算K2统计量;第三步,查对临界值表,作出判断.P(K2≥k)0.500.400.250.150.10k0.4550.7081.3232.0722.706P(K2≥k)0.050.0250.0100.0050.001k3.8415.0246.6357.87910.8281.从装有3个红球、2个白球的袋中任取3个球,则所取的3个球中至少有1个白球的概率为()考点训练D31,2,3,21,2;3:1,2,3,1,2,1,1,3,1,2,3,1,1,2,2,1,3,2,2,3,2,1,1,2,2()()()()()()(,1,2,3,1,210,31,1)()()()(,AAABBAAAAABAABAABAABAABABBABBABBABBMMAA 【解析】 设个红球分别为个白球分别为则从袋中任取个球的所有可能为共种设所取个球中至少有个白球的事件为则含有基本事件2,1,1,3,1,2,3,1,1,2,2,1,3,2,2,3,2,1,1,2,2,)()()()()()()(1,2,3,1,29.9,D.10)()()BAABAABAABAABABBABBABBABBPM共种故选1339A.B.C.D.10105102.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为()A31,2,3,,,:1,1,1,2,1,3,2,1,2,2,2,3,3,1,3,()()()()()()()()()2,3,39,,:1,1,2,2,3,()()()(33.3)1,A.93()MMPM 【解析】 记个兴趣小组分别为设甲、乙两位同学各自参加各个小组为甲乙于是甲、乙两位同学各自参加其中一个小组的所有可能有共种记两位同学参加同一个兴趣小组的事件为则含有基本事件共种故选1123A.B.C.D.32343.袋中共有6个除了颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两球,两球颜色为一白一黑的概率等于()(B31,2,3,21,2;1,:1,2,1,3,1,1,1,2,1,,2,3,2,1,2,2,2,,3,1,3,2,3,,1,)()()()()()()()()()()()()()(2,1,,2,15,,)AAABBCAAAAABABACAAABABACABABACBBBCBC 【解析】 设个黑球分别为个白球分别为个红球为则从袋中任取两个球的所有可能为共种设从袋中任取两球两球颜色为一白一黑为事件,1,1,1,2,2,1,2,2,3,1,()()()()()()(623,26.,B.155)MMABABABABABABPM则含有基本事件共种故选1234A.B.C.D.55554.ABCD为长方形,AB=2,BC=1,O为AB的中点,在长方形ABCD内随机取一点,取到的点到O的距离大于1的概率为()B2,11,,2221,B.24ABCDABCDOO 【解析】 长方形的面积是长方形中到点的距离小于的点构成的图形是以为圆心为半径的半圆面积为所以所求概率为故选A.B.1C.D.144885.在长为12cm的线段AB上任取一点C.现作一矩形,邻边长分别等于线段AC,CB的长,则该矩形面积大于20cm2的概率为()22C,:1220,12200,:2100()()(),2102108cm.8220cm.123ACxxxxxxxxC 【解析】 设长为则即所以点只能在到共的长度内所以该矩形面积大于的概率为1124A.B.C.D.63356.设不等式组,表示平面区域为D,在区域D内随机取一个点,则此点到坐标原点的距离大于2的概率是()202D,202,:24,1290,2,,:.42,:4.24:,D.4xyDDDD 【解析】 不等式组表示的区域是一个边长为的正方形区域面积为这个区域内到坐标原点距离小于的区域是一个圆心角为半径为的扇形区域即的圆面积为区域内到坐标原点距离大于的区域是正方形区域减去扇形区域面积为所以在平面区域中任取一点到坐标原点距离大于的概率为故选0202xy24A.B.C.D.42647.在区间[-1,2]上随机取一个数x,则x∈[0,1]的概率为.1.31,2,,0,[1.13,1,.3][]xABxCDABCD 【解析】 此题属于几何概型问题如图在区间上随机取一个数相当于线段上任取一个点即相当于所取的点落在线段上由于线段的长是线段的长是故所求概率为8.从长度分别为2、3、4、5的四条线段中任意取出三条,则以这三条线段为边可以构成三角形的概率是.32345,4:2,3,4,2,4,5,2,3,5,()()()(3,4,5).2,3,4,2,4,5()()(,3,)4,5.3.4 【解析】 从长度分别为、、、的四条线段中任意取出三条不同的取法有共四种其中可以构成三角形的有共三种故可以构成三角形的概率是9.从一堆苹果中任取10个,称得它们的质量如下(单位:克)12512012210513011411695120134则样本数据落在[114.5,124.5)内的频率为()A.0.2B.0.3C.0.4D.0.5C114.5,124.5:41201221161204,0.4.C)10[. 【解析】 由题意可知样本数据落在内的有、、、共个故所求频率为故选10.容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40)的频率为()A.0.35B.0.45C.0.55D.0.65B10,40:2349,910,400.45.B.0[)[)2 【解析】 由频数表易知样本数据落在区间的频数为故样本数据落在区间的频率为故选分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454211.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53A:46,45,56.A. 【解析】 由茎叶图可知该样本的中位数、众数、极差分别是故选12345625023312448955577889001147917812.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101B.808C.1212D.2012B96,12112,:,9681:12212543808,B().8 【解析】 由于甲社区有驾驶员人且在甲社区抽取驾驶员的人数为故所抽取的比例为于是有故选13.某单位200名职工的年龄分布情况,如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1—5号,6—10号,…,196—200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.37;20,5,522,2,837.,4050%,4050%.()20 【解析】 根据系统抽样的原理每组个人第组抽出的号码是说明每组的第个人被抽中所以第组抽出的号码应该是根据分层抽样的原理岁以下占总职工人数所以应该抽取人14.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的