概率与统计重点知识回顾第一讲随机抽样第二讲概率计算——古典与几何概型第三讲统计——用样本估计总体第四讲统计案例——回归分析与独立性检验第五讲新课标高考真题选讲高三数学组:赵甫 一、统计1.抽样方法包括:简单随机抽样、系统抽样、分层抽样三种方法.2.频率分布直方图中,纵轴表示频率/组距,数据落在各个小组内的频率用小矩形的面积表示,各小矩形的面积和等于1.3.众数、平均数、中位数是描述数据的集中趋势的量,方差、标准差则是描述数据的波动大小.其中,方差的计算公式为s2=[(x1- )2+(x2- )2+…+(xn- )2].1nxxx为茎,个位数字作为叶,如数据为三位数,则把十位和百位数字合在一起作为茎,个位数字作为叶.二、概率1.在古典概型中,事件A的概率公式P(A)= .2.在几何概型中,事件A的概率公式P(A)= ,其中μΩ表示区域Ω的几何度量,μA表示区域A的几何度量.A包含的基本事件的个数基本事件的总数AΩμμ4.茎叶图通常用来记录两位数的数据,把两位数的十位数字作3.不可能同时发生的事件叫做互斥事件,若事件A和B为互斥事件,则P(A∪B)=P(A)+P(B),这个公式推广到n个互斥事件时也成立.(P(A∪B)也可记为P(A+B))三、统计案例1.回归分析(1)回归直线方程: = x+ (也可写成 =bx+a或y=bx+a)一定过样本点中心( , ).y^b^a^y^xy(2)样本相关系数r当r0时,表明两变量正相关;当r0时,表明两变量负相关.|r|越接近1,表明两变量的线性相关性越强;|r|越接近0,表明两变量的线性相关关系越弱.2.独立性检验当根据具体的数据算出的K2≥3.841时,有95%的把握说事件A与B有关;当K2≥6.635时,有99%的把握说事件A与B有关.考点一简单随机抽样(基础送分型考点——自主练透)[必备知识](1)抽取方式:逐个不放回抽取;(2)每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.[提醒]简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.第一讲随机抽样1.(2015·广东七校联考)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是______.(下面摘取了随机数表第7行至第9行)87421753315724550688770474476721763350258392120676,63016378591695566719981050717512867358074439523879,33211234297864560782524207443815510013429966027954解析:由随机数表,可以看出前4个样本的个体的编号是331,572,455,068.于是,第4个样本个体的编号是068.0682.(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字为08,02,14,07,01,…,故选出的第5个个体的编号为01.答案:D考点二系统抽样(重点保分型考点——师生共研)[必备知识]系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.[提醒]系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.[典题例析](2014·广东高考)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20解析:由100040=25,可得分段的间隔为25.故选C.2.(人教B版教材习题改编)某工厂平均每天生产某种机器零件大约10000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为0010,则第三组抽取的号码为________.04103.用系统抽样法(按等距离的规则)要从160名学生中抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是____.5考点三分层抽样的交汇命题(常考常新型考点——多角探明)[必备知识](1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.[提醒]分层抽样中,易忽视每层抽取的个体的比例是相同的,即样本容量n总体个数N.[多角探明]分层抽样是历年高考的重要考点之一,高考中常把分层抽样、频率分布、概率综合起来进行考查,反映了当前高考的命题方向.这类试题难度不大,但考查的知识面较为宽广,在解题中要注意准确使用所学知识,不然在一个点上的错误就会导致整体失误.常见的命题角度有:(1)与频率分布相结合问题;(2)与概率相结合问题.角度一:与频率分布相结合问题1.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10B.200,10C.100,20D.200,20解析:易知(3500+4500+2000)×2%=200,即样本容量;抽取的高中生人数为2000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.答案:D2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y角度二:与概率相结合问题(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,∴3050=m5,解得m=3.(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为539,求x,y的值.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).∴从中任取2人,至少有1人学历为研究生的概率为710.(2)由题意,得10N=539,解得N=78.∴35~50岁中被抽取的人数为78-48-10=20,∴4880+x=2050=1020+y,解得x=40,y=5.即x,y的值分别为40,5.[类题通法]进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比. 概率知识的考查是近几年新课改后高考命题的一大热点,高考每年在选择、填空或解答题中都有所体现,由于文科数学后续课程不再学习概率,文科数学将重点考查概率的意义、古典概型与几何概型的掌握和运用.在处理概率问题时主要有两种思路:正向思路和逆向思路.正向思考可对复杂问题进行分解;逆向思考常使一些复杂问题得到简化.要学会将实际问题转化为古典概型和几何概型来解决.第二讲概率——古典概型与几何概型1.(2012年安徽)袋中共有6个除了颜色外完全相同的球,其中有1个红球、2个白球和3个黑球.从袋中任取两球,两球颜色为一白一黑的概率等于()A.15B.25C.35D.45古典概型解析:将同色小球编号.从袋中任取两球,所有基本事件为:(红,白1),(红,白2),(红,黑1),(红,黑2),(红,黑3),(白1,白2),(白1,黑1),(白1,黑2),(白1,黑3),(白2,黑1),(白2,黑2),(白2,黑3),(黑1,黑2),(黑1,黑3),(黑2,黑3),共有15个基本事件,而一白一黑的共有6个基本事件,P=615=25.故选B.答案:B2.(2012年杭州一检)从1,2,3,4,5,6这6个数字中,任取2个数字相加,其和为偶数的概率是________.解析:从6个数中任取2个数的可能情况有:(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共15种,其中和为偶数的情况有:(1,3),(1,5),(2,4),(2,6),(3,5),(4,6),共6种,所以所求的概率是25.答案:253.(2013届安徽省示范高中高三9月摸底考试)从集合{-1,1,2,3}中随机选取一个数记为m,从集合{-1,1,2}中随机选取一个数记为n,则方程x2m+y2n=1表示双曲线的概率为____.解析:由题意知基本事件总数为12,表示双曲线的要求为mn0,当m=-1时,n=1、2;当n=-1时,m=1、2、3,故表示双曲线的概率为512.答案:5121、若不等式组 所表示的平面区域为M,x2+y2≤1所表示的平面区域为N,现随机向区域M内抛一粒豆子,则豆子落在区域N内的概率为.,,240yxyxxy【分析】(1)由频率概念可得.(2)可从对立事件考虑.(3)作出区域,转化为几何概型.【解析】(1)不同试验次数相应出现的“正面向上”的频率在一个值附近波动.这个频率值可近似为概率,故P≈0.7.(2)从3个红球、2个白球中任取3个,根据穷举法,可以得到10个基本事件,其中没有白球的取法只有一种,因此所取的3个球中至少有1个白球的概率P=1- = .故选D.110910几何概型【答案】(1)0.7(2)D(3) (1)频率在某个固定值左右波动,这个值才是概率,不能随便将一频率值作为概率,但是随着试验次数的增加,频率值会越来越接近于概率.1、如图,△OAB即为可行域M.图中的阴影区域即所求豆子要落的区域.阴影区域的面积为 π,且S△OAB= ,故所求概率为P= = .1416314163364364(2)在解决概率问题时,要注意“正难则反”的思想.(3)几何概型的关键是用长度(或面积、体积)来度量试验结果. 1.在区间[0,3]上任投一点,则此点坐标大于2的概率为()A.12B.13C.14D.1解析:试验的全部结果构成的区域长度为3,所求事件的区域长度为1,故所求概率为P=13.答案:B2.