高考数学复习专题概率统计2018-4-LP1、随机抽样:简单随机抽样、分层抽样和系统抽样.2、用样本估计总体:频率分布表、频率分布直方图、频率折线图、茎叶图.样本数据中的基本数字特征:众数、中位数、平均数、标准差.3、变量的相关性:散点图、回归分析、线性回归方程、最小二乘法、相关系数4、独立性检验:(2×2列联表)假设性检验统计-1P1概览要点1、离散型随机变量及其分布列:随机变量分布列、数学期望(均值)、方差2、常见分布:超几何分布、n次独立重复试验的模型及二项分布、正态分布(高尔顿钉板试验模型).3、离散型随机变量与概率:条件概率、相互独立事件、不同分布事件的概率公式统计-2P2概览要点(理)1、概率概念:(1)概率意义与求法.(2)两个互斥事件的概率加法公式.2、古典概型:(1)古典概型及其概率计算公式.(2)随机事件所含的基本事件数及事件发生的概率.3、随机数与几何概型:(1)随机数的意义,运用模拟方法估计概率.(2)几何概型的意义.概率概览要点P3计数原理概览要点(理)1、分类加法计数原理、分步乘法计数原理2、排列与组合:公式及应用3、二项式定理:公式与应用P4基础知识要点1、样本数据特征(数):众数,中位数,平均数,标准差,方差;2、频率分布直方图中数字特征(形):众数,中位数,平均数,方差;3、回归分析:线性回归方程、相关系数4、独立性检验:随机变量2K5、离散型随机变量:概率,数学期望(均值)、方差(标准差);6、超几何分布、二项分布、正态分布:随机事件概率公式7、概率-古典概型、几何概型8、计数原理P5(一)众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)称这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.P6Ⅰ.样本数据中的数字特征(数)基础知识P7众数、中位数、平均数与频率分布直方图1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。当最高矩形的数据组为〔a,b)时,那么(a+b)/2就是众数。P8Ⅱ.频率分布直方图中的样本数字特征(形)在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观便于形象地进行分析。基础知识频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.251.在样本数据的频率分布直方图中,众数即:最高矩形的中点的横坐标。P9基础知识2、频率分布直方图中的中位数(估计值)当最高矩形的数据组为〔a,b)时,设中位数为(a+X),根据直方图中的中位数特征:中位数左边所有立方图对应的小矩形面积之和为0.5;列方程得:x×频率/组距(最高矩形)+Sm=0.5求解X,那么:a+X即为中位数。P10中位数--样本数据所占频率等分线的对应值设最高矩形的数据组之前所有小矩形的面积之和为Sm;(频率直方图的面积=组距乘以频率/组距。)基础知识频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.5↓33.544.5中位数2.中位数是样本数据所占频率的等分线。2+X当最高矩形的数据组为〔xm,xn)时,设中位数为(xm+X),则其左右两侧矩形面积相等:Sm+s=0.5,s=x×最高矩形之高↓P11}基础知识题例:如何从频率分布直方图中估计中位数?中位数左边立方图的小矩形面积为0.50~2的小矩形面积之和为:0.5×(0.08+0.16+0.30+0.44)=0.490.200.400.1000.511.522.533.544.50.500.30频率/组距月均用水量/t0.080.160.440.5-0.49=0.010.01/0.5=0.02如图在直线t=2.02之前所有小矩形的面积为0.5所以该样本的中位数为2.02P12面积等分线平均数是频率分布直方图的“重心”.是直方图的平衡点.若每组数据区间分别为:时,且每组数据相应的频率分别为;那么样本的平均数(或总体的数学期望)由下列公式计算:样本数据的平均数的估计值等于:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。P133、频率分布直方图中的平均数],[...),[),[2211kkbababa、、、kfff,...,,21kiiiifbax12)(基础知识总结众数、中位数、平均数与频率分布直方图的关系:1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2、中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。3、平均数是直方图的“重心”(平衡点).P14基础知识注:(1)频率分布直方图损失了样本原始数据,得到的是一个估计值,且所得估值与数据分组有关.P15(2)在不能得到样本数据,只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观便于形象地进行分析。(3)总体的数据特征可以由两种途径来估计,利用样本数据或由频率分布直方图来估计;两种方法各有利弊。①通过频率分布直方图的估计精度低;②通过频率分布直方图的估计结果与数据分组有关;4、三种数字特征:众数、中位数、平均数(1)众数体现了样本数据的最大集中点,但它显然对其他数据信息的忽视使得无法客观地反映总体特征。(2)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低。P162-1Ⅲ.回归分析-线性回归方程基础知识P17P18回归分析-相关系数相关系数r:衡量两个变量之间线性关系的强弱;若相应于变量的取值,变量的观测值为,则两个变量与之间的相关系数r的计算公式为:相关系数的性质:(1)|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小.(2)当r为正时,变量x,y正相关;当r为负时,变量x,y负相关。xxixy)1(niyiyniiniiniiininiiiniiiynyxnxyxnyxyyxxyyxxr122122111221)()())((基础知识P19Ⅳ.独立性检验-假设性检验))()()(()(22dbcadcbabcadnK基础知识P20Ⅴ.离散型随机变量及其分布列-数学期望与方差离散型随机变量的分布列:随机试验的结果M,对应的随机变量X,其对应的事件概率为P或)(XP;一般地,若离散型随机变量X可能取的不同值分别为:,,,,,,nixxxx21X取每一个值),,(nixi,21的概率iipxXP)(,则以表格的形式表示如下:表(1)表(1)称为离散型随机变量X的概率分布列,简称为X的分布列;也可用等式:nipxXPii,,2,1,)(表示X的分布列。X1x2xixnxP1p2pipnp基础知识P21Ⅴ.离散型随机变量及其分布列-数学期望与方差随机变量X的均值或数学期望:nniipxpxpxpxXE......)(2211nipxXPii,,2,1,)(离散型随机变量分布列满足:①随机变量X的方差:)(XD;随机变量X的标准差:)(XD。iniipXExXD12))(()(②③若baXY,其中a,b为常数,则Y也是随机变量,因为nixXPbaxYPii,,,...21),()(且Y的分布列为且bXaEbaXE)()(;)()(2XDabaXD基础知识P22Ⅵ.重要分布-二项分布、超几何分布、正态分布(1)两点分布:(投针或射击模型)(0-1分布,或伯努利分布)两点分布数学期望与方差随机变量X的分布列为:表(2):则称随机变量X服从两点分布,并称)1(XPp为成功概率。X01Pp1p两点分布数学期望:若X服从两点分布,则pXE)(;方差:)1()(ppXD基础知识P23Ⅵ.重要分布-二项分布、超几何分布、正态分布(2)二项分布:n次独立重复试验模型--某射手每次射击击中目标的概率为p,则在其n次射击中,恰有k次击中目标的概率,服从二项分布;(或有放回抽样)二项分布数学期望与方差二项分布数学期望:若)(~pnBX,,则npXE)(;方差:)1()(ppnXD一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则knkknqpCkXP)(,pqnk1210;且,,,,此时称随机变量X服从二项分布;记作)(~pnBX,,并称为p成功概率。基础知识P24条件概率与事件的相互独立性(2-1)条件概率:一般地,设A、B为两个事件,且0)(AP,称)()()|(APABPABP为在事件A发生的条件下,事件B发生的条件概率;)|(ABP读作:A发生的条件下B发生的概率。条件概率具有概率的性质,任何事件的条件概率都在0和1之间,即1)|(0ABP如果B和C是两个互斥事件,则:)|()|()|(ACPABPACBP基础知识P25条件概率与事件的相互独立性(2-2)事件的相互独立:事件的相互独立性设A、B为两个事件,若:)()()(BPAPABP则称事件A与事件B相互独立。如果事件A与B相互独立,那么BA与,BA与,BA与都相互独立。基础知识P26Ⅵ.重要分布-二项分布、超几何分布、正态分布(3)超几何分布:(无放回抽样模型)-在含M件次品的N件产品中,不放回抽取n件产品,其次品概率-模型)一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则,mkCCCkXPnNknMNkM,,2,1,0,)(,其中NNMnNMNnnMm,,,,},,min{且基础知识P27(4-0)正态分布①基础知识P28(4-1)正态分布②随机变量特征数:-样本均值,-样本标准差;正态分布是由均值和标准差唯一决定的分布③),(2N正态曲线的性质特征:④)(),(),(2XDXDXE),(~2NX(1)如果随机变量,则:(2)曲线是单峰的,它关于直线x对称。(3)曲线在x时位于最高点,峰值为21。(4)曲线与x轴之间的面积为1基础知识P29x标准正态分布曲线fx=12e-x22xyP30(4-3)正态分布的概率问题①正态分布的随机变量X取值的原则(三倍标准差原理)若,则对于任何实数,②③),(~2NX常用结论:正态分布的概率④通常认为服从于正态分布的随机变量X只取之间的值,这一原理叫做“三倍标准差原理”,简称原则。30aaadxxaXaP)()(,)(1)(aXPaXP)()(XPXP9973.0)33(9545.0)22(6827.0)(XPXPXP]3,3(3基础知识问题类型与探究统计1、样本估计总体数据特征:频率分布直方图、茎叶图、数字特征2、回归分析:线性回归方程、相关系数3、独立性检验:随机变量2K4、离散型随机变量:概率,数学期望(均值)、方差(标准差);重要分布-超几何分布、二项分布、正态分布概率5、古典概率:6、随机变量问题中的概率:随机事件概率P312-1●统计-问题探究•(§1-1)样本估计总体-频率分布直方图P32P33P34旧养殖法0.0200.0320.0400.0340.0240.0140.012频率组距箱产量/kg30354045505560657025O0.0080.