二项分布与超几何分布辨析二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列.解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则1~35XB,.03031464(0)55125PXC∴;12131448(1)55125PXC;21231412(2)55125PXC;3033141(3)55125PXC.因此,X的分布列为2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15CCPYC;12283107(1)15CCPYC;21283101(2)15CCPYC.因此,Y的分布列为辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别:超几何分布需要知道总体的容量,而二项分布不需要;超几何分布是不放回抽取,而二项分布是放回抽取(独立重复)当总体的容量非常大时,超几何分布近似于二项分布........X0123P6412548125121251125Y012P715715115二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。在实际应用中,理解并区分两个概率模型是至关重要的。下面举例进行对比辨析。1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。2.不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的(特别注意:二项分布是在n次独立重复试验的3个条件成立时应用的)。超几何分布和二项分布的区别:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,而二项分布是“有放回”抽取(独立重复)。练习题:1.袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球。求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列。2.(2008年四川延考)一条生产线上生产的产品按质量情况分为三类:A类、B类、C类.检验员定时从该生产线上任取2件产品进行一次抽检,若发现其中含有C类产品或2件都是B类产品,就需要调整设备,否则不需要调整.已知该生产线上生产的每件产品为A类品,B类品和C类品的概率分别为0.9,0.05和0.05,且各件产品的质量情况互不影响.(1)求在一次抽检后,设备不需要调整的概率;(2)若检验员一天抽检3次,以ξ表示一天中需要调整设备的次数,求ξ的分布列.3.今天你低碳了吗?近来,国内网站流行一种名为“碳排放计算器”的软件,人们可以扰此计算出自己每天的碳排放量。例如:家居用电的碳排放量(千克)=耗电度数×.785,汽车的碳排放量(千克)=油耗公升数×0.785等。某班同学利用寒假在两个小区逐户进行了一次生活习惯进否符合低碳观念的调查。若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”。这二族人数占各自小区总人数的比例P数据如下:(I)如果甲、乙来自A小区,丙、丁来自B小区,求这4人中恰有2人是低碳族的概率;(II)A小区经过大力宣传,每周非低碳族中有20%的人加入到低碳族的行列。如果2周后随机地从A小区中任选25个人,记表示25个人中低碳族人数,求.E4.在“自选模块”考试中,某试场的每位同学都选了一道数学题,第一小组选《数学史与不等式选讲》的有1人,选《矩阵变换和坐标系与参数方程》的有5人,第二小组选《数学史与不等式选讲》的有2人,选《矩阵变换和坐标系与参数方程》的有4人,现从第一、第二两小组各任选2人分析得分情况.(Ⅰ)求选出的4人均为选《矩阵变换和坐标系与参数方程》的概率;(Ⅱ)设为选出的4个人中选《数学史与不等式选讲》的人数,求的分布列和数学期望.A小区低碳族非低碳族比例P2121B小区低碳族非低碳族比例P54515.甲、乙两人参加2010年广州亚运会青年志愿者的选拔.打算采用现场答题的方式来进行,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才能入选.(1)求甲答对试题数ξ的概率分布;(2)求甲、乙两人至少有一人入选的概率.正态分布和线性回归高考要求新疆王新敞特级教师源头学子小屋@126.comwxckt@126.com源头学子小屋特级教师王新敞新疆1.了解正态分布的意义及主要性质新疆源头学子小屋特级教师王新敞@126.comwxckt@126.com王新敞特级教师源头学子小屋新疆2.了解线性回归的方法和简单应用新疆源头学子小屋特级教师王新敞@126.comwxckt@126.com王新敞特级教师源头学子小屋新疆知识点归纳新疆王新敞特级教师源头学子小屋@126.comwxckt@126.com源头学子小屋特级教师王新敞新疆1.正态分布密度函数:22()21()2xfxe,(σ>0,-∞<x<∞)其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2N奎屯王新敞新疆2.正态分布),(2N)是由均值μ和标准差σ唯一决定的分布例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2221)(xexf,(-∞<x<+∞(2)2(1)81()22xfxe,(-∞<x<+∞解:(1)0,1(2)1,23.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D。正态曲线具有以下性质:(1)曲线在x轴的上方,与x轴不相交。(2)曲线关于直线x=μ对称。(3)曲线在x=μ时位于最高点。(4)当xμ时,曲线上升;当xμ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。(5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学奎屯王新敞新疆4.标准正态曲线:当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是2221)(xexf,(-∞<x<+∞)其相应的曲线称为标准正态曲线奎屯王新敞新疆标准正态总体N(0,1)在正态总体的研究中占有重要的地位奎屯王新敞新疆任何正态分布的概率问题均可转化成标准正态分布的概率问题奎屯王新敞新疆5.标准正态总体的概率问题:x标准正态分布曲线fx=12e-x22xy对于标准正态总体N(0,1),)(0x是总体取值小于0x的概率,即)()(00xxPx,其中00x,图中阴影部分的面积表示为概率0()Pxx奎屯王新敞新疆只要有标准正态分布表即可查表解决.从图中不难发现:当00x时,)(1)(00xx;而当00x时,Φ(0)=0.5奎屯王新敞新疆例2设),(~2NX,且总体密度曲线的函数表达式为:412221)(xxexf,x∈R。(1)求μ,σ;(2)求)2|1(|xP的值。分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。利用一般正态总体),(2N与标准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。解:(1)由于222)2(2)1(41222121)(xxxeexf,根据一般正态分布的函数表达形式,可知μ=1,2,故X~N(1,2)。(2))2121()2|1(|xPxP2121(12)(12)()()22(1)(1)2(1)120.84131FF6826.0。点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系奎屯王新敞新疆相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系奎屯王新敞新疆不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.10.回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析奎屯王新敞新疆通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性奎屯王新敞新疆对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度奎屯王新敞新疆粗略地看,散点分布具有一定的规律奎屯王新敞新疆12.回归直线设所求的直线方程为,^abxy,其中a、b是待定系数.1122211()()()nniiiiiinniiiixxyyxynxybxxxnxaybx,niixnx11,niiyny11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析奎屯王新敞新疆13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把niniiiniiiyyxxyyxxr11221)()())((=niniiiniiiynyxnxyxnyx1122221))((叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.14.相关系数的性质:r≤1,且r越接近1,相关程度越大;且r越接近0,相关程度越小.一般的,当r0.75时,就可以判断其具有很强的相关性