第六章概率及概率分布科学研究的目的不仅限于对已掌握的数据进行描述,更重要的是利用这些数据的信息,对数据所属总体的某种特征,作出具有一定可靠程度的估计和推断。从样本出发来推断总体分布的过程称为统计推断。概率论是推论统计的数学基础。统计学习与初中知识的衔接《义务教育数学课程标准(实验稿)》将“统计与概率”列为初中数学四个知识领域之一学段第一学段(1~3年级)第二学段(4~6年级)第三学段(7~9年级)统计与概率·数据统计活动初步·不确定现象·简单数据统计过程·可能性·统计·概率统计学习的定位说明4全日制义务教育数学课程标准1-3年级例1:随意从放有4个红球和1个黑球的口袋中,摸出一个球,摸到红球的可能性与摸到黑球的可能性哪个大?例2:下列现象中,哪些是确定的?下周三本地下雨明天有人走路4-6年级例3:在一个正方形的6个面上分别标上数字,使得2朝上的可能性为1/3。例4:某公司有15名职工,对外招聘时称该公司职工的月平均工资超过1200元,请分析下面的统计表。职务经理副经理职员人数1113月工资500020008007-9年级例5:一个袋中装有2个黄球和2个红球,任意摸出一个球后放回,再任意摸出一个球,求两次都摸到红球的概率。本章内容第一节概率的基本概念第二节二项分布第三节正态分布第一节概率的基本概念1.随机事件:在一定的条件下,可能发生也可能不发生的事件,称为随机事件。2.概率:随机事件出现可能性大小的客观指标。后验概率(也称统计概率):随机事件A出现m次与观测n次的比值。当观测次数无限增大时,随机事件的频率稳定于一个常数P,先验概率:若试验中由n个有限的基本事件组成,而且每次试验中它们出现是等可能的,当事件A发生的次数为m时,则事件A的概率为nmPA投掷硬币,基本事件n=2(正面或反面),为有限,事件A(正面向上)和事件B(反面向上)出现的可能性相等,P(A)=1/2。试验者投掷次数出现“正面”次数频率于老师20120.6000Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.500554张扑克牌,抽出红桃的概率从一个有20名男生,30名女生的班级里,随机抽取男生的概率是概率P(A)=13/54=0.24概率P(A)=20/50=0.43.概率的基本性质(1)任何随机事件的概率,0P(A)1;(2)不可能事件的概率等于0,P(A)=0(3)必然事件的概率等于1,P(A)=1(4)两个互不相容事件A、B之和的概率等于两个事件概率之和,P(A+B)=P(A)+P(B)。(5)两个独立事件同时出现的概率等于这两个事件概率的乘积。P(AxB)=P(A)P(B)例1:某学生从5道试题中,随机抽取1题进行口试,请问抽到试题1的概率是多少?抽到试题1或试题2的概率是多少?例2:某二个学生随机从5道试题中,抽取1题进行口试,第一个学生把抽过的试题还原后,第二个学生再抽,问两个学生都抽到试题1的概率是多少?抽到试题1或试题2的概率是P(A+B)=P(A)+P(B)=1/5+1/5=2/5两个学生都抽到试题1的概率是P(AxB)=P(A)P(B)=1/5x1/5=1/25第二节二项分布1.贝努利分布B(1,p)假设一次投硬币的试验。用随机变量X的两个值来表示投币结果:1表示正面,0表示反面,统计学里称这种试验为贝努利试验,投掷结果的概率可以写成下面的形式(公式6.1):随机变量X服从贝努利分布,记为X~B(1,p),反映了贝努利分布的变化规律。(6.1)图6.1人类新生儿性别比2.二项分布如果贝努利试验独立地重复n次,假设事件A在每次试验中出现的概率为p,x为n次试验中成功的次数,那么随机变量X服从二项分布B(n,p),记为X~B(n,p)。概率分布(6.2))!(!!)1()(xnxnCppCxPxnxnxxn!为阶乘符号121)n)(n(n!n3!=3×2×1,0!定义为1例3:有10道是非题,若一考生完全不懂,全凭猜测回答,问分别答对5题、6题、10题的概率各为多少?00098.05.05.0!0!10!10)10(20508.05.05.0!4!6!10)6(24609.05.0!56789105.05.0!5!5!10)5()!(!!)1()(010461055XPXPXPxnxnCppCxPxnxnxxn例4投硬币试验独立地进行了3次,其结果如下:三次可能出现的结果正面出现的次数X概率正1正2正33(1/2)3正1正2反32(1/2)3正1反2正32(1/2)3反1正2正32(1/2)3正1反2反31(1/2)3反1正2反31(1/2)3反1反2正31(1/2)3反1反2反30(1/2)3从表中可知,若投掷三次全是正面的概率是P(X=3)=1/8;若出现二次正面的概率P(X=2)=3/8;只出现一次正面的概率P(X=1)=3/8;全是反面的概率P(X=0)=1/8。若利用6.2式计算只出现1次正面的概率得:8/35.05.0121123)5.01()5.0()1(2113113CXP例4:从100个球(20个黑球,80个红球)中独立地抽取3次,分别计算抽取1个、2个或3个黑球的概率X概率二项分布的图形n=3,p=0.300.10.20.30.40.50123456789101112131415xP(x)n=6,p=0.300.10.20.30.40.50123456789101112131415xP(x)n=10,p=0.300.10.20.30.40.50123456789101112131415xP(x)n=20,p=0.300.10.20.30.40.50123456789101112131415xP(x)图6-1p=0.3时,不同n值对应的二项分布二项分布的图形特征离散型分布二项分布图的形态取决于p与n。当p=0.5时,图形是对称的;p离0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。当n→∞时,二项分布近似于正态分布。二项分布的平均数和方差n很大时,二项分布接近正态分布。当随机变量X服从二项分布B(n,p)时,其平均数(期望)μ=np;方差σ2=np(1-p)例5:作一个投掷10枚硬币的试验,出现正面向上的平均数为5次(μ=np=10X0.5=5),正面向上的离散度σ2=np(1-p)=10X0.5X0.5=2.5,σ=1.58(理论结果)在实际试验中,有的人可得10个正面向上,有的人得9个,人数越多,正面向上的平均数越接近5,离散程度越接近1.58.思考:贝努利分布的平均数和方差平均数μ=p;方差σ2=p(1-p)第三节正态分布Normaldistribution早在十八世纪,Gauss在天文观察中发现观察者每次观察的结果都不相同,伴有误差,而且这些误差是随机的。他证明误差的变化服从某种规律性。Gaussdistribution是一种连续型随机变量的概率分布,在实际应用中占有最重要地位的一种理论分布。人类社会、教育心理中大量现象均按正态形式分布。Gauss(1777-1855)一、正态分布曲线函数特征1.正态分布图2.正态分布曲线方程222)(21)(XeXfX~N(,2),一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。根据正态分布曲线方程,可绘制出正态分布曲线图,其方程为:为总体均数,为总体标准差-----两参数π为圆周率,e为自然对数的底-----两常数X为图形上横轴的数值,f(X)为纵轴数值----两坐标轴X服从期望(平均)为、方差为2的正态分布,记为X~),(2N3.正态分布的特征1.正态分布的形式是对称的,平均数、中数、众数三者相等。2.正态分布的中央点最高,然后逐渐向两侧下降,曲线两端不与基线相交。3.正态曲线下的面积为1,正态曲线下的面积可视为概率。4.正态分布是一族分布,它随随机变量的平均数、标准差的不同而呈现不同的分布形态。图6-2方差固定,平均数变化时,的变化状况图6-3平均数固定,方差变化时,的变化状况)(xf2)(xf•是决定正态分布图位置的参数,当2固定时,不同的表示曲线在横轴上左右平行地移动。•参数2决定曲线的形状。从上面图6-3中可以看到当固定时,2的值愈小,所围成的图形就越尖、狭;反之2的值越大,图形就越平、宽。2二、标准正态分布1.所有正态分布都可以通过Z分数转换成标准正态分布。经此变换,密度函数发生相应改变:XZ2221)(zezf则Z服从总体均数为0、总体标准差为1的正态分布。μ=0,σ=1记为Z~N(0,1)2.标准正态分布曲线下面积标准正态分布正态分布面积或概率-1~1μ±σ68.27%-1.96~1.96μ±1.96σ95.00%-2.58~2.58μ±2.58σ99.00%3.标准正态曲线表的使用下面积的求法(1)依据Z分数求概率P①求某Z分数值与Z=0(平均数)之间的概率(查表);Z=1,p=0.34134;Z=1.96p=0.475;Z=2.58p=0.49506②某Z分数以上或以下的概率p(Z≼1)=0.5+0.3413=0.8413p(Z-1)=0.5-0.3413=0.15870.84130.1587③求两个Z值之间的概率p(-1Z≼0.5)=0.3413+0.19146=0.53276标准正态分布的3σ规则:p(-1≼Z≼1)=0.34134+0.34134=0.6827P(-2≼Z≼2)=0.47725+0.47725=0.9545P(-3≼Z≼3)=0.49865+0.49865=0.9973图6-2标准正态分布的3-规则(2)依据概率P求Z分数(3)已知概率或Z值,求概率密度(查表)例6;求以下概率P(0Z1.96)P(-1.96Z≼0)P(1Z1.96)P(-1.96Z-1)P(-1.96Z1.96)P(Z1.96)P(Z≼1)P(0Z1.96)=0.475P(-1.96Z≼0)=0.475P(1Z1.96)=0.475-0.3413=0.1337P(-1.96Z-1)=0.1337P(-1.96Z1.96)=0.95P(Z1.96)=0.5-0.475=0.025P(Z≼1)=0.5+0.3413=0.8413例7已知下列概率,求对应的Z值P(0Z≼Z0)=0.49814P(-Z0Z≼Z0)=0.7063P(Z≽Z0)=0.05例8已知Z值或概率值,求纵高Y(概率密度Y)Z=3.84P(0Z≼Z0)=0.13683Z=2.9Z=1.05Z=1.64Y=0.00025Y=0.375244.正态分布在测验中的应用(1)将原始分数转换成标准分数例9:科目甲乙平均分标准差Z甲Z乙语文5951504数学75797410英语6372679总和197202Z甲语文=(59-50)/4=2.25Z甲数学=(75-74)/10=0.1Z甲英语=(63-67)/9=-0.44Z乙语文=(51-50)/4=0.25Z乙数学=(79-74)/10=0.5Z乙英语=(72-67)/9=0.56若按照原始分,应该录取乙同学。Z甲=2.25+0.1-0.44=1.91Z乙=0.25+0.5+0.56=1.31若按照标准分,应该录取甲同学(2)确定录取分数线例10:某项职业技能考试,在参加考试的1600人中准备录取200人,考试分数接近正态分布,平均分为74,标准差为11,问录取分数线是多少?录取率为200/1600=0.125p=0.5-0.125=0.375查表Z=1.15Z=(X-74)/11得到X=86.650.125(3)确定等级评定的人数如果100个人某种能力呈正态分布,欲将分成甲、乙、丙、丁四个等距的等级,问各等级应