统计学─从数据到结论第四章机会的度量:概率和分布概率是0和1之间的一个数目,表示某个事件发生的可能性或经常程度。你买彩票中大奖的机会很小(接近0)但有人中大奖的概率几乎为1你被流星击中的概率很小(接近0)但每分钟有流星击中地球的概率为1你今天被汽车撞上的概率几乎是0但在北京每天发生车祸的概率是1。发生概率很小的事件称为小概率事件(smallprobabilityevent);小概率事件不那么可能发生,但它往往比很可能发生的事件更值得研究。在某种意义上,新闻媒体的主要注意力大都集中在小概率事件上。§4.1得到概率的几种途径1.利用等可能事件如果一个骰子是公平的,那么掷一次骰子会以等可能(概率1/6,6种可能之一)得到1至6点的中的每一个点。抛一个公平的硬币,则以等可能(概率1/2)出现正面或反面。§4.1得到概率的几种途径再如从52张牌中随机抽取一张,那么它是黑桃的概率为抽取黑桃的可能(k=13)和总可能性(n=52)之比,即k/n=13/52=1/4;类似地抽到的牌是J、Q、K、A四种(共有16种可能)的概率是16/52=4/13。§4.1得到概率的几种途径其实即使没有学过概率,读者也多半能够算出这些概率。计算这些概率的基础就是事先知道(或者假设)某些事件是等可能的。这种事件为等可能事件(equallylikelyevent)。§4.1得到概率的几种途径2.根据长期相对频数事件并不一定是等可能的,或者人们对于其出现的可能性一无所知。这时就要靠观察它在大量重复试验中出现的频率来估计它出现的概率。它约等于事件出现的频数k除以重复试验的次数n,该比值k/n称为相对频数(relativefrequency)或频率。§4.1得到概率的几种途径例如,刮发票的中奖密封时,大多得到“谢谢”。如果你刮了150张发票,只有3张中奖,你会认为,你的中奖概率大约是3/150=0.02如果一个学生在200次上课时,无故旷课10次,那么其旷课的概率可能被认为接近10/200=0.05§4.1得到概率的几种途径试验次数n越大则该值越接近于想得到的概率。很多事件无法进行长期重复试验。因此这种通过相对频数获得概率的方法也并不是万能的。虽然如此,用相对频数来确定概率的方法是很常用的。你们可以举出无数类似的例子§4.1得到概率的几种途径3.主观概率一些概率既不能由等可能性来计算,也不可能从试验得出。比如,你今年想学开车概率、你五年内去欧洲旅游的概率等这种概率称为主观概率(subjectiveprobability)。可以说,主观概率是一次事件的概率。或为基于所掌握的信息,某人对某事件发生的自信程度。§4.2概率的运算在掷骰子中,得到6点的概率是1/6,而得到5点的概率也是1/6。那么掷一次骰子得到5或者6的概率是多少呢?在掷10次骰子中有一半或以上的次数得到5或6的概率又是多少呢?读者很快就可能很快会得到答案。但再复杂一些,也许就不简单了。§4.2概率的运算我们需要了解怎样从简单的情况计算稍微复杂情况时的概率。需要读者回忆一下上中学时学过的集合概念,比如两个集合的交和并,互余(互补)等概念。在概率论中所说的事件(event)相当于集合论中的集合(set)。而概率则是事件的某种函数。为什么会这么说呢,让我们看掷两个骰子的试验。§4.2概率的运算如所关心的是两骰子点数之和,则下表包含了所有36种可能试验结果的搭配和相应的点数和。第一个的点数两骰子点数和12345612345672345678345678945678910567891011第二个的点数6789101112事件:两骰子点数和集合:相应的试验结果(两个数字分别表示第一和第二个骰子的点数)集合中元素的个数事件的概率2(1,1)11/363(1,2)(2,1)22/364(1,3)(2,2)(3,1)33/365(1,4)(2,3)(3,2)(4,1)44/366(1,5)(2,4)(3,3)(4,2)(5,1)55/367(1,6)(2,5)(3,4)(4,3)(5,2)(6,1)66/368(2,6)(3,5)(4,4)(5,3)(6,2)55/369(3,6)(4,5)(5,4)(6,3)44/3610(4,6)(5,5)(6,4)33/3611(5,6)(6,5)22/2612(6,6)11/36可以看出,如果我们考虑点数和等于2的事件,则仅有一种可能的试验结果(两个骰子均为一点);而如果我们考虑点数和等于7的事件,则有六种可能的试验结果。两个骰子点数之和总共有2至12等11种可能,即有11种可能的事件,而这11种事件相应于上面所说的36种可能的试验结果的一些集合。这些事件和试验结果的集合归纳在下面表中:§4.2概率的运算:1.互补事件的概率如果今天下雨的概率是10%,则今天不下雨的概率就是90%。如果你中奖的概率是0.0001,那么不中奖的概率就是1-0.0001=0.9999。这种如果一个不出现,则另一个肯定出现的两个事件称为互补事件(complementaryevents,或者互余事件或对立事件)。§4.2概率的运算:1.互补事件的概率按照集合的记号,如果一个事件记为A,那么另一个记为AC(称为A的余集或补集)。显然互补事件的概率之和为1,即P(A)+P(AC)=1,或者P(AC)=1-P(A)。在西方赌博时常常爱用优势或赔率(odds)来形容输赢的可能。它是互补事件概率之比,即P(A)/P(AC)=P(A)/[1-P(A)]来表示。§4.2概率的运算:2.概率的加法如果两个事件不可能同时发生,那么至少其中之一发生的概率为这两个概率的和。比如“掷一次骰子得到3或者6点”的概率是“得到3点”的概率与“得到6点”的概率之和,即1/6+1/6=1/3。但是如果两个事件可能同时发生时这样做就不对了。§4.2概率的运算:2.概率的加法假定掷骰子时,一个事件A为“得到偶数点”(有3种可能:2、4、6点),另一个事件B为“得到大于或等于3点”(有4种可能:3、4、5、6点);这样,事件A的概率显然等于3/6=1/2,即P(A)=1/2。而事件B的概率为P(B)=4/6=2/3。但是,“得到大于或等于3点或者偶数点”的事件的概率就不是P(A)+P(B)=1/2+2/3=7/6了;§4.2概率的运算:2.概率的加法这显然多出来了。概率怎么能够大于1呢?按照中学时关于集合的记号,该事件称为A和B的并,记为A∪B。刚才多出来的部分就是A和B的共同部分A∩B(称为A和B的交)的概率(这个概率算了两遍);它为“得到既是偶数,又大于等于3”的部分,即4和6两点。出现事件4或者6的概率为1/6+1/6=1/3。§4.2概率的运算:2.概率的加法于是应该把算重了的概率减去。这样“得到大于或等于3点或者偶数点”的事件A∪B的概率就是P(A∪B)=P(A)+P(B)-P(A∩B)=1/2+2/3-1/3=5/6。这种P(A∪B)=P(A)+P(B)-P(A∩B)的公式也适用于两个不可能同时发生的事件;但因为那时P(A∩B)=0,所以只剩下P(A∪B)=P(A)+P(B)了。§4.2概率的运算:2.概率的加法这种交等于空集(A∩B=F,这里F表示空集或空事件)的事件为两个不可能同时发生的事件,称为互不相容事件(mutuallyexclusiveevents)。§4.2概率的运算:3.概率的乘法如果你有一个固定电话和一个手机,假定固定电话出毛病的概率为0.01,而手机出问题的概率为0.05,那么,两个电话同时出毛病的概率是多少呢?聪明的读者马上会猜出,是0.01×0.05=0.0005。但是这种乘法法则,即P(A∩B)=P(A)P(B),仅仅在两个事件独立(independent)时才成立。§4.2概率的运算:3.概率的乘法如果事件不独立则需要引进条件概率(conditionalprobability)。比如三个人抽签,而只有一个人能够抽中,因此每个人抽中的机会是1/3。假定用A1、A2和A3分别代表这三个人抽中的事件,那么,P(A1)=P(A2)=P(A3)=1/3。§4.2概率的运算:3.概率的乘法但是由于一个人抽中,其他人就不可能抽中,所以,这三个事件不独立。刚才的乘法规则不成立;这时,P(A1∩A3)=P(A1∩A2)=P(A2∩A3)=0;如错误照搬乘法规则会得到错误的(1/3)2=1/9。§4.2概率的运算:3.概率的乘法但是可以计算条件概率,比如第一个人抽到(事件A1),则在这个条件下其他两个人抽到的概率都为0;记为P(A2|A1)=P(A3|A1)=0。如第一个人没有抽到(事件A1C),那么其他两人抽到的概率均为1/2,记为P(A2|A1C)=P(A3|A1C)=1/2。§4.2概率的运算:3.概率的乘法一般地,在一个事件B已经发生的情况下,事件A发生的条件概率定义为(贝叶斯公式)分布随机变量取一切可能值或范围的概率或概率的规律称为概率分布(probabilitydistribution,简称分布)。概率分布可以用各种图或表来表示;一些可以用公式来表示。概率分布是关于总体的概念。有了概率分布就等于知道了总体。分布前面介绍过的样本均值、样本标准差和样本方差等样本特征的概念是相应的总体特征的反映。我们也有描述变量“位置”的总体均值、总体中位数、总体百分位数以及描述变量分散(集中)程度的总体标准差和总体方差等概念。具体公式见本章后面小结§4.3离散变量的分布离散变量只取离散的值,比如骰子的点数、网站点击数、顾客人数等等。每一种取值都有某种概率。各种取值点的概率总和应该是1。当然离散变量不不仅仅限于取非负整数值。一般来说,某离散随机变量的每一个可能取值xi都相应于取该值的概率p(xi),这些概率应该满足关系()1,()0iiipxpx§4.3.1二项分布最简单的离散分布应该是基于可重复的有两结果(比如成功和失败)的相同独立试验(每次试验成功概率相同)的分布,例如抛硬币。比如用p代表得到硬币正面的概率,那么1-p则是得到反面的概率。如果知道p,这个抛硬币的试验的概率分布也就都知道了。§4.3.1二项分布这种有两个可能结果的试验有两个特点:一是各次试验互相独立,二是每次试验得到一种结果的概率不变(这里是得到正面的概率总是p)。类似于抛硬币的仅有两种结果的重复独立试验被称为Bernoulli试验(Bernoullitrials)。§4.3.1二项分布下面试验可看成为Bernoulli试验:每一个进入某商场的顾客是否购买某商品每个被调查者是否认可某种产品每一个新出婴儿的性别。根据这种简单试验的分布,可以得到基于这个试验的更加复杂事件的概率。§4.3.1二项分布为了方便,人们通常称Bernoulli试验的两种结果为“成功”和“失败”。和Bernoulli试验相关的最常见的问题是:如果进行n次Bernoulli试验,每次成功的概率为p,那么成功k次的概率是多少?这个概率的分布就是所谓的二项分布(binomialdistribution)。§4.3.1二项分布这个分布有两个参数,一个是试验次数n,另一个是每次试验成功的概率p。基于此,二项分布用符号B(n,p)或Bin(n,p)表示。由于n和p可以根据实际情况取各种不同的值,因此二项分布是一族分布,族内的分布以这两个参数来区分。§4.3.1二项分布二项分布的概率通常用二项分布表来查出。但一般统计软件可以很容易得到这个概率。在目前统计软件发达的情况下,涉及的二项分布一般都自动处理了;在处理实际问题中很少会遇到直接计算二项分布概率的情况。§4.3.1二项分布但这里还是给出其一般公式。下面p(k)代表在n次Bernoulli试验中成功的次数的概率,p为每次试验成功的概率。有()(1),0,1,...,knknpkppknk这里!!()!nnkknk