浅谈概率论在生活中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

软件学院潘昆豪102120501/5浅谈概率论在生活中的应用软件学院潘昆豪10212050摘要:概率论是数学学科中的重要分支,它在生活中的应用无处不在。随机现象存在于日常生活的方方面面和科学技术的各个领域。不知你相不相信你的直觉,但在日常生活中,我们的直觉往往是靠不住的。在概率论这门数学分支中,有许许多多的例子说明,直觉会导致错误的结论,而正确的答案又与我们的常识矛盾。本文通过日常生活中著名的随机数学悖论,浅析概率论在生活中的应用。关键字:随机数学悖论应用一、随机数学定义及应用随机数学是研究随机现象统计规律性的一个数学分支,涉及四个主要部分:概率论、随机过程、数理统计、随机运筹。概率论是后三者的基础。大约在17世纪欧洲的数学家们就开始探索用古典概率来解决赌博提出的一些问题。后来,关于诸如人口统计,天文观测,产品检查和质量控制,以及天气、水文与地震预报等社会问题和自然科学问题的研究,大大促进了随机数学的发展。在17~19世纪,经过伯努利(Bernoulli),拉普拉斯(Laplace),马尔可夫(Markov)等著名数学家的努力,随机数学有了长足的发展,但它严格的数学基础却是在20世纪30年代由前苏联数学家柯尔莫哥洛夫(Kolmogorov)发表了名著《概率论的基本概念》(1933年)以后建立的。在这本著作中,他用近代测度论的思想,总结了前人的成果,提出了概率论的公理化体系,从而为近代概率论奠定了严密的理论基础.此后,随机数学的理论研究与广泛应用获得了飞速的发展,至今它的基本理论与思想已渗透到现代科学技术、经济、管理等各个领域。随着18、19世纪科学的发展,人们注意到在某些生物、物理和社会现象与机会游戏之间有某种相似性,从而由机会游戏起源的概率论被应用到这些领域中;同时这也大大推动了概率论本身的发展。使概率论成为数学的一个分支的奠基人是瑞士数学家j.伯努利,他建立了概率论中第一个极限定理,即伯努利大数定律,阐明了事件的频率稳定于它的概率。随后a.de棣莫弗和p.s.拉普拉斯又导出了第二个基本极限定理(中心极限定理)的原始形式。拉普拉斯在系统总结前人工作的基础上写出了《分析的概率理论》,明确给出了概率的古典定义,并在概率论中引入了更有力的分析工具,将概率论推向一个新的发展阶段。19世纪末,俄国数学家p.l.切比雪夫、a.a.马尔可夫、a.m.李亚普诺夫等人用分析方法建立了大数定律及中心极限定理的一般形式,科学地解释了为什么实际中遇到的许多随机变量近似服从正态分布。20世纪初受物理学的刺激,人们开始研究随机过程。这方面a•n•柯尔莫哥洛夫、n.维纳、a•a•马尔可夫、a•r•辛钦、p软件学院潘昆豪102120502/5•莱维及w•费勒等人作了杰出的贡献。[1]二、概率的定义设E是随机试验,S是它的样本空间。对于E的每一事件A赋于一个实数,记为P(A),称为事件A的概率。这里P(•)是一个集合函数,P(•)要满足下列条件:(1)非负性:对于每一个事件A,有P(A)≥0;(2)规范性:对于必然事件S,有P(S)=1;(3)可列可加性:设A1,A2……是两两互不相容的事件,即对于i≠j,Ai∩Aj=φ,(i,j=1,2……),则有P(A1∪A2∪……)=P(A1)+P(A2)+……下面,我们将用实力生活中的几个悖论,来阐述概率论在日常生活中的应用。三、友谊悖论1)悖论的提出我们先来探究一下最简单的悖论。实际上几乎每个人都会觉得朋友的朋友总是比自己的多。换句话说就是自己的朋友数,几乎总是小于自己所有朋友的朋友数的平均值。这个结论看上去很违背直觉:如果我是某个人的朋友,那个人必然也会是我的朋友,友谊是双向的,所以我们会经验的认为整个数据是平均分布的,任何人的朋友数和他的朋友比起来应当差不多。怎么可能他们的平均朋友数会比我们自己的多呢?[2]2)悖论的解决实际上,这个问题与你自身是毫无关系的,无论你是广交朋友的人,还是含蓄内敛的人,你的朋友的朋友总会比自己多。我们可以如此解释:有一百个人,他们都能有一个拥有一百个朋友的朋友,但是只有一个人,能有一个只有一个朋友的朋友。也就是说,在计算“朋友的朋友”这个过程中,一个人拥有越多朋友则越容易被重复计算进来。严格的数学证明是:设群体总人数为n,第i个人的朋友数为Fi,那么群体所有人的朋友均数就是(∑Fi)/n。至于所有人“朋友的朋友”则一共有∑Fi个样本(把每个人的朋友列举一遍),又因为第i个人的朋友数会被重复计算Fi次,所以群体中所有人“朋友的朋友”的总数为∑Fi2。于是其朋友的平均朋友数就是(∑Fi2)/(∑Fi)。根据均值不等式的变形可知,(∑Fi2)/(∑Fi)≥(∑Fi)/n。这样就证明了在朋友圈里,朋友的平均朋友数不小于每个人的朋友均数。更精确地描述就是:朋友的朋友均数=朋友均数+朋友数方差/朋友均数。四、钱包悖论1)悖论的提出有A和B两人进行一场赌博。赌法是:由第三者计算A、B二君钱包里面的钱,钱少者可以赢走钱多者的钱。A对于这场赌博的想法为:若B君的钱比我少,我可能输掉我现有的钱。但若B君的钱比我多,我赢了,就会得到多于我现有的钱。我能够赢的钱比输的钱多,所以这场赌博对我有利。而B的想法也是如此。二人想法的逻辑都正确,但若认为二人的想法都正确,又将做出这场赌博对A、B二人都有利的错误结论。这显然是一个悖论。最常见的就是在赌博时,期待“如果赢的话、会赢得比输得更多”。例如玩吃角子老虎机时认为“就算只中樱桃,也是翻五倍!”但问题在于:会中吗?[3]2)悖论的解决我们通过数学推理可知,其实问题就在A,B二人只以“可以赢更多的钱”这点,就做出这场赌博对自己有利的结论,当然是错误的。钱包只有二个,所以钱包里的钱只存在二个数:X,Y,设XY。A有1/2机会是X,1/2机会是Y;B也如是。软件学院潘昆豪102120503/5如果A的钱是Y,则赢得X;如果A的钱是X,则输掉X;B也如是。结论:1/2机会赢,1/2机会输。而A,B想法的问题出在,他们假设了3个数:设A有X元,B有Y,(YX)或Z,(ZX)。但实际上只存在2个数,所以这是错误的论证,推理出错误的结论。五、星期二男孩悖论1)悖论的提出一个人有两个小孩,其中有一个是生于星期二的男孩儿,问另一个是男孩儿的概率是多少?算法1:两个孩子的性别是独立的,不论一个孩子的性别是什么都不会影响到另一个(不考虑极端或特殊情况),所以生男孩的概率为1/2;算法2:我们用1,2,3,4,5,6,7表示周一至周日出生,b,g表示那个孩子是男孩还是女孩,比如2b就表示某个孩子是周二出生并且是男孩,3g则表示某个孩子是周三出生并且是女孩。然后我们穷举一下周一至周日7天出生的两个孩子的所有可能性,如:(1b,1b),(1b,1g),(1b,2b),(1b,2g)...,(7b,7g),...,(7g,7g),一共有14*14=196种可能。我们再找出其中包含星期二出生的男孩的项,即包含2b的项,一共有27种,如下:(1b,2b),(1g,2b),(2b,1b),(2b,1g),(2b,2b),(2b,2g),(2b,3b),(2b,3g),(2b,4b),(2b,4g),(2b,5b),(2b,5g),(2b,6b),(2b,6g),(2b,7b),(2b,7g),(2g,2b),(3b,2b),(3g,2b),(4b,2b),(4g,2b),(5b,2b),(5g,2b),(6b,2b),(6g,2b),(7b,2b),(7g,2b)这27种可能里另一个孩子也是男孩的情况有13种,也就是说,已知一个孩子是星期二出生的男孩的情况下,如果不考虑双胞胎等意外因素,另一个孩子也是男孩的可能性是13/27,小于1/2。算法3:我们来看一个表格:编号第一个孩子第二个孩子1男男2男女3女男4女女在这个表格中,他有两个孩子,其中一个孩子是男孩的情况一共有3种(当然,对应地,他其中一个孩子是女孩的情况也有3种),分别是情况1、2、3。而这三种情况中,只有在情况1下,另一个孩子也是男孩,即:另一个孩子也是男孩的概率是1/3,而不是直觉所认为的1/22)悖论的解决如果把星期二出生这个条件简化,即问题为:一个人有两个小孩,已知其中一个是男孩,问另一个是男孩的概率是多少?在哪天出生这个问题,是否会影响孩子的性别?算法1中,对应的其实是上面表格中编号为1和2的情况,显然,另一个孩子也是男孩的概率是50%;而算法3,对应的是上表中编号为1、2、3的三种情况,其中另一个孩子也是男孩的概率只有1/3。其实这个悖论的本质问题是,上面的三种算法中,计算者所用到的信息是不同的,算法1只携带了第一个孩子的性别信息,另一个孩子的软件学院潘昆豪102120504/5性别完全是未知的;而算法3,已经包含了第二个孩子的性别信息了,做这个描述的观察者知道所有两个孩子的性别,事实上,这个观察者已经帮你删除了表格中编号为4的情况(即两个孩子都是女孩的情况),所以最终的概率受到了影响。也就是说,最终答案取决于问你这个问题的人告诉你“其中有一个是生于星期二的男孩儿”这个信息的人掌握了多少信息,他只知道一个孩子的性别并且刚好这个孩子是男孩,还是他知道所有两个孩子的性别然后告诉你其中一个是男孩。原题之中,其实也隐藏了一个前提,即做出“有两个小孩,其中有一个是生于星期二的男孩儿”这个描述的人,他已经观察了所有两个孩子的性别以及出生在星期几,所以在算法2中,事实上已经删除了一些可能性(两个孩子都是女孩或没有一个孩子出生在星期二的情况),所以此时,我们面对的已经不是所有可能性,而只是所有可能性中的一个部分,所以概率不是50%,而是13/27。当然,如果这个观察者只知道这个人有两个孩子,并且只知道其中一个是星期二出生的男孩,而另一个孩子出生在星期几以及性别他完全不知道,那答案就是50%了。所以,问题的关键点就在这里:观察者掌握了多少信息。他是只知道一个孩子的信息,还是已经观察了所有孩子、掌握了所有孩子的信息,这将决定他在做出描述时是否会在事实上删除掉一些情况,并最终影响到问题的概率。六、解决悖论后的体会最后一个悖论告诉我们,统计中总体容量的选取会影响到最终的概率。总体容量选取不当,则会偏离日常生活中的实际情况,或者会产生直觉,即思维定势,影响问题的解决。所以,我们在统计中选择样本是非常重要的。例如备受诟病的空气质量,中国气象局和美国大使馆选择的样本空间就是不一样的,这使得数据相差巨大。同样,我们在进行概率统计的时候,选模型是很关键的,概率模型可以分为离散模型和连续模型,离散模型有古典模型,泊松分布模型,0-1分布模型和二项分布模型,连续性模型有指数分布模型和正态分布模型。各个模型的用途是不同的,下面将讨论他们具体的使用。泊松分布:泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等。二项分布:P(ξ=K)=C(n,k)*p^k*(1-p)^(n-k),其中C(n,k)=n!/(k!*(n-k)!)二项分布即重复n次的伯努利试验。在每次试验中只有两种可能的结果,而且是互相对立的,是独立的,与其它各次试验结果无关,结果事件发生的概率在整个系列试验中保持不变。指数分布:指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。而且,指数分布是无记忆性的。软件学院潘昆豪102120505/5正态分布:生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。综上所述,在对应不同

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功