2019/12/131概率论与数理统计2概率论与数理统计是研究随机现象数量规律的一门学科。3《概率统计》是高等院校理工类的重要课程之一。在考研数学中的比重大约占22%左右。概率论与数理统计是数学的一个有特色且又十分活跃的分支,一方面,它有别开生面的研究课题,有自己独特的概念和方法,内容丰富,结果深刻;另一方面,它与其他学科又有紧密的联系,是近代数学的重要组成部分。由于它近年来突飞猛进的发展与应用的广泛性,目前已发展成为一门独立的一级学科。4概率论学科历史概率,指一种不确定的情况出现可能性的大小.起源于中世纪以来的欧洲流行的用骰子赌博.分赌本问题:甲、乙二人赌博,各出赌注30元,共60元,每局甲、乙胜的机会均等,都是1/2。约定:谁先胜满3局则他赢得全部赌注60元,现已赌完3局,甲2胜1负,而因故中断赌情,问这60元赌注该如何分给2人,才算公平?帕斯卡和费尔马建立了概率论的一个基本概念——数学期望,惠更斯1657年将自己的研究成果写成了专著《论掷骰子游戏中的计算》.在他们之后,对概率论这一学科做出贡献的是瑞士数学家族——贝努利家族的几位成员.雅可布·贝努利在前人研究的基础上,证明了被称为“大数定律”的一个定理,这是研究等可能性事件的古典概率论中的极其重要的结果。5随着18、19世纪科学的发展,人们注意到某些生物、物理和社会现象与机会游戏相似,从而由机会游戏起源的概率论被应用到这些领域中,同时也大大推动了概率论本身的发展。法国数学家拉普拉斯将古典概率论向近代概率论进行推进,他首先明确给出了概率的古典定义,并在概率论中引入了更有力的数学分析工具,将概率论推向一个新的发展阶段。他还证明了“煤莫弗——拉普拉斯定理”.拉普拉斯于1812年出版了他的著作《分析的概率理论》,这是一部继往开来的作品。这时候人们最想知道的就是概率论是否会有更大的应用价值?是否能有更大的发展成为严谨的学科概率论在20世纪再度迅速地发展起来,则是由于科学技术发展的迫切需要而产生的。1906年,俄国数学家马尔科夫提出了所谓“马尔科夫链”的数学模型。1934年,前苏联数学家辛钦又提出一种在时间中均匀进行着的平稳过程理论。620世纪初完成的勒贝格测度与积分理论及随后发展的抽象测度和积分理论,为概率公理体系的建立奠定了基础。在这种背景下柯尔莫哥洛夫1933年在他的《概率论基础》一书中首次给出了概率的测度论式定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础,使概率论成为严谨的数学分支。7数理统计学科历史统计学起源于收集数据的活动,现今各国都设有统计局或相当的机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问——数理统计学的内容。8一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作《关于死亡公报的自然和政治观察》,标志着这门学科的诞生。数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。人们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布”,即是他在这研究中的一个产物。这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初(1805)与德国大学者高斯发明的“最小二乘法”,另外一个重要成果是高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。正态分布也常称为高斯分布。9正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在“所研究的量具有或近似地具有正态分布”这个假定的基础上,而经验和理论(概率论中所谓“中心极限定理”)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各有差异。看来毫无规则,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不少重大的贡献,但在德国10马克的有高斯图像的钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。1020世纪以前数理统计学发展的一个重要成果,是19世纪后期由英国遗传学家兼统计学家高尔顿发起,并经现代统计学的奠基人之一K·皮尔逊和其他一些英国学者所发展的统计相关与回归理论。所谓统计相关,是指一种非决定性的关系如人的身高X与体重Y,存在一种大致的关系,表现在X大(小)时,Y也倾向于大(小),但非决定性的:由X并不能决定Y。现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的理论把这种关系的程度加以量化,而统计回归则是把有统计相关的变量,如上文的身高X和体重Y的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及众多变量,它们之间有错综复杂的关系,且许多属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。11这门学科的理论框架在20世纪上半叶得以完成,狭义一点说可界定在1921——1938年,起主要作用的是几位大师级的人物,特别是英国的费歇尔·K·皮尔逊,发展统计假设检验理论的奈曼与E·皮尔逊和提出统计决策函数理论的瓦尔德等。我国已故著名统计学家许宝(1910——1970)在这项工作中也卓有建树。自二战结束迄今,数理统计学有了迅猛的发展,主要有以下三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论的发展打开了门径和提供了手段,许多理论和方法得到了完善与深入,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具——统计方法的实施往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人们虽然知道,但很少付诸实用,就因为是人力所难及。计算机的出现解决了这个问题。同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一。12概率论与数理统计的应用概率论与以它作为基础的数理统计学科一起,在自然科学,社会科学,工程技术,军事科学及工农业生产等诸多领域中都起着不可或缺的作用。直观地说,卫星上天,导弹巡航,飞机制造,宇宙飞船遨游太空等都有概率论的一份功劳;及时准确的天气预报,海洋探险,考古研究等更离不开概率论与数理统计;电子技术发展,影视文化的进步,人口普查及教育等同概率论与数理统计也是密不可分的。根据概率论中用投针试验估计π值的思想产生的蒙特卡罗方法,是一种建立在概率论与数理统计基础上的计算方法。借助于电子计算机这一工具,使这种方法在核物理、表面物理、电子学、生物学、高分子化学等学科的研究中起着重要的作用。13怎样学“概率论与数理统计”学习过程中要抓住对概念的引入和背景的理解.要紧扣它的实际背景,理解统计方法的直观含义.对于引入概念的内涵和相互间的联系和差异要仔细推敲.在解题过程中不要为解题而解题,而应理解题目所涉及的概念及解题的目的.而要把精力放在理解不同题型涉及的概念及解题的思路上去.14概率论15关键词:样本空间随机事件频率和概率条件概率事件的独立性第一章概率论的基本概念16§1随机试验确定性现象:结果确定不确定性现象:结果不确定确定性现象不确定性现象——确定——不确定——不确定自然界与社会生活中的两类现象例:向上抛出的物体会掉落到地上明天天气状况买了彩票会中奖17概率统计中研究的对象:随机现象的数量规律对随机现象的观察、记录、试验统称为随机试验。它具有以下特性:1.可以在相同条件下重复进行2.事先知道可能出现的结果3.进行试验前并不知道哪个试验结果会发生例:抛一枚硬币,观察试验结果;对某路公交车某停靠站登记下车人数;对某批电子产品测试其输入电压;对听课人数进行一次登记;18§2样本空间·随机事件(一)样本空间定义:随机试验E的所有结果构成的集合称为E的样本空间,记为S={e},称S中的元素e为基本事件或样本点.S={0,1,2,…};S={正面,反面};S={(x,y)|T0≤y≤x≤T1};S={x|a≤x≤b}记录一城市一日中发生交通事故次数例:一枚硬币抛一次记录某地一昼夜最高温度x,最低温度y记录一批产品的寿命x19(二)随机事件一般我们称S的子集A为E的随机事件A,当且仅当A所包含的一个样本点发生称事件A发生。S={0,1,2,…};记A={至少有10人候车}={10,11,12,…}S,A为随机事件,A可能发生,也可能不发生。例:观察89路公交车浙大站候车人数,如果将S亦视作事件,则每次试验S总是发生,故又称S为必然事件。为方便起见,记Φ为不可能事件,Φ不包含任何样本点。20(三)事件的关系及运算事件的关系(包含、相等)例:记A={明天天晴},B={明天无雨}记A={至少有10人候车},B={至少有5人候车}一枚硬币抛两次,A={第一次是正面},B={至少有一次正面}2ABABBA=1ABAB:事件发生一定导致发生BABABASAB21事件的运算{|}ABxxAxBAB或:与至少有一发生。121121,,,,ninininiAAAAAAAA:至少有一发生:同时发生SBASABSBAABA与B的和事件,记为,,ABABABA与B的积事件,记为{|}ABxxAxBAB且:与同时发生。当AB=Φ时,称事件A与B不相容的,或互斥的。22“和”、“交”关系式1211nniiniiAAAAA=;1211nniiniiAAAAA;ABABABABABABSABASA{|}ABABxxAxB且,,AASABSAAABABAA的记为,逆事件互若,称逆、互斥例:设A={甲来听课},B={乙来听课},则:{甲、乙至少有一人来}{甲、乙都来}{甲、乙都不来}{甲、乙至少有一人不来}23§3频率与概率(一)频率定义:记其中—A发生的次数(频数);n—总试验次数。称为A在这n次试验中发生的频率。例:中国国家足球队,“冲击亚洲”共进行了n次,其中成功了一次,则在这n次试验中“冲击亚洲”这事件发生的频率为某人一共听了17次“概率统计”课,其中有15次迟到,记A={听课迟到},则#频率反映了事件A发生的频繁程度。An()nAfAnn;()nfA1n;()151788%nfA()nfA试验序号n=5n=50n=500nHfn(H)nHfn(H)nHfn(H)1234567891023151242330.40.60.21.00.20.40.80.40.60.6222521252421182427310.440.500.420.500.480.420.360.480.540.622512492562532512462442582622470.5020.4980.5120.5060.5020.4920.4880.5160.5240.494表1例:抛硬币出现的正面的频率25实验者nnHfn(H)德·摩根204810610.5181蒲丰404020480.5069K·皮尔逊1200060190.5016K·皮尔逊24000120120.5005