概率论与数理统计ProbabilityandMathematicsPhysicsStatistics尧雪莉13879131104Shellyyao2006@126.com概率论与数理统计2/24内容提要概率论与数理统计是研究随机现象统计规律的一门数学学科。概率论是对随机现象统计规律演绎的研究,而数理统计是对随机现象统计规律归纳的研究,作为一门学科,它们是互相渗透、互相联系的。第一章概率论的基本概念在一定条件下必然发生的现象向空中抛一物体必然落向地面;水加热到100℃必然沸腾;异性电荷相吸引;放射性元素发生蜕变;在试验或观察前无法预知出现什么结果抛一枚硬币,结果可能正面(或反面)朝上;向同一目标射击,各次弹着点都不相同;某地区的日平均气温;掷一颗骰子,可能出现的点数;………………()yfx研究和揭示随机现象的统计规律性的数学学科4/135/13结果有可能为:“1”,“2”,“3”,“4”,“5”或“6”.实例“抛掷一枚骰子,观察出现的点数”.实例“用同一门炮向同一目标发射同一种炮弹多发,观察弹落点的情况”.结果:“弹落点会各不相同”.随机现象的特征条件不能完全决定结果概率论最早是从赌博(博弈)游戏开始的.博弈游戏产生于人类已有数千年历史了.考古工作者在公元前3500年的一座埃及古墓中发现古埃及人在一种“猎犬与豺狼”的板盘游戏中,用投掷距骨的结果决定猎犬与豺狼移动的步数.骰子是在距骨之后发现的,伊拉克北部曾发现一颗陶制的骰子,据推断距今已有3000年历史.它对面的点数是2和3,4和5,1和6.现在人们使用的对面点数之和为7的骰子大约出现在公元前1400年左右.纸牌的出现更晚一些.这些器具不仅用于赌博,还用于占卜和算命.公元960年意大利主教韦伯尔德(Wibold)把人的品德归纳为56种,算命者掷3颗骰子,主教就告诉他的品德是什么.这说明当时人们已经会计算排列组合问题了.6/13有关赌博的最早一个数学问题出现在1494年意大利修士、数学家巴乔罗(LucaPacciolo)的著作《算术,几何,比例和比值要义》中.应该按赌博中止时甲乙已赢的局数分配赌本.比如:3,2,1sab就按2:1分配.热衷于占星术和掷骰子的代数学家卡丹(J.Cardan)和塔塔利亚(N.Tartanlia)指出巴乔罗的分法是错误的,认为巴的分法没有考虑甲乙双方取得最终胜利还需要赢的局数.但是他们两人也没有给出正确的解法.7/1317世纪中叶,法国贵族德·梅理(DeMéré)向法国著名数学家、物理学家帕斯卡(B.Pascal)再次提出同一问题.这一貌似简单的问题难住了天才数学家帕斯卡,他思索了很久仍没有解决.于是,他开始了与费马(P.Fermat)关于这一问题的通信讨论.帕斯卡在1654年7月29日给费马的信中给出了这一问题的解.这一问题讨论中,产生了“概率”和“数学期望”等基本概念.帕斯卡的这封信被公认为是概率论的第一篇文献,是数学史上的一个里程碑.8/13在随后的200多年里,概率论不仅在理论上获得了一定发展,而且在人口统计、保险业、误差理论、天文学等自然科学中得到了应用.在这一时期,对概率论在理论和应用方面作出重要贡献的数学家有雅格布·伯努利(JakobBernoullii),丹尼尔·伯努利(DanielBernoullii),棣莫弗(DeMoivre),拉普拉斯(P.Lapace),欧拉(L.Euler),贝叶斯(T.Bayes),蒲丰(G.Buffon),高斯(F.Gauss),泊松(S.Poisson),布尼亚可夫斯基(V.Bunjakovskii),切比雪夫(Chebyshev),马尔可夫(A.Markov),李雅普诺夫(A.Lyapunov)等.尽管18,19世纪,概率论在理论和应用方面得到了很多成果,但与其它数学分支比较,概率论的发展是缓慢的.甚至直到20世纪以前概率论还未进入主流数学.其基本原因是概率论缺乏严密的逻辑基础.9/1310/13法国数学家拉普拉斯将古典概率论向近代概率论进行推进,他首先明确给出了概率的古典定义,并在概率论中引入了更有力的数学分析工具,将概率论推向一个新的发展阶段。他还证明了“煤莫弗——拉普拉斯定理”,把橡莫弗的结论推广到一般场合,还建立了观测误差理论和最小二乘法。拉普拉斯于1812年出版了他的著作《分析的概率理论》,这是一部继往开来的作品。这时候人们最想知道的就是概率论是否会有更大的应用价值?是否能有更大的发展成为严谨的学科。概率论在20世纪再度迅速地发展起来,则是由于科学技术发展的迫切需要而产生的。1906年,俄国数学家马尔科夫提出了所谓“马尔科夫链”的数学模型。1934年,前苏联数学家辛钦又提出一种在时间中均匀进行着的平稳过程理论。我们知道,平面几何学及微积分等数学概念与理论都是建立在各自的几个基本公理上的.公理化体系是数学的坚实基础.概率论之所以还不成为“数学”,其基本原因是概率论缺乏严密的逻辑基础.1900年,在巴黎国际数学家大会上,著名数学家希尔伯特(D.Hilbert)作了题为《数学问题》的重要报告,提出了20世纪数学学科的主攻方向,在第六个问题“物理公理的数学处理”中就特别提到了概率的公理化问题.1902年,勒贝格(H.Lebesgue)的论文《积分、长度和面积》建立了测度论的基础,经过玻雷尔(E.Borel)、拉东(J.Radon)、弗雷歇(M.Fréchet)、斯泰因豪斯(H.Steinhaus)等人的努力,到1930年勒贝格的理论发展到了严格表述概率论公理化所必须的程度.1933年柯尔莫哥洛夫(A.Kolmogorvo)的著作《概率论基础》正式出版,给出了概率论公理化的完整结构.从此,概率论才正式成为真正的数学分支.11/13凯恩斯主张把任何命题都看作事件,例如“明天将下雨”,“土星上有生命”等等都是事件,人们对这些事件的可信程度就是概率,而与随机试验无关,通常称为主观概率.米泽斯定义事件的概率为该事件出现的频率的极限,而作为公理就必须把这一极限的存在作为第一条公理,通常称为客观概率.目前,绝大多数教科书都是采用柯尔莫哥洛夫的概率公理化体系.12/1313/13数理统计软件介绍SAS:StatisticsAnalysisSystemSPSS;StatisticalPackageforSocialScience(社会科学统计软件包)现改名为:StatisticalProductandServiceSolutions(统计产品与服务解决方案)S-PLUSSTATAEXCELSAS(StatisticsAnalysisSystem)1976年成立了SAS软件研究所,正式推出SAS软件。现已被众多的机构和用户所采用,遍及金融、医药卫生、教育科研等各个领域。SAS系统被誉为国际上的标准软件系统。SAS具有强大的数据集编辑功能,能实现复杂的统计分析和一些特殊的统计要求。由于SAS系统是是完全针对专业用户进行设计,因此其操作至今仍以编程为主,人机对话界面不太友好,并且在编程操作时需要用户最好对所使用的统计方法有较清楚的了解,非统计专业人员掌握起来较为困难。S-Plus统计软件S-PLUS是基于S语言实现的。S语言是一种用来进行数据探索、统计分析、作图的解释型语言。S-PLUS强调演示图形、探索性数据分析、统计方法、开发新统计工具的计算方法,以及可扩展性。它的主要的特点是它可以交互地从各个方面去发现数据中的信息,并可以很容易地实现一个新的统计方法。STATA统计软件STATA是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,操作灵活、简单,易学易用。STATA的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。SPSS-----StatisticalPackageforSocialScience(社会科学统计软件包)现改名为:StatisticalProductandServiceSolutions(统计产品与服务解决方案)1.20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司2.1975年在芝加哥组建了SPSS总部3.1984年首先推出了世界上第一个统计分析软件微机版本SPSS/PC+。4.1992年的DOS版升级为Windows版本,即最初的4.0版5.1999年升级到10.0版、2001年升级为11.0版、2003年Windows操作平台下的最新版本为12.0;目前已开发14.0SPSS最突出的特点操作界面极为友好,操作简便。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。数据转换功能较强:可存取和转换多种数据类型,如Spss(*.sav),Excel(*.xls),Text(*.txt),dBase(*.dbf)文件等。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式可用SPSS命令编程,形成SPSS环境下的可执行文件。可数据管理、统计分析、作图、制表等。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。与著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员Excel软件专业统计软件SAS,SPSS,S-PLUS,STATA,系统庞大、结构复杂,大多数非统计专业人员难以运用自如,且价格昂贵;微软公司的Office软件包中的Excel具有处理数理统计问题的功能;在Excel中,点击“工具”----“数据分析”,有5类19个统计模块,见282页第十一章所示。如果“工具”下没有“数据分析”项,则调用“加载宏”来安装“分析工具库”计算机类专业学习《概率论与数理统计》的必要性概率论与数理统计在各个行业的应用需要计算机作为工具。“概率论与数理统计”是很多学科研究生入学考试的必考科目。高考、中考的必考内容。在高考中:必修:随机事件的概率、等可能事件的概率、互斥事件中有一个发生的概率、相互独立事件的概率、独立重复试验等。选修:文科:抽样方法、总体分布的估计、总体期望值和方差的估计理科:离散型随机变量的分布列、离散型随机变量的期望值和方差、抽样方法、总体分布的估计、正态分布、线性回归命题趋势:一大一小两个题目,大题以必修内容为主(文、理同),小题(选修为主)计算机方面的应用“十八世纪的理论成为计算机新力型”的作者WichaelKanellos说:“TomasBayes,一位伟大的数学大师,他的理论照亮了今天的计算机领域,和他的同事不同,他认为上帝的存在可以通过方程式证明,他最重要的作品被别人发行,而他已经去世了241年。”贝叶斯分类器计算机方面的应用网络信息检索系统(搜索引擎)1.Yahoo!分类系统(二值概率模型),第一代搜索引擎2.Google(第二代搜索引擎)使用Bayes定理为数据搜索提供近似结果.3.智能搜索引擎(第三代搜索引擎):Bayes网络微软把Bayes技术内置到未来的软件中.字母使用频率计算机键盘的设计、信息编码、密码设置与破译计算机故障分析调制解调器(输出的信息满足正态分布)数据挖掘、模式识别、图像处理成绩考核方式教材与参考书目参考书目:《数理统计学》,宋元村等编,湖南人民出版社《概率论与数理统计》(第三版),盛骤等编,高等教育出版社