复旦版工程数学之概率统计课件第27讲

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

本章转入课程的第二部分数理统计数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.由于学时有限,课程的的这部分内容重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识.学习统计无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:SAS,SPSS,STAT等,都可以让你快速、简便地进行数据处理和分析.配合教学编制的教学软件“数理统计教学系统”,可使你根据自己的进度,在计算机上进行学习.从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.但客观上数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息.因而由此获得的结论必然包含不肯定性.在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.下面我们以一例进行说明:某种子公司A,栽种了几种类别的鲜花,收获了大量的花籽,并把每25粒花籽扎成一小包出售.一个零售商批发了若干包,并向顾客保证:在每包25粒花籽中至少有22粒将能发芽,否则的话可免费调换另一包.每包要是有3粒不发芽,马上免费退换!每包25粒每包25粒中至少有22粒将发芽所有的包都如此吗??这种类型的不肯定性,即不知道种子公司出售的小包中可接受的比例,它是由于对总体的真实状态(天然状态)无知所引起的不肯定性.零售商面临如下两种类型的不肯定性:(1)他对种子公司出售的小包中可接受(即至少有22粒花籽将发芽)的包数所占比例是不清楚的.AP这是第一类不肯定性.(2)由于种子公司出售的花籽的货单上,这类花籽共有一百万包,而零售商只购买了200包,那些包是可接受的呢??这就是尽管他知道了一百万包可接受的比例,但对他所购买的200包,其中可接受的比例仍旧没有“把握”.AP从中购买200包共100万包因此他又面临着另一类不肯定性;零售商购买的200包仍有可能“碰巧”是从不可接受的一万包中选取的.那些包是可接受的呢??即使是0.99,即种子公司出售的一百万包中有99万包是可接受的,AP这样他就要损失一笔资金.从中购买200包共100万包这一类不肯定性是由于“随机性”所引起的.在已知的条件下,这种不肯定性的程度已在概率论部分作过讨论.AP下面我们回到第一类不肯定性:零售商对种子公司出售的小包中可接受(即至少有22粒花籽将发芽)的包数所占比例是多少没有把握.AP零售商能够根据试验的方法(请公司进行发芽试验)来改善他的处境.根据试验他能作出天然状况是多少的决策.AP这就是抽取部分种籽进行发芽试验,通过这部分中发芽数所占比例(频率)来对的真值进行推断.AP(1)怎样设计试验,决定观察的数目;(2)怎样利用试验观察的结果作出一个“好”的推断等.这都是数理统计所要研究的问题.虽然他不能精确地和肯定地确定,但可以期望获得一个(在某种意义下)比较好的推断.AP这就涉及到第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性?这是抽样方法和试验设计问题:最简单易行的是进行随机抽样.第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是统计推断问题.本课程着重讨论第二个问题,即最常用统计推断方法.概率论是数理统计的基础,而数理统计是概率论的重要应用.但它们是并列的两个学科,并无从属关系.可见,在数理统计中必然要用到概率论的理论和方法.因为随机抽样的结果带有随机性,不能不把它当作随机现象来处理.由此也可以说,统计方法具有“部分推断整体”的特征.在结束本节之前,我们需要强调说明一点:因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体.这里使用的推理方法是“归纳推理”.这种归纳推理不同于数学中的“演绎推理”,它在作出结论时,是根据所观察到的大量个别情况,“归纳”起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑推理去得出来的.例如,在几何学中要证明“等腰三角形底角相等”只须从“等腰”这个前提出发,运用几何公理,一步一步推出这个结论.而一个习惯于统计思想的人,就可能想出这样的方法:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作出“底角相等”的结论.这样做就是归纳式的方法.现在要问:从局部观察要对总体下结论有没有片面性呢?结论是否可靠?显然这里不仅依赖于进行局部观察的“样本”是否具有总体的代表性,也依赖于对从这些样本得到数据的合理加工、分析并得出论断.我们说,如果这一切都建立在可靠的科学基础上,则对总体下结论是可能的也是可靠的.因为这里存在着样品(随机抽取的一个个体)个性(特殊性)和总体共性(普遍性)之间的一种内在的、对立统一的辩证关系.“每一事物内部不但包括了矛盾的特殊性,而且包含了矛盾的普遍性,普遍性即存在于特殊性之中.”《矛盾论》毛泽东我们对每个经过合理手续选取的一个样品也应看到它所具有的两重性:一方面它具有特殊性,因为它毕竟是个别观察值,不能反映总体的全面性质,有片面性.因而统计上往往不采用由一次抽取的样品来下结论.在这个基础上再加上科学的推断方法,对总体下的结论同样也是可靠的.另一方面也要看到“普遍性即存在于特殊性之中”,即每个样品的情况又必然反映总体的一些普遍性.当样品有一定数量时总体的普遍性是可以得到比较真实的反映的.但此时还应记住毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往又是在某个“可靠性水平”之下得出的.这种矛盾的特殊性与普遍性的辩证统一在统计学中贯穿始终,是我们应该记住的基本思想.

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功