《概率论与数理统计》读后感

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《概率论与数理统计》读后感马克.吐温曾讽刺道:有三种避免讲真相的方式:谎言,该死的谎言和统计数据。这个笑话很中肯,因为统计信息频繁地看似一个黑匣子——了解统计定理怎样让通过数据取得结论变成可能,这是有难度的。但因为不论是喷气发动机可靠性还是安排我们平日看的电视节目的流程,数据分析,类似的任何事情中都扮演着重要角色,所以至少获取对统计基本理解是重要的。大数定律和中心极限定理很长,但是要表达的意思很简单。数学就这样,数学家要表达一个很简单的意思,但是为了严谨,他们写出来的公式就很长,很烦人。先看大数定律:不管是什么样的随机变量,对于他们的样本均值,你所取得的样本容量n越大,你的样本均值就越接近总体均值。大数定律跟随的几个定律,贝努里大数定律和辛钦定理其实说的是一个意思,可以看做大数定律的具体描述。区别在于,贝努里告诉我们,独立重复试验的随机变量符合大数定律。辛钦告诉我们,不要求独立重复试验,只要是独立同分布的随机变量,就能满足大数定律。所以贝努里大数定律是辛钦定律的特殊情况。辛钦看到了更一般的情况。中心极限定理:对于一批随机变量,符合某种条件时,不管这些随机变量如何分布,他们的样本均值的分布就一定是正态分布!在公理化体系提出之前,人们对概率的研究局限在等可能事件。比如抛一枚硬币,我可以认为抛出正面的概率就是1/2。若实际抛掷,抛10次,也许会有七次是正面,但如果抛很多很多次,那得到的正面占比将十分接近50%,这就是“频率接近于概率”的观念。贝努里感兴趣的是,如果抛100次,出现的正面数占比在48%到52%之间的概率是多少?如果抛100万次,这个概率又会变为多少?能否抛足够多次,来让正面数的占比在49.9999%到50.0001%之间的概率达到99.9999%?在这个问题上面工作了整整20年后,1705年左右,贝努里证明了第一个大数定理,它指出,我们总可以抛掷足够多次,使我们能几乎确定得到的正面占比很接近于50%。而且,在给定“几乎确定”和“接近”的具体定义后,定理还给出用来计算这个“足够”的抛掷次数的公式。后来,有了公理化体系,就有了现在教科书上标准的说法:对独立同分布的随机变量序列{xn,n=1,2,3,...},设均值为Exn,方差存在。则[(x1+...+xn)-E(x1+...+xn)]/n依概率收敛到0。可见贝努里大数定理就是xn为二元随机变量时的一个特例。至于其他那些带着其他人名的大数定理,无非就是把条件放宽而已。如辛钦大数定律是把条件放宽为随机变量序列独立同分布且存在一阶矩。定义中心极限定理:某典型课本对中心极限定理的定义如下:当样本容量增加时,样本均值X的分布接近均值等于μ,标准差σ/√n换句话说,如果我们多次采用大小为n的独立随机抽样,那么当n足够大的时,样本平均值的分布就接近正态分布。那么多大才是足够大呢?一般来说,样本容量大于或者等于30认为是足够大,此时中心极限定理起作用。如果总体分布越要接近正态分布,那么需要更多的样本来使用该定理。对于严重不对称的或者有几个模板的总体来说,也许要求更大的样本。从一个总体中收集所有的数据是很难操作或者不可行的,统计学就是基于这个情况产生的。换种方式来做,我们可以从总体中获取数据的子集,然后对这个样本进行统计分析,以得到总体的结论。举例来说,我们可以从工业生产流程中收集多个随机样本,然后使用各个样本的平均值来推断整个过程的稳定性。两个常用于解释总体的特征值分别是平均值和标准差。当数据遵循正态分布,均值表示分布的中心位置,标准差揭示分布情况。想象我们在获取我们做过的考试结果,除了接收我们自己的成绩以外,我们也要知道其他人的平均分,然而,如果考试成绩不符合正态分布,平均分就容易让人造成误解了。中心极限定理是卓越的,因为它暗示,无论总体分布如何,样本均值的分布将接近正态分布。该定理也允许我们对样本均值或许采取的价值的可能变化范围做可能性声明。例子1:掷骰子为了说明中心极限定理,骰子是理想的,如果你掷有6面的骰子,掷到1的概率是1/6,2的概率是1/6,3的概率是1/6,以此类推……骰子落在任何一面的概率与任意其他5面的概率相等。在教室的情况下,我们用真实的骰子进行这样的实验。为了获得一个总体的准确表示,让我们掷500次。当我们用图形来注标数据时,我们看到和预期一样,分布看起来相当平坦,这肯定不是正态分布。当我们连续掷2次骰子,重复这样的操作500次,之后,我们计算每对的平均值,创建直方图。观察直方图,我们会发现:随着样本大小,或者掷的次数增加,平均值的分布越来越接近正态分布。除此以外,样本平均值的方差随样本大小的增加而减少。中心极限定理阐明,对于足够的大n,X接近正态分布的均值μ和标准差σ/√n。一个6面骰子的总体均值是(1+2+3+4+5+6)/6=3.5,并且总体标准差是1.708。因此,如果定理适用,三十次的平均值的均值应该约为3.5,以及标准差1.708/√30=0.31。我们可以观察前人的掷骰子实验,30次平均值的均值,为3.49,标准差为0.30。这两个数值跟计算的近似值很接近。大数定理为数理统计应用于统计学搭起了连接的纽带。大量观察法是现代统计学的基本方法之一,而大数定理又是大量观察法的基础,统计学若没有大量观察法的支撑,则统计分析中的基本指标——平均数与相对数,则失去其应有的作用和意义,可见数理统计在统计方法中的基础地位不容置疑。中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明,只要样本容量足够的大,得自未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。中心极限定理除了其对现代统计学的重要意义外,还在光学、保险行业、能量供应问题、系统可靠性问题等诸多领域有着广泛的应用,中心极限定理帮助我们解决了许许多多的实际问题。可见,中心极限定理也为我们的生活提供了方便。我觉得吧,如果不搞理论的话,没必要去深究这些不同名称大数定理、中心极限定理到底在说什么,只要我们能够把握好它们之间的联系,尽量的去弄懂它们的来龙去脉,有效地将所学内容联系起来,以及在做题的过程中能够灵活的应用,把题做对就行了。南京邮电大学人文与社会科学学院行政管理B12120629刘晓栋

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功