统计学的故事

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

-1-统计学的故事纪宏袁卫文2004年1月-2-第一回人类发现了统计统计改变了世界若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。——南丁格尔列位,一般故事或小说的开头总是写的比较虚,没有什么干货,只是交代一些背景。平均说来,到了第三回主要人物才出现,到了第五回矛盾冲突才展开。本文也决不敢例外。大千世界,芸芸众生,悠悠上下五千年,坐地日行八万里。这个世界所在的宇宙真奇妙,时间上没头没尾,空间上没边没沿。世界上的万物真复杂,自然界和人类社会好像都受到某种力量和规律的支配,可怜的是我们还无法确切地认识、把握这些力量和规律,偶然事件常常捉弄我们的命运。这个世界上的人们真倔,非要把这个很难描述的世界,包括客观世界和我们的主观世界整明白不可,大到宇宙空间,小到基因和纳米,探索者前仆后继,没完没了。任何值得一提的文明都探索过真理,冥思苦想的人们尽管不能完全确切的,但总是试图解释复杂多变的自然现象和人类自身。在很早很早以前,人们认为自然是神秘、无序,甚至是恐怖的。而人类自身也有很多谜题,例如,人类为何定居在这个地球上,人生的目的是什么,人类的终极归宿何在,等等。这些问题的答案一般是由宗教领袖给出的。过了很多很多年,智者、思想家和勇敢的科学先驱们,或统称为人民,逐渐摒弃了上帝按其意愿创造了人和物质世界的信仰。他们发现人类有智慧,用思维,佐以观察或实验,就能够发现各种谜一样的自然活动和人们自己。他们用思维与似乎瞬息万变的现象抗争,并将理性之光洒于其上。先驱的态度是理性的、批判的和反宗教的。由于他们的态度较好,终于得出了这样一些结论:自然和人类社会是有序的,按完美的设计而恒定地运行着,从星体的运动到树叶的颤动,从人们的行为到人们的观念,所有感官能感知的东西都能用一种精确、和谐而理想的我们实在想不通,用“发现”和“发明”哪个词更符合实际。-3-形式来描述。用土话说,自然和社会都是有规律的,这种规律虽然不受人的主观意志的影响,却能被人的思维所理解。又过了很多很多年,经过无数人大胆的观察、敏锐的猜想、天赋的直觉和一不怕苦二不怕死的精神,建立了现代科学的理论体系和思想体系。在天文学、物理学、生物学、人文社会科学以及数学和哲学等领域都取得了重大成果。虽然数百年来,科学和哲学的门派林立,各自有各自的掌门人,各自占据着各自的山头,都因自己发现真理而笑傲江湖。但有一个基本观点被大多数人承认,即这个世界是有规律的。我们是否可以用身边的事和通俗的语言解读一下科学巨匠们所研究的规律。请想一想,我们身边经常发生的重复出现的、有规律的现象:太阳每天从东方升起,冬天过去春天就要来临,物体失去支撑就会坠落,“神舟五号”飞航按设计的轨道运转,经济按市场规则运行,奔波的人们按自己的哲学度日。对不同领域中的规律进行探索和描述便形成了不同的学科。将不同学科的理论、方法、思想进行提炼,便形成了哲学、数学、统计学这样一些横断科学。同时,我们在发现我们周围的事物没有任何一次重复是完全的“克隆”,没有任何东西会把一切细节完全重复出来。太阳每天从东方升起,但天安门广场上与太阳同时升起的国旗其升旗时间却每天不同;冬天过去春天就要来临,但今年的春色比去年更加明媚;物体失去支撑就会坠落,但受风速、风向、地心引力等很多细小因素的影响,两个同样重的物体坠落速度和落点会有差别;“神舟五号”飞船按设计的轨迹运转,但每次经过我国领空的时间都略有差距;经济按市场规则运行,但今年的GDP比去年增长8%;奔波的人们按自己的哲学度日,但一年又一年我们的生活逐渐发生了改变。因此,任何科学都只能预见大体上的重复现象。行笔至此,我们是否感到统计学太重要了。统计学就是通过差异描述规律;透过现实走向理性,走出混沌,走向秩序的学科。“可以毫不夸大地说,现代科学的发展是在关注大数目现象的标志下进行的,很快就不会有不了解研究的随机性——统计方法的知识分支了”。的确,理、工、农、医、文,今天很难找到一个不使用统计的学科了,它在解决现代科学的那些最重要的和最多样化的课题中起着主导作用。统计学是科学的“母亲”和“仆人”。说她是“母亲”,因为统计学为其他学科起着孕育、生产新思想的作用;说她是“仆人”,因为统计学是其他学科的工具,用统计规律逼近客观规律的工具。但是,故事总有插曲,关于统计学客观基础问题的争论,从来未停止过。从古-4-希腊思想家那里开始到现在,一直存在两种对立的意见。一种意见认为,世界的本质是确定的,随机性只是由于人们认识的局限性而产生的噪音,他们总是将所有现象都解释成无微不至的事物秩序所产生的结果,在事物的重复出现中会因很多细节而产生差异,但这种差异只是目前人们还不了解这些细节而已。统计学只是对随机性差异的度量,是主观内容的范畴,在客观世界中没有什么对应他们的东西。虽然,统计学在科学研究中起着重要作用,但这个作用只是在认识过程中由相对真理到绝对真理的迈进中的作用。因而,这种意见认为,只有数学才能牢固把握客观世界的所作所为,能瓦解玄秘并代之以规律和秩序。而统计学则是由于人力所不及不得已而为之的方法,其基础不是客观的,只是人们知识不足和信息不完备的代名词,虽然统计学是我们人类自己发明的探索客观规律最好用的方法,但数学才是上帝的宠儿,统计学只是人类的智慧。爱因斯坦给波尔的一封信中有这样一句名言:“你信仰掷骰子的上帝,我却信仰客观存在的世界中完备的定律和秩序”。文中暗表,那个时期人们所说的上帝似乎有两种意思,一种意思是神学中的上帝,和中国的玉皇大帝、灶王爷之类的东西相似;另一种意思是好像是指不为人们的意志为转移的客观规律,斯密的“看不见的手”与其有点相近。在那个神学和科学混合的时代,这两种意思很难分清楚,只好麻烦读者自己判断。直到20世纪初,科学界一直是这种观点,即机械决定论占统治地位。牛顿力学被称为科学思想的典范,学者们总是力图使科学规律符合严格确定性的理想。关于统计学客观基础问题的另一种意见认为,随机性本身也是客观的,统计学则反映的是知识体系中不依赖于人的关于客体的内容,上帝和人间的赌徒一样,也喜欢掷骰子。有一个著名的故事:拉普拉斯把他写的《天体力学》献给拿破仑。《天体力学》是一本极具影响力的书,描述了如何根据地球上的观测数据,来计算行星与彗星的位置。拿破仑看后说:“拉普拉斯先生,你写了这本关于宇宙系统的书,却根本没有提到他的创造者——上帝”。据传说,拉普拉斯回答道:“我不需要这个假设条件”。拉普拉斯的《天体力学》虽不需要上帝,但它需要另一种东西,叫误差函数。从地球上观测行星与彗星的位置与预测值并不完全吻合,拉普拉斯将其原因归结为观测误差,包括随机误差和人为误差,并都放入误差函数中。当时的科学家都《爱因斯坦文集》商务印书馆1976年版,第415页。-5-认为,随着测量越来越精确,最后一定不再需要这项误差函数。谁知,到19世纪末,随着测量越来越精确,反而越来越测不准了。最终人们发现,这些误差一方面是由于测量技术问题,另一方面是由于被测量的客体本身具有随机性。机械式的宇宙观开始动摇,一些企图寻找生物学定律和社会学定律的努力也徒劳无功,甚至有些传统学科领域,如物理学和化学当时所用的那些定律,也被认为仅仅是粗略的逼近。科学家从理论上和实践上都充分证实了严格决定论对描述客观现象的不适应性和不可归结性。布朗运动、混沌动力学、量子力学、耗散结构都证明了经典决定论已逐渐向统计决定论转移。人们的科学观念发生了新的变化。自然和社会中不规则、不连续、不稳定、非平衡的领域不断扩大,其中充满了涌现、转化、意外和机遇。科学探索也达到了这样的境界:科学家对客观事物的描述和预测的精度已不能通过改进操作技巧,提高测量的精密度加以改善,他们发现根本没有可能发现严格的因果依赖性,可以找到的只是统计的因果规律。您瞅瞅,统计的用处有多大,尽管统计学的客观基础问题还在争论不休,但统计已改变了世界,已成为科学与管理的工作母机,现在,谁也离不开统计了。人们形容一个智障的人时常说:“这个人缺数”,译成专业术语就是:“这个人不懂统计”。统计也成为现代人基本素质的构成要素,成为我们世界观的一个组成部分。人类的处境挺可怜的,我们是广褒宇宙中的流浪汉,孤单地生存在一个冷酷、陌生的空间里。我们可能是在最近一个冰川期后起源的,在自然的劫后余迹前孤立无援,生存在茫茫的时间中。我们依靠地球提供衣食,我们每个个体的出生都是随机事件的牺牲品。为了解决生命的寂寞、穷困、艰险和短暂,我们要与天斗、与地斗,不知为什么还非要与人斗。斗争中却也其乐无穷,凭着一点有限的感性知识和大脑,人类开始探究自然和自身,寻求真理和秩序,建立可以帮助我们获取有关生存环境奥妙的知识体系和解释模型,而我们的辉煌成就之一就是统计学。尽管我们现在还不很清楚,统计学的出现是由于人的聪明,还是“天籁之音”。多少年来,在深奥的学术争论和枯燥的统计数据背后,有好多美丽的故事和动人的传说。我们试图收集一些讲给大家听。一般故事中没有美女,便不引人入胜,为满足大家对美的渴望,本文下期便有美女出现,请君欣赏,请看第二回:美女午间品茶费雪突发灵感。参考文献:-6-[1]《统计,改变了世界》萨尔斯伯格著,叶伟文译,台湾天下文化书坊,2002.4[2]《世界统计名人传记》龚鉴尧著,中国统计出版社,2001.1[3]《统计发展史》陈善林、张浙编著,立信会计图书用品社,1987.9[4]《殴美统计学史》高庆丰,中国统计出版社,1987.8-7-第二回美女午后品茶费雪突发灵感养猴人心中暗笑:“朝四暮三和朝三暮四,不是都等于七吗?这畜牲就是不如人聪明。”猴子们窃窃私语:“朝四暮三和朝三暮四,虽然吃到肚子里都等于七,但朝四暮三更符合早吃饱,晚吃少的科学道理,不信去问问费雪。人虽然比我们聪明,但没学过统计的人,智商还真不如我们高。”——新《齐物论》二十世纪二十年代后期的一个夏日午后,一群风度翩翩的学者偕夫人及漂亮的女友,正在英国剑桥的户外餐桌旁,悠闲的品茶论道。席间,一位美丽的女士惊呼,午茶的调制顺序对味道有很大影响。把茶加进牛奶里和把牛奶加进茶里,喝起来风味完全不同。出于对女性的尊重,那些学者们面带绅士的微笑,内心却不以为然,甚至是藐视,依据他们的科学头脑分析,茶和牛奶两种物质混合结果的化学成份不会因为调制顺序不同而产生不同,怎么会喝起来不一样呢?文中暗表,这个命题的假定前提是不论调制顺序如何,牛奶和茶的比例是固定的或是基本不变的。美丽女士提出的问题是朝四暮三和朝三暮四的关系,而不是朝四暮三和朝四暮四的关系。古板的英国绅士一定会把古板的精神带到生活细节中,所以这个假设前提一般会成立。书归正传,正当众学者对美丽女士的说法嗤之以鼻时,有个身材瘦小的,嘴上留着灰白胡子的绅士挺身而出,抓住了这个问题。此人便是在统计发展史上地位显赫、大名鼎鼎的费雪(RonaldAylmerFisher,1890-1962),伦敦人氏,英国统计学家。费雪当时显得非常兴奋,好像发现了大元宝。“让我们来检定这个命题。”说着,在众位学者的帮助下,他开始进行实验。他们设计并调制出很多杯不同的茶,有些先放茶水再加牛奶,有些先放牛奶再加茶水,然后按照既定的顺序一杯一杯拿给美丽女士品尝分辨,但她并不知道每杯茶的调法。费雪端给她第一杯茶,她尝了一口,然后说出这杯茶是先放茶水后加的牛奶,还是先放牛奶后加的茶水。费雪记录下她的说法,再送上第二杯,……。读者可能会问,这个看上去没什么科学价值的实验,是我们的这位尊敬的费雪先生从事科研之余闲着没事干,找个由头和美女套近乎,还是有什么别的原因。-8-说来话长,从16世纪甚至更早的时候起,科学实验已经进行了几百年。实验是发现、检验和积累知识的工具。但是在费雪时代以前,实验带有科学家个人浓厚的独特风格,并没有科学的规范、程序,更谈不上实验设计。一流的科学家可以做出很有价值的实验,产生新知识;而不入流的科学家只是盲目地进行实验,虽然生产出一些数据,但对生产和积累知识没什么用处。此外,19世纪以前的科学家很少发表自己的实验结果,他们仅描述研究结论,并公布那些能证明此结论真实性的数据。至于实验过程和实验结果的科学性和可靠性我们不得

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功