《统计陷阱》读后感10统计陈斯杰1037805420世纪50年代,美国社会越来越重视利用统计来说话,然后就有大量的统计数据和资料由于各种原因被滥用。就在这种背景下达莱尔·哈夫写下了经典的《Howtoliewithstatistics》。这本书用浅显易懂的语言和生动的图片揭示了人们如何用统计数据编造利于自己的言论,教会了人们如何辨别统计数据中的陷阱。《统计陷阱》一共分为十章,前八章讲了各种利用统计数据说谎的方法,第九章综合了前八章的各种方法编造甚至操纵统计,而第十章则是教人们如何识破统计数据中的陷阱,看到真正的统计现实。纵观整本书,作者所讲的设置统计陷阱或者说利用统计说谎的方法大致有:利用内在有偏的样本、选取不同的平均数、隐藏重要的数据、忽视必要的误差、滥用统计图形、采用不完全匹配的资料以及误解相关关系等。在这些手段中有些是比较容易发现的,但是有些是非常隐蔽难以辨别的。就拿采用不完全匹配的资料的手段来说,书中举了一个令我印象十分深刻的例子。在美国与西班牙交战的时候,美国海军的死亡率是9‰,而同时期的纽约居民的死亡率是16‰,后来海军征兵人员就利用这个数据来证明参军更加安全。这两个数据具有很强的诱惑性,但仔细想一想便能发现其中的猫腻。海军是一群健硕的年轻人,而城市居民中包括了婴儿、老人、病人等各种弱势群体。两者根本没有什么可比性。书中还有许多例子来阐述以上的八种手段,这里就不一一举例了。读完了这本书首先感慨的是原来数据不是万能的,不是所有的数据都是值得相信的。一样数据在经过众多极具“聪明才智”的人的手后,将会表现出完全不同的情况。那么为什么这些人要这么做呢?我想无非就是利益所趋吧。商家要获得更好的销售量必须有更好的产品或者说更加诱惑力的产品,而统计数据真是提高这种诱惑力的最佳武器并且让产品更令人信服。公司为了提高自己公司的声誉,获得更好的市场预期,于是利用统计数据让自己的业绩的发展更加的耀眼等等。的确数据在很多人眼中(包括我)是客观的令人信服的,于是人们便利用这一种漏洞制造各种数据上的陷阱来迷惑众人已达到自己所期望的结果。在我看来,这些看来这些现象是不可避免的,因为这是社会竞争的产物。那么既然无法避免,我们就得学会识破这些陷阱的表象,看到事物的本质。《统计陷阱》中也提到了也一方面。首先要在数据中寻找偏差,然后看样本是否有偏,在看自己看到的数据中是否有重要数据遗漏,最后就要看是否有人偷换了概念是否用了毫无意义的或者完全不匹配的数据。读了这本书让我能更加理智的对待统计数据,更加清楚了看到事物的本质。就拿我国的人均工资来说吧,根据中国统计年鉴2009年中国城镇人均月收入为2687元。但是我在上网的是后经常会看到有网友说自己工资只有一两千,新闻里也常常报道大量工资在一千徘徊的劳动工作者。显然这个数据是具有代表性的。首先这个数据是一个平均数,而工资的分布是不满足正态分布的,所以平均数不能正确的表示出人均工资的水平。再就是这个统计样本是有偏的,因为国家所说的工资指的是签合同的工人的工资,统计的也都是这类类工资。而那些没有签合的非正规的工作者是不在统计范围内的,比如街头摆摊卖东西的小贩等等,但正是这一部分人的收入是比较低的,并且群体是庞大的。没有统计这一部分人也间接地拉高了人均工资。最后就可能是统计时的误差等。所以综合以上种种可以看出平均工资的误差。以前我也怀疑统计平均工资的真实性,但看过了这本书后进一步了解了其中的细节。平均工资的问题由来已久而且其中的误差也比较明显,但是下面一种情况就比较隐蔽了。曾经,欧洲汽车俱乐部(ACE)发表了他们的新观点,“女驾驶员的技术比男驾驶员好”。结论来源于官方的统计数据。2008年在一共发生三十万次左右有死伤的车祸。其中二十万起由男驾驶员引发,其余十万“归功”女驾驶员,也就是说男人造成的车祸是女人的两倍。首先,这里有误解相关关系的嫌疑,男人造成的车祸多就能说明男人的技术差?那不是说世界上的顶尖赛车手男人都就能说明男人的技术好了?这显然是不现实的,这数据显示男驾驶员引发的车祸多,但这些车祸中又有几个是因为技术问题而引发的呢?然后,我有看到了几个数据,而这些数据时原报道所没有的。第一个数据,男人们驾驶的距离远超女驾驶员的两倍。男人们每天的平均驾驶距离是30公里,女驾驶员只有12公里。第二个数据,男人中没有驾照的人占7%,而在女人中占18%。看完这几个数据后那个结论就更加荒谬了。因为根据那些数据我们用ACE的思路甚至可以得出女人的驾驶技术更加的差,与之完全相反。因为女驾驶员驾车的里程占男女总里程的1/4到1/5,但造成1/3的车祸。这个例子中ACE用了隐藏重要的数据、误解相关关系两种手段,而这两种手段更加隐蔽。如果没看这本书,我想根本无法发现其中的陷阱而轻易相信了吧。统计的谎言可以如此隐蔽,造成的危害也是不容忽视的。2010年10月,现任希腊总理帕潘德里欧领导的新政府一上台便公布了一个爆炸性消息:希腊2009年财政赤字预计将达到国内生产总值的12.7%,而非上届政府预估的5%。这暴露出了希腊统计数据的造假。而这造假也造成了巨大的财政窟窿,使得希腊陷入了空前的经济困境。统计的谎言也会得出令人难以置信的荒谬的结论。曾有人得出一个结论:某大学有三分之一的教授与他的学生结婚了。而建立在这结论基础上的样本仅仅是一个4人小样本。这本书不仅让我有了识辨和看破那些统计数据的陷阱的能力,更加客观真实的了解现在社会,也为我提供了反面教材。这本书中阐述的各种手段更像是正规统计方法的误用。这些手段警示了自己在以后的统计学习中极有可能犯的错误,减少了自己犯错的几率。《统计陷阱》带给我一个全新的统计数据观和正确统计合理统计的方法。