姓名:朱可夫班级:金融四班学号:2010200264统计滥用误用案例数据的统计应该恰当地应用到它能起作用的地方。不能把统计神秘化的同时也不能歪曲统计,把统计作为掩盖实事的陷阱。如今网络上就有许多统计数据误用和滥用的现象,这里我主要列举“样本不好”“样本过少”“局部描述”三种类型的统计数据滥用误用的案例。一、不好的样本2011年1月初,凤凰网与新生代市场监测机构联合主办的一项关于国人生活信条的大调查——“征集中国人的信仰”,原文链接:(原文链接不稳定)转载链接:凤凰网设计了调查问卷,发布在网上,在活动结束之后共收集了63707个有效样本,文中声称“覆盖了来自社会各界、各阶层的人士”。但是对于这个声称,我认为是存疑的。对于第一个问题“您有自己的信仰吗?”有76.9%的人回答“有”,然而对于第二个问题“您认为这是一个信仰缺失的时代吗?”有92.6%的人回答“是”。这看似矛盾的结果我认为是由于统计样本覆盖不全造成的,凤凰网将调查问卷挂在网上本身就屏蔽了平时不能上网的、知识水平较低的、家中经济条件不佳等人群。而凤凰网本身面对的对象也主要是受过一定程度教育的人。这些样本与普通中国民众是有一定距离的,抽样的人群中可能受过较好的教育,精神境界可能更高,因而多数人选择“有”信仰。但是对于第二个问题,他们依据是对于这个社会的总体印象去回答这个问题的,也就是对于许多受教育程度不如他们的人的印象来作答这个问题的,所以看似矛盾的问题我认为是受到统计方式的局限而造成的。二、过小的样本2012年两会期间,南方周末在官网的“民调中心”栏目中发布了一个调查,截止到3月8日,一共仅3821人投票,其统计的客观真实性很容易遭人质疑。原文链接:三、局部描述NBA深锐观察是新浪NBA的一个著名专栏,在这一期“深锐观察:无三分不冠军?湖人痼疾不除只能等死”这一期中,作者列举了“NBA历年季后赛三分球数据”,其中包括“总冠军出手次数”、“联盟平均出手次数”、“总冠军命中率”、“联盟平均命中率”四项。作者在文中声称三分球的命中率是最后的总冠军球队一个重要的指标,但是作者仅仅比较了表格的前几行与最后几行,仔细观察不难发现,2010、2006、1998、1997、1996等多个年份的数据都不能支持作者的结论,因而他运用了局部描述的方法,让不细看表格的读者相信作者的观点是有数据支撑的。原文链接:四、图表滥用美国《新闻周刊》通过裁减掉一部分的纵坐标和拉长横坐标的方法夸大了美国道琼斯股票指数的涨幅,其原文标题是“非凡的牛市!”。文章想说明美国股市在经历一场非同寻常的上升过程,但事实上是编辑人员对图表的处理给了读者们错误的印象。本图表引自《统计数据的真相》(德)瓦尔特·克莱默,机械工业出版社第七版。五、百分数的陷阱美国多克斯牙膏公司做过一个用户调查,调查结果显示使用多克斯(Doakes)牌牙膏将使蛀牙减少23%!大字标题历历在目。这些结论出自一家信誉良好的“独立”实验室,并且还经过了注册会计师的证明。似乎是值得信任的。但是事实上读者只有在读小字的内容时才会发现,实验的样本仅由12人组成。这全然不能说明多克斯牙膏的神奇功效。本案例引自《统计数据会撒谎:统计陷阱》,达莱尔·哈夫,廖颖林译,上海财经大学出版社。六、图标对数据的扭曲图标可以起到扭曲本来数据的目的:同样都是1:2的边长,但是第一幅图用高度,第二幅图用平面面积,第三幅图用体积,读者对其的印象就会变成第一幅图1:2,第二幅图1:4,第三幅图1:8。德国政府发布的信息就曾经这样欺骗过读者:摘自德国联邦政府《信息手册》本来德国西部的住房面积应该只比东部面积多41%,但是在这幅图中,西部的住房的边长比东部打了41%,但是西部的面积算起来就比东部的大了100%。因此德国通过故意夸大西部住房的面积蒙蔽了读者。本案例摘自本图表引自《统计数据的真相》(德)瓦尔特·克莱默,机械工业出版社第七版。七、国民生产总值的计算国民生产总值的定义:国民生产总值(GNP)是最重要的宏观经济指标,它是指一个国家地区的国民经济在一定时期(一般1年)内以货币表现的全部最终产品(含货物和服务)价值的总和。乍一看上去好像GDP能够反映出一个国家的全部经济活动总产值,但事实上有很多种情况都是GDP这样的数据不能反映出来的。比如地下经济。“地下经济”一般是指逃避政府的管制、税收和监察,未向政府申报和纳税,其产值和收入未纳入国民生产总值的所有经济活动。据国际货币基金组织估计,1998年全球地下经济规模约9万亿美元,占全球产出的23%。维克尔曾经发明了维克尔曲线,在拉弗曲线对于税率的描述基础上,描绘了税率对于地下经济的影响。据估计美国的地下经济约占其GDP的20%左右。本案例引自《宏观经济学》(美)曼昆,张帆译。中国人民大学出版社第六版。