选择恰当的图表类型用图表来表现数据、传递信息,很重要的一个环节是如何根据应用场景,选择合适、有效的图表类型。如果图表类型不合适,图表再漂亮也是无效的。本章将介绍数据统计图表的基本类型和选用原则,以及如何避免常见的图表类型选择误区。5.1一份图表的产生过程很多人经常问:“看看我这个数据怎么作图好看?”我们说这个说法的出发点和目的都是有问题的。因为不是仅有数据就可以决定图表选择,图表的目的也不仅仅是为了好看。平时我们做一个图表,由于熟练和习惯的原因,可能很快就完成了,并不会有太多的思考。但事实上,一个完整的从数据到图表的过程应该包括以下步骤。首先,我们要对数据进行分析,得出自己的结论,明确需要表达的信息和主题。然后根据这个信息的数据关系,决定选择何种图表类型,以及要对图表作何种特别处理。最后才是动手制作图表,并对图表进行美化、检查,直至确认完成。由此可见,决定使用何种图表类型的,并不仅仅是你的数据本身,更重要的是你所要表达的主题和观点。这其实就是我们常说的具体问题具体分析原则。所谓“横看成岭侧成峰,远近高低各不同”,同样的一份数据,因为不同的立场和价值判断,不同的人所发现的信息、得出的观点很可能不一样,那么所选用的图表类型也可能不一样。即使选用的图表类型一样,也可能因为要强调的地方不一样而采用不同的处理方式。这取决于几个因素:你从数据中分析提炼出的信息;这种信息所属的数据关系种类;你想通过图表表达的观点;你想要强调的重点。当然,数据本身对图表选择也会有影响,但这种影响是相当有限的。比如当数据存在差异悬殊、重叠覆盖等情况,可能会导致原本合适的图表类型变得凌乱、不易阅读等问题,这时可以考虑替代的图表类型或处理方式。5.2图表的基本类型及其选择(1)Excel2003中提供了11类共73种图表类型,Excel2007、Excel2010完全继承这些图表类型,未做任何增减。在我看来这里面至少75%以上都属于无效垃圾图表,不适宜在商务场合使用。譬如各种3D形式的图表类型就是首先需要排除的,所谓的自定义图表类型也是惨不忍睹,根本无需考虑。尽管我们见到的数据图表种类繁多,但其基本类型只有以下几种:曲线图用来反映随时间变化的趋势;柱形图用来反映分类项目之间的比较,也可以用来反映时间趋势;条形图用来反映分类项目之间的比较;饼图用来反映构成,即部分占总体的比例;散点图用来反映相关性或分布关系;地图用来反映区域之间的分类比较。我们所见到的林林总总、各式各样的图表,有的就是基本类型,有的是由这些基本类型变化或组合而来。譬如麦肯锡的瀑布图是由柱形图变化而来,质量管理中的柏拉图是由柱形图和曲线图组合而成,等等。商务工作中需要用图表反映数据的场景五花八门,但按数据关系/模式分类无非以下几种情况,每种数据关系都有其对应的合适的图表类型,如表5-1所示。表5-1数据关系及其适用的图表类型也存在以上数据关系的综合比较情况,那么对应的图表类型也将是基本类型的综合运用。如比较多个时间点上构成的比较,多个时间序列趋势的对比。国外专家AndrewAbela曾整理了一份图表类型选择指南图示,他将图表展示的关系分为4类:比较分布构成联系然后根据这个分类和数据的状况给出了对应的图表类型建议。确定你想展示数据的关系类型后,只要按图索骥,就可以找到相应的图表类型建议。这是一个很不错的总结,经作者同意,这里将其翻译为中文,供大家参考,见图5-1。不过,我认为图中雷达图应放在基于分类的比较而不是基于时间的比较。(点击查看大图)图5-1AndrewAbela整理的图表类型选择指南,列出了4类数据关系下适用的常见图表类型5.2图表的基本类型及其选择(2)在图表插件ChartTamer中,对图表类型的运用进行了更加严格的限制,仅保留了柱形图、条形图、曲线图等极少数最基本的图表类型,同时增加了3个特有的图表类型。ChartTamer将数据关系分为6种:值的比较时间序列构成或排序关系分布(单重)分布(多重)当你选择了某个特定的数据关系后,将只有特定的、合适的图表类型可被选择,其他的则被禁止选择,如图5-2所示。这样做的目的是为了确保引导用户选择到最合适的图表类型。这个做法是专家智慧的结晶,我们在选择图表类型时也可以参考。5.3图表类型选择辨析有些图表类型可以反映多种数据关系,有些数据关系也可以用多种图表类型反映,这时的图表选择应如何分辨其中细微的区别呢?以下问题比较常见。1.柱形图和条形图都可以表示分类项目的比较,如何在二者之间进行选择?我们看到某些商业杂志偏爱条形图,某些商业杂志又偏爱柱形图,你可以根据自己的喜好选择。当分类项目的标签文本比较长的时候,柱形图的标签会出现重叠、或者倾斜,需要阅读者歪着脖子看。这时使用条形图则可以很好地解决这个问题;由于汉字可以竖排,于是有人将柱形图的分类标签由斜排改为竖排来解决这个问题。这是一种可行的做法,但其占用的空间仍然太大,也会影响阅读者目光的移动方向;我们的眼睛似乎更容易比较水平条形的长度。2.柱形图和曲线图都可以表示时间序列的趋势,如何在二者之间进行选择?一般来说,我们建议使用曲线图反映趋势。二者细微的差异;柱形图更强调各数据点的值及其之间的差异,曲线图更强调起伏变化的趋势印象,而带数据点的曲线图则同时具备二者的特点;柱形图更适于表现离散型的时间序列,曲线图更适合于表现连续型的时间序列。当数据点较少时可以使用柱形图,数据点较多时建议使用曲线图;需要放大波动幅度而使用非零起点坐标时,建议使用曲线图。柱形图使用非零起点坐标存在夸大差异的嫌疑,曲线图则不会存在这种问题,因为曲线图强调的是起伏变化的趋势感,也就是曲线图的斜率。当然,不管使用何种类型,只要使用了非零起点坐标,都建议标上截断标记。3.面积图和曲线图都可以表示时间序列的趋势,如何在二者之间进行选择?当只有一个数据系列的时候,二者完全等价,都可以使用。一般来说曲线图应用得更多,但我们看到《商业周刊》比较偏爱面积图。当在大型会议室演示时,坐在后排的人很可能无法看清曲线图的线条,而面积图则更易让人看清楚;当比较多个数据系列的趋势时,建议使用曲线图。因为使用多系列面积图时,可能出现数据系列之间相互遮挡的情况,更大的问题是我们往往很难判断这种面积图是堆积的还是普通的。并且,堆积面积图除靠近X轴的那个系列较易看出趋势外,其他的系列因没有一个固定的底座而难以观察出变化趋势。4.关于饼图的争议:我应该避免使用饼图吗?很多专家会告诉你应避免使用饼图,建议使用条形图来替代饼图,因为条形图更易于比较数据点的差异。从精确比较的角度而言确实如此,很多情况下饼图也确实可以用条形图来代替。但每个图表都有它的长处,饼图会给我们一种整体和构成的印象,看到饼图我们就会想起100%,而这是条形图所没有的。所以你仍需要根据自己的目标选择合适的图表类型。5.连线的散点图与曲线图有何区别?带连线的散点图也可以用来替代制作一个表现趋势的曲线图。多在需要X轴不等距间隔效果时使用,如不同存款期限的利息水平。此时的散点图类似于时间刻度X轴的曲线图。时间刻度的曲线图其实仅支持按天的时间,对于按小时计的并不能反映。使用散点图则无此限制。下面我们以两个典型的应用场景为例讨论图表类型的选择。5.4实绩与预算比较的图表选择将实绩与预算进行比较,分析预算完成情况,这是实际工作中最常见的应用场景。它属于值的比较类型,包括横向的分类比较和纵向的趋势比较。1.横向比较比较各分公司某项预算的完成率,可以使用这种类似温度计式的柱形图或条形图。温度计让人清晰看出实绩与预算的差距。喜好豪华的朋友可以把图表做成水晶易表风格的温度计,更加形象逼真。若各分公司间的预算目标或预算进度并不一致,图表将是如下形式。到了下半年,实绩会逐渐超过预算,红色柱形将超出灰色柱形,这时需要将红色柱形调窄一点,以便能清晰分辨。这时候有些Bullet图表的风格了。不过,最好还是将目标系列的图形调整为不连续的小横线,二者的比较会更加清晰。需要注意的是,横向比较中不宜将目标系列(以及完成率系列)做成连续的折线图,因为它们的关系是分类对比而不是时间趋势。2.纵向比较在时间上的纵向比较,显然更强调变化趋势,可使用如下的曲线图或曲线图+面积图。为突出实绩与预算之间的偏差,可以添加涨跌柱线,突出显示预算的超产或欠产。但涨跌柱线易干扰曲线图而显得凌乱,我们可以将实绩与预算的偏差做成柱形图,放在图表底部,这样既有变化趋势又有正负偏差提示。5.5百分比数据比较的图表选择经营分析中经常要做不同时点、不同分类的百分比数据比较,如今年和去年的市场份额,不同公司的产品构成、收入构成等。如何有效地反映这种百分比数据的比较呢?1.两个或多个饼图很多人都知道表现份额和构成关系一般要用饼图,那么很自然的想到,反映两个时点的比例数据就用两个饼图了,于是做成图5-3的形式。这种做法非常普遍,但并不是很有效的图表形式。其缺点是我们不能直接、准确地看出各个分类项目的变化趋势及其幅度。阅读者需要在两个饼图之间反复进行比较,判断各项比例数据是增加了还是减少了,以及增减了多少。如果变化比较细微的话,很难准确看出变化之处,最后还是要看数字才知道。因此,一般并不建议这样作图。2.百分比堆积柱形图麦肯锡和罗兰·贝格都喜欢用图5-4中的堆积百分比图,相对于两个饼图而言要好很多。但只有放在最底下和最上面的数据系列,我们可以比较准确地看出其是增加还是减少,其他的则还是因为缺乏共同的基准而难于直观看出。有时候,数据的取值还会使分类标签不是那么好安排位置。相比前一种方法,这是一种可行的选择。3.BumpsCharts我们不妨考虑图5-5所示的图表,老外称之为BumpsChart,其实是个曲线图而已,只不过只有两个时间点。BumpsChart可以很清晰地反映两个时点的数据变化趋势,因为我们的眼睛能很轻松地分清上升和下降的曲线。并且,在图表的左右两边,数据点从上到下正好是从大到小排序的,相互之间的差距也很容易看出,从左到右也反映了名次的变化。一般来说,这种图要做得窄、高一些,以使曲线的斜率更大,读者更易看出其中的变化趋势。当分类较多时,可将部分线条使用淡色弱化以使其他部分线条得到强调。5.6图表类型选择的误区(1)一般来说,只要我们了解数据关系与基本图表类型之间的对应关系,正确选择图表类型,做出的图表应该可以符合规范。但在实际工作中往往有另一种误区,有些人不是不会作图,而是太会作图了。他们喜欢运用所谓的技巧、自我欣赏式的创新,做出让人无法看懂的复杂图表,这就与图表的目的背道而驰,是需要了解和避免的。频繁改变图表类型比较常见的是在一份市场调查报告中,对消费者选择结果的图表表现,时而柱形图、时而条形图,时而平面的、时而3D的,时而棱台的、时而圆锥的,生怕遗漏了自己所知道的图表类型。看到这样的报告,你不知道他是在做数据分析,还是在炫耀软件技巧。解决办法很简单,抑制自己的创作欲望,坚持一致性,在同样的应用场景使用同样的图表类型,譬如上面说的调查结果反映,一个排序的条形图类型就已经足够。过于复杂的图表图表应该是不需要解释的,或者说是自我解释的。所谓“一图抵千言”,是说一个好的图表可以省去1000句话,而不是需要1000句话来解释。但经常有人把图表做得异常复杂,你可能琢磨半天都看不懂他想说什么,如图5-6的图表。这种情况往往有两种原因:一是将过多的数据放到了一个图表里,数据量很大,却没有主题,或主题不突出。解决办法是将数据进行分析、提炼,通过简化数据来简化图表。二是不合适的创意,自己发明一些“高明、高级”的图表,自己看着感觉良好,别人看着一头雾水。虽然这是一个需要创意的时代,但在商业图表领域,还是审慎些为好。解决办法是抑制自己的创作欲望,遵从商业图表的一般规范。误导和欺骗的图表图表的目的在于更清晰地表现和传递数据中的信息,但在图表制作中经常会存在有意或无意误导读者的情况。尤其当制图者想隐瞒或者夸大事实的时候,如粉饰糟糕的业绩,放大微乎其微的增长等。我们需要了解和识别这些作弊手法,以免被误导。当然,我们自己最好也避免去运用这些手法。1.夸张的图表压缩比例图5-7中,曲