大数据技术与应用计算机中心第4章大数据可视化导学一、学习目标1.掌握大数据可视化和数据可视化的概念;了解大数据可视化的过程。2.了解大数据可视化工具的特性,掌握Tableau工具的使用。二、重点、难点1.大数据可视化的概念。2.使用Tableau设计可视化产品。4.1大数据可视化简介众所周知,我们描述日常行为、行踪、喜欢做的事情等时,这些无法量化的数据量是大得惊人的。很多人说大数据是由数字组成的,而有些时候数字是很难看懂的。而数据可视化可以让我们与数据交互,其超越了传统意义上的数据分析。数据可视化给我们的生活带来了演讲,让人们对枯燥的数字产生了兴趣。4.1大数据可视化简介1.大数据可视化与数据可视化•数据可视化是关于数据的视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。•大数据可视化可以理解为数据量更加庞大,结构更加复杂的数据可视化。4.1大数据可视化简介1.大数据可视化与数据可视化图中面朝左边的动物数量正在不断减少,而面朝右边的动物状况则比较稳定,其中有些动物的数量还有所增加。非洲大型哺乳动物种群的稳定性和濒危状况4.1大数据可视化简介1.大数据可视化与数据可视化大数据可视化与数据可视化的比较:大数据可视化数据可视化数据类型结构化、半结构化、非结构化结构化表现形式多种形式主要是统计图表实现手段各种技术方法、工具各种技术方法、工具结果发现数据中蕴含的规律特征看到数据及其结构关系4.1大数据可视化简介2.大数据可视化的过程大数据可视化的过程主要有以下9个方面:(1)数据的可视化可视化的核心的是对原始数据采用什么样的可视化元素来表达。中国电信区域人群检测系统,其中利用柱状图显示年龄的分布情况,利用饼图显示性别的分布情况。4.1大数据可视化简介2.大数据可视化的过程(2)指标的可视化采用可视化元素的方式将指标可视化,会将可视化的效果增彩很多。图中显示的是将近100G的QQ群数据,其中企鹅图标的节点代表QQ,群图标的节点代表群。每条线代表一个关系,一个QQ可以加入N个群,一个群也可以有N个QQ加入。线的颜色分别代表:黄色为群主;绿色为群管理员;蓝色为群成员。群主和管理员的关系线也比普通的群成员长一些,这是为了突出群内的重要成员的关系。4.1大数据可视化简介2.大数据可视化的过程(3)数据关系的可视化数据关系往往也是可视化数据核心表达的主题宗旨。图中显示的是将Windows比喻成太阳系,WindowsXP、Window7等比喻成太阳系中的行星;其他系统比喻成其他星系。4.1大数据可视化简介2.大数据可视化的过程(4)背景数据的可视化光有原始数据是不够的,因为数据没有价值,信息才有价值。设计师马特·罗宾森和汤姆·维格勒沃斯用不同的圆珠笔和字体写“Sample”这个单词。因为不同字体使用墨水量不同,所以每支笔所剩的墨水也不同。在这幅图中不再需要标注坐标系,因为不同的笔及其墨水含量已经包含了这个信息。4.1大数据可视化简介2.大数据可视化的过程(5)转换成便于接受的形式优化包括按照人的接受模式、习惯和能力,甚至还需要考虑显示设备的能力,然后进行综合改进,这样才能更好地达到被接受的效果。例如做一个关于“销售计划”的可视化产品,原始数据是销售额列表,采用柱状图来表达;在图表中增加一条销售计划线来表示销售计划数据;最后在销售计划线上增加勾和叉的符号,来表示完成和未完成计划,如此看图表的人更容易接受。4.1大数据可视化简介2.大数据可视化的过程(6)聚焦聚焦就必须要讲讲大数据。因为是大数据,所以很多时候数据、信息、符号对于接受者而言是过载的,可能就分辨不出来了,这时我们就需要在原来的可视化结果基础上再进行优化。在上述的“销售计划”中,假设这个图表重点是针对没有完成计划的销售员的,那么我们可以强化“叉”是红色的。如果柱状图中的柱是黑色,勾也是黑色,那么红色的叉更为显眼。4.1大数据可视化简介2.大数据可视化的过程大数据可视化的过程主要有以下9个方面:(7)集中或者汇总展示对这个“销售计划”可视化产品来说,还有很大的完善空间,例如为了让管理者更好地掌握情况,我们可以增加一张没有完成计划的销售人员数据表,这样管理者在掌控全局的基础上,还可以很容易抓住所有焦点,进行逐一处理。4.1大数据可视化简介2.大数据可视化的过程大数据可视化的过程主要有以下9个方面:(8)收尾的处理修饰是为了让可视化的细节更为精准、甚至优美,比较典型的工作包括设置标题,表明数据来源,对过长的柱子进行缩略处理,进行表格线的颜色设置,各种字体、图素粗细、颜色设置等。4.1大数据可视化简介2.大数据可视化的过程大数据可视化的过程主要有以下9个方面:(9)完美的风格化所谓风格化就是标准化基础上的特色化,最典型的例如增加企业、个人的LOGO,让人们知道这个可视化产品属于哪个企业、哪个人。4.2大数据可视化工具Tableau现在已经出现了很多大数据可视化工具,从最简单的Excel到基于在线的数据可视化工具、三维工具、地图绘制工具以及复杂的编程工具等,正逐步改变着人们对大数据可视化的认识。4.2大数据可视化工具Tableau1.大数据可视化工具的特性(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,快速的收集分析数据并对数据信息进行实时更新。(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点。(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求。(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。4.2大数据可视化工具Tableau2.Tableau简介Tableau是一款功能非常强大的可视化数据分析软件,其定位在数据可视化的商务智能展现工具。可以用来实现交互地、可视化的分析和仪表盘分析应用。就和Tableau这个词汇的原意“画面”一样,它带给用户美好的视觉感官。4.2大数据可视化工具Tableau2.Tableau简介Tableau的特性主要包括以下6个方面:(1)自助式BI(商业智能),IT人员提供底层的架构,业务人员创建报表和仪表板。(2)友好的数据可视化界面,操作简单,用户通过简单的拖拽发现数据背后所隐藏的业务问题。(3)与各种数据源之间实现无缝连接。(4)内置地图引擎。(5)支持两种数据连接模式,Tableau的架构提供了两种方式访问大数据量:内存计算和数据库直连。(6)灵活的部署,适用于各种企业环境。4.2大数据可视化工具Tableau2.Tableau简介Tableau有桌面版和服务器版。•桌面版包括个人版开发和专业版开发,个人版开发只适用于连接文本类型的数据源;专业版开发可以连接所有数据源。•服务器版可以将桌面版开发的文件发布到服务器上,共享给企业中其它的用户访问;能够方便的嵌入到任何门户或者WEB页面中。3.Tableau入门操作(1)连接数据1)选择数据源在Tableau的工作界面的左侧显示可以连接的数据源。4.2大数据可视化工具Tableau3.Tableau入门操作(1)连接数据2)打开数据文件以Excel文件为例,选择Tableau自带的“超市.xls”文件4.2大数据可视化工具Tableau3.Tableau入门操作(1)连接数据3)设置连接超市.xls中有3个工作表,将工作表拖至联接区域就可以开始分析数据了。例如将“订单”工作表拖至联接区域,然后单击工作表选项卡开始分析数据。4.2大数据可视化工具Tableau3.Tableau入门操作(2)构建视图1)将维度拖至行、列功能区将窗格左侧中“维度”区域里的“地区”和“细分”拖至行功能区,“类别”拖至列功能区。4.2大数据可视化工具Tableau3.Tableau入门操作(2)构建视图2)将度量拖至“文本”将数据窗格左侧中“度量”区域里的“销售额”拖至窗格“标记”中的“文本”标记卡上。4.2大数据可视化工具Tableau3.Tableau入门操作(2)构建视图3)显示数据将“标记”卡中“总计(销售额)”拖至列功能区,数据就会以图形的方式显示出来。4.2大数据可视化工具Tableau3.Tableau入门操作(3)创建仪表板1)新建仪表板单击“新建仪表板”按钮,打开仪表板。然后在“仪表板”的“大小”列表中适当调整大小。4.2大数据可视化工具Tableau3.Tableau入门操作(3)创建仪表板2)添加视图将“销售地图”放在上方,“销售客户细分”和“销售产品细分”分别放在下方。4.2大数据可视化工具Tableau3.Tableau入门操作(4)创建故事单击【故事】|【新建故事】,打开故事视图。从“仪表板和工作表”区域中将视图或仪表板拖至中间区域。4.2大数据可视化工具Tableau在导航器中,单击故事点可以添加标题。单击“新空白点”添加空白故事点,继续拖入视图或仪表板。单击“复制”创建当前故事点的副本,然后可以修改该副本。3.Tableau入门操作(5)发布工作薄1)保存工作簿单击【文件】|【保存】或者【另存为】命令来完成,或者单击工具栏中的“保存”按钮。2)发布工作簿单击【服务器】|【发布工作簿】来实现。4.2大数据可视化工具Tableau本章小结大数据可视化可以说仍是一个崭新的领域,对于可视化研究的重点关键在于仔细研究数据,讲出大多数人从不知晓但却渴望听到的好的故事,从而了解它们背后蕴含的信息。通过本章的学习,可以对大数据可视化有一个基本的了解,为进一步学习大数据可视化打下理论基础。