Excel数据分析与图表可视化数据分析中心Excel数据处理分析•数据预处理•公式与函数•透视表与分析功能Excel图表可视化展现•图表类型选型原则•图表可视化介绍•自定义图表定制主题•需要分析什么问题•希望得到什么结果•结果用在什么地方学会排列组合。这个排列组合不是真的排列组合,日常我们在进行数据处理时,基本上80%以上的工作只需要20%左右的函数和方法就可以解决,比如vlookup,sumif,countif,if,条件筛选,排序等等,这也是符合幂律分布的。尽管面临不同的问题和需求,但是通过公式的嵌套,组合,最后基本上都能解决数据处理的分析需求,进一步就是如何优化,提高分析的效率Excel数据分析思路解决问题获取答案提出问题Excel数据预处理主题数据预处理-基本操作单元格—选择•通过名称框→地址或名称选定•利用名称框下拉列表利用定位功能按条件选定•开始→查找与选择→转到(定位条件)单元格—输入数据①手动输入数据选中→键入•单元格方向键(↓↑→←)Enter(↓)/Tab(→)[Shift+Enter/Tab反向]→快速移动光标选中单元格•连续单元格区域Enter/Tab/Shift+Enter/Shift+Tab→在区域内快速移动选中×鼠标/方向键→取消对区域的选择•多个单元格/区域同时输入相同数据选中目标单元格/区域→在活动单元格中键入数据→Ctrl+Enter数据预处理-基本操作Excel图表可视化展现•图表类型选型原则•图表可视化介绍•自定义图表定制单元格—输入数据•自动输入数据数据预处理-基本操作•单元格—设置格式(基于条件更改单元格区域的外观)数据预处理-条件格式选择性粘贴•数据合并转换•数据行列转置•表格同步更新•区域格式复制数据预处理-选择性粘贴Excel数据分析–排序与筛选数据排序与筛选自定义排序排序条件高级筛选通配符的使用请使用若要查找?(问号)任何单个字符*(星号)任何字符数~(波形符)后跟?、*或~问号、星号或波形符数据处理—分类汇总–对数据按类别进行汇总→统计分析–分类汇总之前一定要先进行排序–各列须有列标题(字段名)–分类汇总类型–单字段–多字段–嵌套汇总数据预处理-分类汇总Excel公式与函数主题•公式—组成–以等号(=)开始–引用(单元格引用/区域引用/名称引用)–运算符–函数–常量(数字或文本)公式:=表达式=(A3-average)/SUM(A1:A20)+12数据预处理-公式与函数•公式—使用引用通过指定单元格或区域的地址/名称来使用其中的数据•建立数据之间的联系•赋予工作表动态特性(随被引单元格的值变化)•单元格引用•单元格区域引用•名称引用数据预处理-公式与函数•公式—单元格引用–相对引用当公式到其他单元格时,行和列引用相应改变(引、被引单元格相对位置不变)—A1–绝对引用当公式到其他单元格时,行和列引用不会改变(行标和列标之前加上$)—$A$1–混合引用行、列引用中一个是相对引用,另一个是绝对引用—&A1、A&1数据预处理-公式与函数•3.2公式—计算运算符类别运算符含义示例优先级:区域运算,生成对两个引用之间所有单元格的引用C1:E61[空格]交叉运算,生成对两个引用中共有单元格的引用A1:C5B2:E92,联合运算,合并多个引用为一个引用A1:C5,B2:E93–负号-104%百分比60%5^乘方5^36*/乘、除5*9/37+–加、减7+2–38&连接两/多个文本值合并为一个文本值“3”&“m”→“3m”9===比较两个值的大小,结果为逻辑值106→FALSE10数据预处理-公式与函数•IF函数•IF函数也称条件函数,它根据参数条件的真假,返回不同的结果。在实践中,经常使用函数IF对数值和公式进行条件检测。公式为•=IF(logical_test,value_if_true,value_if_false)数据预处理-公式与函数•COUNT函数和COUNTIF函数•COUNT函数的功能是计算给定区域内数值型参数的数目。公式为–=COUNT(参数1,参数2,…,参数N)•COUNTIF函数的功能是计算给定区域内满足条件的单元格的数目。公式为–=COUNTIF(range,criteria)•range需要计算其中满足条件的单元格数目的单元格区域;–criteria—确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式或文本。•COUNT函数和COUNTIF函数在数据汇总统计分析中是非常有用的函数。数据预处理-公式与函数•Lookup相关函数功能在表格的首列查找指定的数据,并返回指定的数据所在行中的指定列处的数据。•语法标准格式:VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)•解释:•VLOOKUP(‘你要检索的内容或指定单元格’,‘你要检索的范围,检索到内容时返回你检索表的第几列中的内容’,‘真或假参数真代表查询的表已经排序,假代表没有排序)–例:VLOOKUP(A2,Sheet2!$A1:$B10,2,FALSE)–说明:在表SHEET2中检索当前表中A2中的内容,如果检索到,就返回表SHEET2中B2中的内容,因为B2是表SHEET2中的第二列,所以VLOOKUP的第三个参数,使用2,表示如果满足条件,就返回查询表的第二列,最后的参数FALSE表示‘假’,意思是被查询的表,没有排序,这种情况下,会从被查询的表中第一行开始,一直查询到结束。•3.5公式错误值类型错误值类型说明######单元格列宽不足以显示内容,或日期或时间为负值#DIV/0!0作为除数,或引用空白单元格作为除数#N/A无信息/数值可引用#NAME?引用无法识别的文本/不存在的名称#NULL!指定两个并不相交区域的交点#NUM!引用无效的数值(超限,应介于-1*10307~1*10307之间)#REF!引用无效的单元格(被引单元格被删除或覆盖)#VALUE!引用不正确的数据类型数据处理-透视表•数据透视表是交互式报表,可快速合并和比较大量数据。旋转其行和列以看到源数据的不同汇总,而且可显示感兴趣区域的明细数据。分析相关的汇总值,尤其是在要合计较大的列表并对每个数字进行多种比较时,可以使用数据透视表•切片与筛选•值汇总方式•日期,数值分组Excel图表定制主题图表可视化-类型选择•图表尽量简洁明了,突出主题。•充分考虑读者的习惯,选则更容易被接受和理解的图表类型,避免过多的解释。•常用图表的一般用途:柱形图、条形图:数量对比;折线图、面积图、柱形图:反映趋势;饼图、堆积百分比柱形/条形图:反映结构;散点图、气泡图:反映数据间的联系。•不恰当的图表类型可能会传达错误信息。案例:用折线图描绘一组没有时序关系的数据•尽量不要用三维图形貌似美观,但没有传递更多的信息,反倒分散了关注点。维图无法做组合图。•组合图可以在一张图中有效反映关联数据,但不可滥用。一张图中不宜反映太多信息,否则无法聚焦,容易使人迷惑。不同系列之间的关联关系如果不可靠,图形反映的将是错误信息。图表可视化-类型选择图表可视化-配色原则•Excel图表的默认配色采用的主题颜色,可以选择其他主题或自定义主题。•无论采用什么配色方案,都应保持一致性的延续性——风格化。•颜色也可以传递信息。要注意配色惯例,如红、橙、黄通常具有警告含义,可用于异常数据的突出显示,蓝色通常代表进展,绿色通常代表成长。•避免不协调的色彩搭配:–红绿搭配通常会引起不舒服的感觉;–低反差的配色不易分辨;–各系列均采用浓重的颜色不但无法突出重点,而且容易产生头重脚轻的感觉。•稳妥的配色方案:–没有时序关系的系列采用不同色系搭配;–具有时序关系的系列采用同色系不同明度的方式搭配;–尽量不使用太浅的颜色。图表可视化-配色原则1.遵循你公司的Logo的颜色-为品牌做可视化图象。2.让你的内容来决定所用的色彩-为市场内容的可视化图象。3.使用季节或者节日属性的色彩-为季度性市场可视化图象。•图表—组成①图表区②绘图区③数据系列(某一行/列)④横坐标轴(分类轴)⑤纵坐标轴(数值轴)⑥网格线⑦图例⑧标题(图表标题、坐标轴标题)⑨数据标签图表可视化图表可视化-组合图表•在二维图表中,每一个系列可单独更改为不同的图表类型,由此成为组合图表。•图表中包含多个系列,其中一个系列与其它系列的计量单位不同时,应将其放在次坐标轴上,并更改为不同的图表类型,形成组合图表。–技巧:当要修改的系列与其它系列的值差别特别大,使得图形紧贴坐标轴时(如百分比),该如何选中这个系列?0100020003000400050006000050010001500200025003000350040004500图表标题购票人数订单量订票量图表可视化-折线图分离单位•利用坐标轴的最大值和最小值,将折线图推到上面,避免覆盖,使整个图形更加清晰。图表可视化-突出重点数据•在基础数据基础上增加业务标识列•在图表中添加数据系列•设置系列的图表类型为柱状图•调整图表的具体展现格式(间距,填充颜色等)00.10.20.30.40.50.60.70.80.91051015202530交易会员按城市A市-求和项:交易会员B市-求和项:交易会员图表可视化-对称条形图•成对条形图(或旋风图)常用于对比两类事物在不同特征项目的数据情况,例如美国总统选举中不同地区投支持票和反对票的比例情况在图表中添加数据系列•图表的特点是两组条形图的数据条沿中间的纵轴分别朝左右两个方向伸展,通过把两个数据系列分别置于主坐标轴和次坐标轴,然后对其中一个坐标轴逆序显示并且对称地设置主次坐标轴的最大值和最小值即可实现图表效果。24432775277064131-25-15-551525-80-3020703G触屏版3G普通版AndroidiOSPC版畅途网--支付宝A市B市010203040506070803G触屏版3G普通版AndroidiOSPC版畅途网--支付宝B市A市图表可视化-复合饼图与双层饼图•复合饼图和双层饼图可以提高小百分比的可读性或者强调一组数值,对多组数据或多个系列的数据能更好的显示对比的效果。•双层饼图经常用于表示两个数据系列的比例结构,由大小不同的两个饼图叠加在一起组成,一个普通的饼和一个分离的饼,分别位于主坐标轴和次坐标轴,叠加后再调整各自的大小,以区分显示的一种饼图。这是与复合饼图的最大区别。14%2%19%4%45%16%61%A市3G触屏版3G普通版AndroidiOSPC版畅途网--支付宝深圳28%珠海31%广州41%G122%G211%G38%生产基地生产线图表可视化-象限图•象限图是利用两个关键性能指标分别在横坐标和纵坐标交叉划分出四个区域,用于分析和发现两个指标的匹配优劣程度。•魔力象限(GartnerMagicQuadrant)是设计来监控、评估公司在专业、技术市场的发展与位置的研究方法。不管是对寻找适合自身需求公司的投资者还是对那些对比市场竞争者并可能占上风的企业来说,魔力象限创建的报告可能是高度实用的工具。[CELLRANGE][CELLRANGE][CELLRANGE][CELLRANGE][CELLRANGE][CELLRANGE][CELLRANGE]07.51501326套餐资费套餐套餐活跃用户注册用户资费套餐23214套餐35132套餐416410套餐5953套餐61167套餐11211117套餐1212125图表可视化-象限图•魔力象限(GartnerMagicQuadrant)–使用What-If假设分析•模拟变量表•方案管理器–使用反转的假设分析•单变量求解•规划求解–使用分析工具库•方差分析/相关系数/协方差/描述统计/指数平滑F-检验/傅里叶分析/直方图/移动平均/随机数发生器排位与百分比排位/回归分析/抽样分析/t-检验/z-检验Excel高级数据分析