数据分析基础知识六西格玛工具培训导语六西格玛团队在进行了项目定义和测量阶段后进入到分析阶段,查找问题的原因。有时,原因是显而易见的,此时团队能很快通过分析找到,但大多时候,影响问题的原因很多而且非常复杂,这时就需要我们理清思路并使用一些工具去判断。分析阶段是DMAIC各阶段中最难以预测的阶段常用的数据分析方法之一是“探索性数据分析”目录1234探索性数据分析定义探索性数据分析过程总结数据分析概述数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。一、数据分析概述zzzzzzzzz数据分析描述性统计分析侧重于在数据之中发现新的特征探索性数据分析侧重于已有假设的证实或证伪验证性数据分析侧重于对所有变量的有关数据做统计,如均值、众数、中位数等。1·探索性数据分析(ExploratoryDataAnalysis,简称EDA),是指对已有的杂乱无章的数据通过作图、制表、方程拟合等手段探索数据的结构和规律的一种数据分析方法,是调查问题原因的有力工具。·探索性数据分析在上世纪六十年代被提出,其方法由美国著名统计学家约翰.图基(JohnTukey)命名。二、探索性数据分析定义1、数据分析的第一阶段:数据初步处理三、探索性数据分析过程表1批次A烘丝机出口水分(%)表2批次B烘丝机出口水分(%)CPK:0.43CPK:0.43例1:直方图均值正常,波动较大均值整体偏小,波动正常来料水分是否整体偏小调节阀开启是否到位排潮风门开度设置。。。。。。来料流量、水分波动蒸汽压力不稳冷凝水排放不畅造成料头水分冲高。。。。。。三、探索性数据分析过程批次A烘丝机出口水分直方图批次B烘丝机出口水分直方图三、探索性数据分析过程例2:排列图制梗丝线优质品率统计表1、数据分析的第一阶段:数据初步处理71.9%81.4%87.5%90.6%93.8%96.9%100%各指标非优质品统计表三、探索性数据分析过程1、数据分析的第一阶段:数据初步处理·直方图:反映数据分布形态·茎叶图:直方图变种,适用于较小数据集,保留更多原始信息·排列图:关注有最大影响的问题组成部分·趋势图:以时间为横轴表明某指标变化状况的工具,观察随时间发展指标数值是否呈现一定的模式。·多变异图:也称变异源分析,直观的提供与过程有关的多个因素如何对过程输出响应变量产生影响的图形·正态概率图:检验数据是否服从正态分布初步数据分析的方法和工具一个团队可以使用许多不同的方法和工具来初步分析数据:通过初步数据处理,找到分析问题方向,以便合理地决定究竟应该把时间花在哪里,否则,你很有可能浪费三个月时间解决一个不常出现或对顾客没什么影响的问题。1、数据分析的第一阶段:数据初步处理三、探索性数据分析过程2、数据分析的第二阶段:提出关于原因的假设透过问题的表现进行深入研究,找出问题的真正潜在原因,常用的工具是因果图。注意:1.工具仅能帮助团队进行系统的思考并发现导致问题的潜在原因,仍需收集数据才能证实究竟什么才是问题的真正原因。2.工具的有效性直接与你思考的创造性和深度有关,这就是为什么需要许多人同时进行头脑风暴。三、探索性数据分析过程例:因果图3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3.1散点图3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3.1散点图3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3.1散点图3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3.1散点图3、数据分析的第三阶段:证实或排除原因三、探索性数据分析过程3.2试验验证在某些情况下,想要收集到现存数据已证实导致失误的的准确原因是很困难甚至是不切实际的,此时,一个可行的方法是做一些小的试验,判断这个原因是否为过程出现缺陷的真正原因。要注意以下几点:·明确改变的内容和方法·清楚改变的目的·先在小范围内进行试点·仔细考虑潜在的副作用并制定应对措施注意·直方图·茎叶图·排列图·趋势图·多变异图·正态概率图四、总结描述性统计分析探索性数据分析验证性数据分析对已有的杂乱无章的数据通过作图、制表、方程拟合等手段探索数据的规律的方法1234探索性数据分析定义探索性数据分析过程总结数据分析概述数据初步处理提出关于原因的假设证实或排除原因·因果图·头脑风暴法·因果逻辑·统计假设检验(散点图、相关分析、回归分析等)·试验验证