JMP培训笔记(汇总)培训主要内容DOE试验设计的总体介绍DOE与传统分析方法的区别DOE的核心技术展开DOE中的专用术语与分析思路DOE试验设计的应用统计基础描述性统计及图形假设检验回归模型的建立与检验描述型DOE试验设计DOE的三大基本原则完全析因设计2k因子设计筛选型DOE试验设计部分析因设计分辨率表的解读关键因子的选择优化型DOE试验设计响应面的基本概念意愿函数的构建多项式模型的图形展示模型的仿真与预测高级DOE试验设计扩充设计定制设计空间填充设计可靠性分析概述1JMP简介JMP软件是全球最大的统计软件供应商SAS集团旗下的桌面统计分析软件,JMP能够为用户提供特殊的图形界面来显示和分析数据。其应用领域包括业务可视化、六西格玛及持续改善(可视化六西格玛、质量管理、流程优化)、试验设计DOE、研发创新、探索和发现、教学及科研等各个方面。JMP是一种交互式统计图形软件,统计量被编排为具有相应图形和表格的逻辑领域,以帮助用户寻找数据的形态规律、标识离群点或模型拟合。根据变量的类型及其扮演的角色,系统能够为用户定义和执行相应的分析。它包括:•用于查看、编辑、输入和处理数据的电子表格•用于数据分析的各种图形和统计方法•大量的试验设计•选择和显示数据子集的选项•用于排列和合并数据表的数据管理工具•用于计算每个表列值的计算器•用于对数据分组以及计算汇总统计量的工具•用于质量提高技术的特殊图形、图表和通信功能•用于打印以及在应用程序间移动分析结果的工具•用于保存常用例程的脚本语言2DOE(DesignOfExperiment)简介DOE是JMP软件的一大模块,它是研究和处理多因子与响应变量关系的一种科学方法。它通过合理地挑选实验条件,安排实验,并通过对实验数据的分析,找出总体最优的改进方案。从上个世纪20年代费雪(RonaldFisher)在农业试验中首次提出DOE的概念,到六西格玛管理在世界范围内的蓬勃发展,DOE已经历了80多年的发展历程,在学术界和企业界均获得了崇高的声誉。JMP主菜单下的DOE模块(实验设计)内容完备,除了部分因子、完全因子、响应面设计、扩充设计,混料设计和田口设计等传统DOE外,还包括空间填充,非线性和定制设计等高级DOE。其次,JMP的DOE功能最为强大,除了整合传统的统计建模,图形展示等分析方法外,还融入了模拟,I最佳与D最佳比较,简单数据挖掘等独特方法强化分析效果。再次,JMP的DOE实现最为方便,因子的数量,水平的数量,试验的次数等等都可以自定义,用户能够根据实际问题的要求构建试验,而无需任何修饰。更进一步,JMP的试验设计中还整合了模拟器(Simulator)功能,用户可以直接对试验所得的新方案进行仿真模拟,以最大限度地减少失败风险。2.1开展DOE的益处1、量化变量的作用,确定显著变量,了解变量之间的相互联系;2、减少试验次数,缩短研发时间,降低成本;3、可按项目要求扩大或缩小试验规模;4、优化关键技术参数的设置;5、构建数学模型,预测产品或过程的性能;6、通过客观事实,证实或推翻某个理论假设。DOE的“敌人”有:直觉、老板或专家的圣经、过程监控、试错法、单因子变化法、数据挖掘等。也即在后者能解决问题时,实验设计就没必要进行了。(1)直觉(intuition):凭经验判定(2)老板或专家的圣经:了解规律的专业认识(3)过程监控:一种守株待兔的方式,偶然发现规律(4)试错法:在方案数不大的情况下使用的被动改进方式(5)单因子变换法:无法包含平面空间中的空点,不能反映交互作用(6)数据挖掘:以历史数据为基础2.2DOE的基本思路确定实际问题了解现实状况选择因变量Y选择自变量X选择因子水平制定实验方案实施实验并收集数据分析数据结论与后续管理。制作试验计划注意留有余地,不要把预算在实验初期用完。2.3DOE术语因变量Y:尽量使用连续数据作输出变量,——连续数据提供更多的信息——计数型需要大量样本——能够稳定、精确测量输出变量自变量X:因子,通常可以通过以下工具识别输入因子:鱼骨图、因果矩阵、潜在失效模式(FMEA)及效果分析;因子水平可以是定量的,也可以是定性的ResponseFactorLevelCodingTreatmentRunMaineffectInteractionRandomerror响应因子水平水平代号一种排列组合做一次试验主效应交互作用不稳定性离散型变量:包括记名(如:男、女)、保序(如:产品等级)文件类型说明:.JMP(数据表文件)、.JRN(日志文件)、.JRP(报表文件)、.JSL(脚本文件)创建数据:要产生新的列,双击相应的列;输入数据:在列名上点击右键,拖动列可变次序数据输入输出:excel另存为.txt文件,UNICODE;JMP打开.txt文件2.4DOE核心技术1、安排实验方案:这是DOE的重点与难点。好的实验设计方法,即可减少试验次数,缩短实验时间,又能迅速得到有效的结果;不好的实验设计方法,即使做了大量的实验也未必能达到预期的目的。安排实验的方法有:均分设计(均分法、对分法、0.618法)、因子设计、正交设计、响应面设计、空间填充设计等。狭义试验设计:筛选设计(部分析因设计)、描述设计(完全因子设计)、优化设计(响应面设计)2、分析数据:方法主要有:直接比较、极差分析、方差分析、回归分析、信噪比分析等。3软件界面打开JMP软件,会出现今日提示和JMP起始页两个页面,其中,今日提示页面中包含了35条JMP最基本的操作,通过它可以了解JMP中最基本的操作技巧。而通过起始页界面则可以新建或打开各种类型的JMP文件,其中的首选项一栏中可以对JMP的一些常用设置进行更改。表、行与列菜单主要用于对数据表中的数据进行简单的处理,包括添加行列以及对数据进行标记汇总等。实验设计菜单中包含了各种实验设计类型,可以根据需要选择合适的实验设计类型,包括筛选试验、完全析因实验、响应面实验设计等类型。分析和图形菜单中包括了各种分析数据的方式,包括生成散点图,拟合曲线等方式。通过帮助菜单可以查看各种JMP自带的手册。4应用统计基础4.1数据分布的特征数据分布的统计学指标可以分为三类:1、描述数据集中趋势的指标有:均值、中位数、众数、第一四分位数和第三四分位数;2、描述数据离散程度的指标有:方差S2、标准差S=2()1ixxn、极差maxminxx、四分位间距(=3414xx)和变异系数(相对波动问题vSCx);3、描述数据分布性状的指标有:偏态和峰度。描述图:箱线图、直方图4.2假设检验4.2.1基本思想通过一个例子来说明:某车间生产的滚球直径服从正态分布N(15.1.,0.05)。现从某天生产的滚球中抽取6个,测得直径(单位:mm)为:14.6,15.1,14.9,14.8,15.2,15.1计算得x=14.95,假定方差不变,试问这天生产的滚球是否符合要求?及是否可以认为这天生产的滚球的平均直径为15.1mm?假设方差不变,所讨论的问题是:015.1是否成立?我们可以先假定“0”,并称其为原假设或备择假设,记为00:H。此假设可能成立也可能不成立。当原假设不成立时,称的取值为备择假设,本例取“”为备择假设,记为1:H。所谓假设检验问题,就是要由样本提供的信息检验原假设0H是否成立,简单地说,就是要在0H和1H中做出拒绝哪一个接受哪一个的判断。接下来讨论如何检验原假设是否成立。由于X是的无偏估计,如果0H成立,即0,则X的观察值x与0通常应很接近,即0x一般应较小,若0x过分大,则可以怀疑0H的正确性而拒绝0H。又因为0H成立时,00,1XUNn当0x较小时,0xn也是一个较小的数,因此,可以适当选定一个正数,使得当0xn时,表示x与0的偏差过大,从而拒绝0H,这是判断0H是否成立的一个法则。称0XUn为检验统计量,u为拒绝域的形式,确定假设检验的法则的过程,就是确定一个适当的正数,从而得到拒绝域1uuC的过程,又称0uuC为0H的接受域。通过上述法则进行判断的依据是样本,但样本具有随机性,这就有可能导致如下两类错误的发生:第一类错误:原假设事实上为真,但由于检验统计量的观察值0xun落入拒绝域,即u,从而导致拒绝0H的错误,这种错误成为第一类错误(弃真)。既然无法排除犯这类错误的可能性,我们在建立法则时,可以使犯第一类错误的概率尽可能小,将其控制在一定的范围之内,即给定很小的正数,要求00/PHH拒绝为真为了确定值,我们允许犯这类错误的概率等于,即00/PHH拒绝为真由于0H为真时,00,1XUNn,则有00000012///XXPPPuHHHHnn拒绝为真为真为真所以12u。这样我们就得到拒绝域112uuCu由此得到检验法则如下:若观察值0xun满足121uu拒绝0H;122uu接受0H,其中为显著性水平,是根据情况事先指定的一个较小的数,一般取0.05,0.01,0.001,。据此对上例进行检验:015.1,6,14.95,0.05nx,查标准正态分布表得:015.1,6,n14.95,0.05x,经过计算得检验统计量的观察值u满足0121.64321.96xuun从而接受0H,认为当天生产的滚球的平均直径为15.1mm。从上述例子的分析和讨论中,可以看出假设检验的过程中包含有以下两个重要思想:(1)反证法思想。为了检验原假设0H是否正确,我们首先假设0H为真,看由此能推出什么结果,如果导致一个不合理的现象出现,则表明“假设0H为真”是错误的,从而拒绝0H;如果没有导致不合理的现象出现,则不能认为“0H为真”是错误的,只好接受0H,或根据问题的需要作进一步的试验后再进行判断、考察。(2)小概率原理。上面提到的不合理现象并不是形式逻辑中的绝对不合理,而是发生的可能性很小的现象,该现象是由人们在长期实践中得到的小概率原理来判断的。小概率原理认为:小概率事件在一次实验中几乎是不会发生的,如果小概率事件发生了,我们认为出现了不合理现象。在上例的检验过程中所采用的统计推断法则是符合统计推断原理的。因为通常都取得很小,若0H为真,事件12uu是一个小概率事件。如果一次实验得到的观察值u满足12uu,即小概率事件发生了,故我们有理由怀疑原假设0H的正确性,因而拒绝0H。但如果出现了12uu,则拒绝0H就有点“信心不足”,只好接受0H。所以,当作出接受0H的判断时,所依据的既不是逻辑推理,也不是统计推断原理,而只是没有充分的理由拒绝0H,才不得不做出接受0H的抉择。第二类错误:原假设0H事实上不正确,但检验统计量的观察值0xun,从而导致接受0H的错误称为第二类错误(纳伪)。记犯第二类错误的概率为,即00/PHH接受不真我们当然希望犯两类错误的概率与都尽量地小,但当样本容量n给定后,与中的一个减小时,另一个必然随着增大,要使它们同时都很小,只有增加样本容量,这在实际中又是不现实的。对于一个实际问题,选择哪一个为原假设,哪一个为备择假设是非常重要的,由于原假设是作为检验的前提提出来的,因而通常受到保护,要拒绝原假设必须有充分的理由,而备择假设是当原假设被拒绝后才能被接受,这就决定了原假设和备择假设不是处于对等的地位。一般检验的做法是:选择一个检验,使得当0H为真时,拒绝0H犯错误的概率小于,这就体现了保护原假设的思想,使得原假设不至于轻易被否定。在实际应用中一般将久已存在的状况作为原假设,或者将后果严重的错误作为第一类错误。4.2.2一般步骤(1)根据实际问题提出原假设0H和备择假设1H;(2)选择一个适当的检验统计量,并根据