2012/7/301实验设计DOE目录数据属性与统计学基础假设检验介绍Minitab应用介绍方差分析介绍DOE方法全因子实验部分因子实验其它实验设计方法介绍筛选实验田口方法响应表面设计22012/7/302数据属性与统计学基础4数据的类型•连续型数据•变量数据•计量数据连续型数据以参数的形式,比如尺寸、重量或时间等来说明一个产品或过程的特性。测量刻度可以合理的不断被细分使精确度得以提高。连续型数据可以根据精确度的要求进一步被细分2012/7/3035数据的类型•离散型数据•属性数据•计数数据(包括比例)离散型数据是以发生的频数(Frequency)来表示某件事发生或未发生的次数。离散型数据也可以是分类数据,如地区、班次、物料种类、生产线等。离散型数据不能再被细分6总体和样本参数的获取途径有两种:通过调查总体获得和通过抽查样品获得。总体(N)具有某种特征的全体对象或个体的集合。包括对所有可能的对象或个体的具体参数或特征的测量。总体可能指刚刚出厂的所有铸件。样本(n)总体的一个子集。在统计学中,我们会遇到“随机抽样”,或一组特选的样本数据,每一次样本被选中的几率都相同。如果我们要从工厂中随机抽取10件铸件,那么我们需要确保这10件铸件是从工厂生产的所有同型号的铸件中随意选取的。2012/7/3047总体和样本我们通过分析样本来推测总体的参数总体所有的个体样本总体的子集样本是总体的子集通常我们没有总体的数据,因为要获得所有的数据很难或者代价很高8波动所有过程都存在波动,没有任何两件产品其质量特征是完全一样的。我们预期观察值会有差异,如果没有差异,我们就会产生怀疑。通常我们不会仅仅依靠一个数据就做出结论,而是收集多个数据并且非常注意如何收集这些样本,以减少偏差。波动的产生是很自然的,是意料之中的。波动是统计学的基础2012/7/3059A1A3A4A5A6A7A2变差的重要性10数据的分布数据分布是一个概率分布。它是过程波动的数学模型。下面的柱状图可以直观反映出实际观察到的事件的分布概率,称为频率分布。4647484950515253540510152025distributionsFrequencyHistogramofdistributions,withNormalCurve(process=QCNArro)分布曲线和直方图2012/7/30611描述数据分布的参数通常通过以下三方面来描述一个分布:形状反映分布曲线的形状。分布是就平均值对称的还是偏斜的,是呈尖峰状的还是平缓的?位置或者中心趋势反映了分布的中心或者分布数据的中点。离散程度反映了分布数据的变化范围。每个方面都有相应的参数指标来衡量12集中趋势的衡量模数(Mode)模数,又叫众数,是一组数中出现频率最高的数值。例如:今天出售的鞋尺码:36,42,40,41,43,39,40,41,40,37,38观察每种尺码出现的数值,可以发现模数是?。2012/7/30713集中趋势的衡量平均值或者均值(AverageorMean)一组数据的平均值仅仅是所有数据的几何平均这里X代表观察到的变量,xi代表一组数据中的第i个数据,S代表求和,代表所有数据的平均。nxXnii1X14集中趋势的衡量中位数(Median)中位数是一组数据中居中的那个数据。如果数据个数为奇数个,则中位数是数据的中间那个;如果是偶数个,中位数就是中间两个数据的平均值。例如:对于数据列15,17,18,19,22,25,26,中位数是“?”。对于数据列6,7,8,9,12,17,中位数是?2012/7/30815离散程度的衡量极差(Range)最简单的离散的测量。波动范围仅仅是测量的最大值和最小值的差2121()niixnxs212()NiiNx方差(Variance)和标准差(Standarddeviation)对于总体:方差等于偏差的平方和除以总体中个体总数N对于样本:方差等于偏差的平方和除以样本量减一(n-1)标准差是方差的开方MinMaxRange=方差和标准差表示数据离散的程度16离散程度的衡量四分位数对于从最小到最大排列的数据系列,四分位数可以帮助细分离散单元。25%的数据点包含在第一个四分位数前,75%的数据分布在第三个四分位数前。四分之三位四分之一位中值2012/7/30917正态分布的概率68.3%95.4%99.7%99.99999975%-6-5-4-3-2-1+1+2+3+4+5+6概率是人们从分布图中获得的一个重要的概念22122xexfx个数假设检验介绍2012/7/3010总体参数样本统计量x平均值标准差比例(百分比)spP1.总体参数是唯一的,但通常是不知道的,如全国所有人的平均身高。2.样本统计量被用来估计总体参数。假设检验是通过调查样本数据来推断总体参数总体参数vs样本统计量19假设检验的特性实际问题到统计问题的沟通。假设检验回答以下的实际问题:“在_____和_____之间是否有显著的差异?”为了回答这个问题,实际问题被转变成统计问题。在假设检验中,我们用相应的小样本来回答有关总体参数的问题。我们选择的样本总是有可能不能代表总体,因此,通过假设检验作出的结论是有可能错的。在某些假定的情况下,推断统计学使得我们可以评估做出错误结论的风险。统计并不能代替专业的判断。202012/7/3011总体假设检验的过程抽取随机样本均值x=2000我认为平均收入是5000元提出假设拒绝假设别无选择!作出决策21假设检验的基本思想...因此我们拒绝原假设u=5000...如果这是总体的真实均值样本均值u=5000抽样分布H0这个值不像我们应该得到的样本均值...2000222012/7/3012拒绝域aZaxu拒绝域H0:µ某个值23Ho=原假设(NullHypothesis)Ha=备择假设(AlternativeHypothesis)P值=概率值(ProbabilityValue)P值代表否定/推翻原假设时,犯错的概率或代表原假设成立时,抽到该样本的概率Pa通常a=0.05)时,推翻原假设,接受备择假设Pa通常a=0.05)时,不能推翻原假设(没有足够证据推翻原假设)主要术语242012/7/3013检验单个总体的均值如果原假设……那么备择假设…1.H0:µ=某个值(Minitab默认)H1:µ某个值2.H0:µ某个值H1:µ某个值3.H0:µ某个值H1:µ某个值原假设和备择假设是对立,互补关系.25假设试验的类型假设试验目的t检验成对t检验ANOVA(F检验)(方差的分析)χ2检验比较两组平均值,或一个数值和一组平均值当数据匹配时比较两组平均值比较两组或多组平均值比较两组或多组方差比较两组或多组比例等方差试验(F-检验,Bartlett’s检验,Levene’s检验)比较二组或更多组的方差262012/7/3014例子你的工厂有几台发电机。没有任何一台的功率表现得显著的好或显著的差。为了提高产出,设备主管决定投资10万元来改进设备。设备主管想知道投资了更多的资金、时间和资源来更新设备后,设备的产出是否得到显著的提高。为此,从两台发电机收集到样本数据(一台经过改进,另一台没有)。让我们从样本数据开始,发电机B是经过改进的。发电机A发电机B89.784.781.486.184.583.284.891.987.386.379.779.385.182.681.789.183.783.784.588.527Minitab介绍2012/7/301529何谓Minitab?高度集成的统计软件包;下拉菜单驱动的软件;拥有众多成功统计和分析工具(各种图形、用于数据分析的统计工具、报告等等)。当前软件版本:16.X.X网站:@minitab.com30Minitab:统计和分析的集成工具箱Minitab能够为我们做到:测量系统分析(MSA)统计描述过程能力分析图形工具-类型繁多样本量计算假设检验和置信区间分析方差分析(ANOVA)回归分析卡方分析(c2)DOE实验设计与分析统计过程控制2012/7/301631Minitab外观信息窗口(保存运行命令和输出的记录)数据窗口(类似于Excel电子数据表)下拉菜单栏图标栏多个窗口,高亮显示表示该窗口为当前活动窗口,任一时刻只有一个窗口处于活动状态32“文件”菜单项目部分:该部分菜单提供了对Minitab项目的操作,操作对象包含了工作表,信息窗口输出和各种图形。工作表部分:该部分菜单仅仅提供了对Minitab工作表的操作,操作对象不包含信息窗口输出和各种图形。打开图形调出图形。……..2012/7/301733“编辑”菜单撤消和编辑选项是典型的Windows操作;撤消选项只能向后撤消一步。编辑最后一个对话框可以从当前位置切换到前一个打开的对话框。34“数据”菜单工作表部分:允许合并和拆分工作表。数据列部分:允许对数据列进行复制,堆叠和行列倒置变换操作。运用排序菜单对列数据进行排序,排秩菜单对列数据由大到小进行编号。编码菜单:允许数据替换。改变数据类型菜单:改变列的数据属性。2012/7/301835“数据”菜单编码菜单把某一个特定的数据替换成同类型的或其他类型的数据。例如:把C1列中所有的“1”替换成“A”更改数据类型菜单允许把列的数据类型在“数字类型”,“文本类型”和“日期/时间类型”3中类型中相互转换。例如:把C1列的数据类型从“文本类型”转换成“数字类型”。36“计算”菜单计算菜单允许用户自己定义公式进行计算。列统计量和行统计量允许对列数据和行数据进行统计量计算。产生模版化数据产生一列有规律的数据。随机数据产生一列符合用户定义的分布类型的随机数据。2012/7/301937“统计”菜单此菜单对于6数据分析非常重要;菜单下大部分选项将在黑带课程中讲授。BasicStatistics(基本统计)Regression(回归分析)ANOVA(方差分析)DOE(实验设计)ControlCharts(控制图)QualityTools(质量工具)TimeSeries(时间序列图)Tables(表格)NonParametrics(非参数方法)PowerandSampleSize(检出能力和样本量)38“图形”and“窗口”菜单除了“统计”菜单之外,“图形”菜单对于6分析也很重要。该菜单里的部分图形也可以从“统计”菜单里得到。可以通过“Window”菜单来选择项目的各个窗口和各种图形。2012/7/302039“ProjectManager”窗口项目管理器为完成的工作、图形和分析结果提供了方便的索引。项目管理器包含了以下文件夹:信息窗口文件夹历史记录文件夹图形文件夹相关文件文件夹40Minitab数据输入技巧数据通常以列的形式输入,以便进行分析(点击左上角的小箭头可改变输入方向)。列的标题在列的上方输入,而不是在第一行(最多31个字节)。如果一个字母字节键入列的第一个单元格,那么整列的数据都将转换成为文本类型。文本列数字列标题行输入方向指示箭头日期列2012/7/302141在Minitab中保存信息以工作表方式保存只保存数据。一个项目中可以有多个工作表,保存工作表时,只有当前工作表的数据被保存,其他工作表的数据,图形和信息出窗口内容不被保存。以项目方式保存一个项目包含了所有的工作表,信息窗口内容和各种图表。保存为项目可以使日后再打开时马上就得到分析结果。同一时间只能打开一个项目.Minitab通过项目和工作表两种途径来保存信息:工作表操作项目操作42Minitab的快捷键CtrlD跳到数据窗口CtrlM跳到信息窗口CtrlE开启最近打