2.4 六西格玛之定义 基本统计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基本统计(BasicStatistics)基本统计-1-DefineMeasureAnalyzeImproveControlStep4-确定项目Y’sStep5-确认Y的现水准Step6-发掘潜在的原因变量(X)基础统计学Minitab简介测量系统分析Y的表现水平及目标确定改进目标路径位置基本统计-2-使用统计的目的确定工程是否稳定如果工程不稳定,鉴别并祛除不稳定的要因确定工程的平均值的位置-它在目标线上吗?如果不在,确定影响平均值的变量,并决定最优的设置以达到目标值估计总散布的幅度-与顾客的要求(规格限)比起来,是可接受的吗?如果不是,确定散布源,而后消除或减少他们对工程的影响。我们现在就将回顾统计学以帮助我们的工程基本统计-3-Data的种类统计的基础流程的散布GraphicalPresentation正态分布统计量的陈述方法DataMining目录基本统计-4-Data的种类记数型数据(AttributeData)(定性的)种类好/坏机器1,机器2,机器3班次记数事件(如文件中的错误数,装船的部品数,等)计量型数据(VariableData)(定量的)-连续的数据(有意义的小数)时间(秒)压力(psi)传送带速度(ft/min)Rate(inches)等等.基本统计-5-CategoricalData(分类数据)MeasurementData(测量数据)Nominal(定性数据)Ordinal(顺序数据)Continuous(连续数据)Counting(计数数据)DiscreteData(离散数据)Data的种类基本统计-6-[问题]判断下面的情况是计数型还是计量型?1)不同地区顾客的平均消费,电话待机时间2)Zipdrive中发生的S/W故障次数3)雇员-Tom,Nancy,Howard.4)顾客别商品保证金5)没有误差发生的支出6)输入预定支出完了所用时间Data的种类基本统计-7-Data的种类记数型计量型计量型记数型输出输入Chi-square散布分析判别式分析Logisticregression相关分析多重回归统计分析路径图基本统计-8-统计的基础•同样制作这样代表值是非常重要的.本课程观察统计学者研究出的代表值.•在统计调查中可以基于概率论知识,通过观察被调查对象的一部分的结果对总体作以统计性的推测.我们不可能对所有事件(或现象)都进行调查,而且这样会消耗很多时间和费用.所以我们可以从母集团选择sample,并通过求出sample的代表值来推测母集团.基本统计-9-概率的了解通过投骰子游戏了解概率想象投两个骰子的实验.如果每次投两个骰子其和为3~11时其结果“满足”的话预测投骰子出现缺陷的概率?统计的基础基本统计-10-概率的了解(投骰子)123456123456723456783456789456789105678910116789101112两个股子的和出现2的组合有多少?两个股子的和为12的组合是?总组合数是?统计的基础基本统计-11-概率的了解12345610.0280.0280.0280.0280.0280.02820.0280.0280.0280.0280.0280.02830.0280.0280.0280.0280.0280.02840.0280.0280.0280.0280.0280.02850.0280.0280.0280.0280.0280.02860.0280.0280.0280.0280.0280.028即,出现缺陷的可能性是%?统计的基础基本统计-12-概率的了解用dice1和2投500次统计的基础基本统计-13-121086429080706050403020100骰子1+2频率113骰子1+2的直方图规格下限规格上限概率的了解统计的基础基本统计-14-概率的了解概率的了解概率代表可能性,以个数或分布开始计算.概率分布的定义这样的概率的累积叫概率分布.问:前页的histogram图是计数型数据的概率分布图那么如果采用计量型数据的话其图形将会是什么形态?统计的基础基本统计-15-Data的中心值测定平均:一组数据的算术平均反映所有数据的影响受极端值影响很大中心值:反映50%等级-把一组数据由小到大排列后位于中央的值在计算中不必要包括所有的数值对极端数值很“稳定”xxnnnn1在工程改进的工作中,为什么我们使用平均值,而不使用中值?统计的基础基本统计-16-平均值可否经常作为代表值?ex)BMW和SM3价格平均不能代表所有车辆的价格.-正态分布–平均,-向一侧倾斜的分布-median统计的基础基本统计-17-Data的扩展性测定范围:一组数据中极限值间的距离(最高-最低)方差():每个数值点到平均值的平均偏差的平方标准偏差():散布的平方根和散布相比,范围对逃逸点“outlier”更敏感对散布最常见且最有用的度量是标准偏差-为什么?统计的基础基本统计-18-统计量预测(推测)参数(母集团)s=样本的标准偏差X=样本平均=母集团平均=母集团标准偏差母集团和样本统计量关系统计的基础基本统计-19-计算公式N:总体数n:样本数总体平均样本平均总体标准偏差样本标准偏差=XNiiN1x=xnii=1n=S=(X)Ni2i=1Nsxxniin121统计的基础基本统计-20-流程的散布流程的稳定性(Stability)-在制造中可预测是很重要的.但前提是工程要稳定.图A:平均值不随时间的变化而变化,是可以预测散布的稳定的流程.(可以说是在“管理限以内”)图B:发生管理异常点,不可预测的不稳定的流程.-散布的大小直接影响工程的稳定性(Stability)2520151050757065SampleNumberSampleMeanX-BarChartforProcessAX=70.91UCL=77.20LCL=64.62252015105080706050SampleNumberSampleMeanX-BarChartforProcessBX=70.98UCL=77.27LCL=64.70AB基本统计-21-散布(Variation)的种类所有工序都有散布.有的工序体现正常的管理散布,有的工序体现非正常的管理散布.☞正常的管理散布(ControlledVariation:Noise)-随着时间的推移显示稳定的正常散布.-当这种散布与一般原因(Commoncauses)有关联时,为减少这样的散布,需要对工序进行根本性的改进.例)原材料,设备,作业标准等在允许范围内变动.☞非正常的管理散布(UncontrolledVariation:Signal)-随着时间的推移散布发生变化,且不可测定.-与异常要因(Specialcauses)相关联,这需要通过工序管理,monitoring等进行及时的改善.例)工程本身的问题即机械磨损,设备故障,原材不良,没有作业标准等原因导致的散步,必须加以消除.流程的散布基本统计-22-分散(Variance)的要素22Total22222X12X2total212121,,;X;X;BXXXXTotal所以那么的方差源于输入变量的方差源于输入变量工程输出的方差如果一个工程输出变量的总的变化(方差)可以分割成各工程输入的变化流程的散布基本统计-23-工程中散布的允许水准(Variability)CostLSLUSLNomUSL可以容忍的水准CostLSLUSLNom老的观点新的观点•旧的观点:下面的情况可以容忍.-工序的平均值位于目标值,与规格相比总散布要小,工序随时间的变化呈现稳定状态.•新的观点:-即便是在管理规格内,随着远离目标所发生的费用将与远离目标的距离的平方成比例增长(Taguchilossfunction)流程的散布基本统计-24-CostLSLUSLNomCostLSLUSLNom在目标线上;最小的散布在目标线上;几乎不可接受的散布流程的散布基本统计-25-CostLSLUSLNomCostLSLUSLNom脱离目标;最小的散布脱离目标;几乎不可接受的散布流程的散布基本统计-26-GraphicalPresentation图表介绍为了说明工序或系统的运营状态,需要记录同一变量的很多数据.-按不同的时间段测定数据-对所有产品测定数据-对不同设备测定数据.这样数据的累积可以认为是测定值的分布.这样的分布可用以下几种图表示-Histograms-Dotplot-BoxplotGraphicalPresentation基本统计-27-柱状图观察油漆比率(Rate)打开PUMPING.MPJRATE转换为变量.GraphicalPresentation图表介绍基本统计-28-现在设想同样的数据,用次数分成“间隔”,每一个速率数点落在给定的间隔内,决定间隔条的高度。Minitab结果GraphicalPresentation图表介绍基本统计-29-产生具有正态曲线的柱状图GraphicalPresentation图表介绍基本统计-30-正态分布的直方图最后,我们把数据分布连成光滑的曲线。在这个例子中使用了“正态分布”的假设(我们将稍后讨论),如果我们收集了一组无限多的数据点,它将提供一个近似的数据分析结果。GraphicalPresentation图表介绍基本统计-31-观察油漆比率(Rate)打开PUMPING.MPJ文件RATE作为变量.点图GraphicalPresentation图表介绍基本统计-32-Minitab结果设想一个泵的运转,按设计被用来以21加仑/分供应溶剂。分150次测定了实际的泵抽速,作图如上。每一个点代表一个具有给定值输出的“事件”。随着点的积累,泵运转的实际表现的特性可被看作一个抽速数值的“分布”。GraphicalPresentation图表介绍基本统计-33-箱线图是各分布差异容易把握的数据调查方法.让我们看一下上漆的速率打开文件PUMPING.MPJ用列RATE作为变量GraphicalPresentation图表介绍基本统计-34-30.027.525.022.520.017.515.0RateRate的箱线图Minitab结果90%75%50%25%10%Outlier箱线图可以体现数据扩散性及中心.注意!箱线图中的中心线不是平均而是中央值.GraphicalPresentation图表介绍基本统计-35-正态分布正态分布是有一贯性的数据的分布.1700年开始统计学者研究通过平均和标准偏差两个值来把握全部母集团的概念.收集这样的数据对理解重要的工序特性很有用.可以假设自然的或人为的工序大多呈正态分布,但完整的正态分布是不可能的.基本统计-36-分布曲线1分布曲线2分布曲线3这三个正态分布的差异是什么?属性1:通过下面两个值可以得出正态分布:数据平均,标准偏差正态分布基本统计-37-43210-1-2-3-440%30%20%10%0%95%标准值得概率到平均的距离内可容纳的标准偏差的个数99.73%68%两个值之间可以得到的累积概率属性2:通过曲线下面的宽度可以推测发生某种“事件”的概率.正态分布基本统计-38-为标准偏差的经验规则-前面的累计概率的规则即使在数据不是完美的正态分布时也适用-让我们比较数值的理论正态分布(完美的)和经验正态分布(现实的)即,是否正态分布的60~75%的数据在1西格玛内.+/-168%65-70%+/-295%92-98%+/-399.7%99-100%标准偏差数理论正态分布经验正态分布正态分布基本统计-39-正态概率图利用正态概率图的数据样式可以判定是否符合“正态分布”分布曲线接近曲线时正态概率图将接近直线.Minitab使正态概率图使用方便.利用Distskew.mtw数据做练习.正态分布基本统计-40-画NormalProbabilityPlots正态分布基本统计-41-110100908070605

1 / 62
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功