一、假设检验*************编SIXSIGMA培训二、方差分析三、质量工具四、试验设计假设检验假设检验的理解(HypothesisTest)对总体参数分布做假设,根据样本(Sample)观测值运用统计技术分析方法检验这种假设是否正确,从而选择接受或拒绝假设的过程。假设:特定某总体是,,,ex)制造部男员工的平均身高是172cm.•原假设(Ho,NullHypothesis):肯定•对立假设(H1orHa,AlternativeHypothesis):否定原假设某总体(N)Sample•根据Sample的数据检验已设定的该总体的假设检验→原假设(Ho)设定:制造部男员工身高是172cm→设定对立假设(H1orHa):不是172cm(或)11-1/22假设检验假设检验的类别11-2/22假设检验类别Minitab运用条件和解决的问题Z检验1-SampleZ已知总体μ和σ,检验单样本均值与总体μ是否相同t检验1-Samplet已知总体μ,末知总体σ,检验单个样本均值与总体均值差异2-Samplet检验两个样本均值之间差异Pairedt比较数据成对时的两个总体平均值的差异。F检验2Variance两个总体分布的方差检验Barlett检验TestforEqualVariance样本数据为正态分布的多样本方差检验Levene检验TestforEqualVariance样本数据为非正态分布的多样本方差检验比例检验1Proportion2Proportion假设检验ProcessGraph分析•Histogram,BoxPlot,散点图等致命因子选定改善对象的明确化假设检验•ZTest,TTest,Ftest,ANOVA等Graph分析Subgroup≥2相关/回归分析正规性检证(Y)Chi-squareTest连续型?1SampleT-Test分散同质性检证(X)Subgroup=2ANOVA2SampleTCriticalX選定YesNoNoYesNoYes分析(A)相关分析YesNo11-3/22假设检验Process.假设检验的步骤a建立对立假设和原假设b选择显著性水平(一般为5%)c选择检验方法d计算关于样本的Data的P值.e比较P值和显著性水平导出结论.P-Value-在原假设设定为对的假设下,所观测事件的概率显著水平为5%的情况下:P0.05时,接受原假设,拒绝对立假设;P0.05时,接受对立假设,拒绝原假设;11-4/22Theme选定活动范围选定CTQ明确化对CTQ的GageR&R工程能力分析DefineMeasure假设检验Process什么时候使用假设检验?Graph解释假设检验实验计划(DOE)检验实验管理计划AnalysisImproveControl•对影响Y变动的潜在性的候补因子,各个实施假设检验为了确认是否影响Y的因子而使用。•变更某Process以后,为了检验变更前后统计性的改变了没有而使用。11-5/22假设检验事例1SampleZTest1-SampleZ应用实例:•加工一批零件,外园直径的目标值为5.5mm,过去标准差为0.016,从加工的零件中抽取35个,测得直径如下:11-6/225.495.515.475.525.485.515.505.485.535.495.505.495.55.515.495.525.545.515.495.525.515.505.495.505.515.515.535.55.515.485.515.505.525.535.4•问该批零件外园直径均值是否偏离目标值?假设检验事例1SampleZTest1-SampleZ应用实例:1、建立假设:H0:该批零件外园直径均值μ=5.50;H1:该批零件外园直径均值μ≠5.50;2、确定信赖度为95%;则α=0.05;3、选择假设检验方法1SampleZ;应用MINITABL计算P=0.579;StatBasicStatistics1-SampleZ,4、比较P0.05的大小,判定:接受H0,11-7/22•出现对话框后:•Variables栏中选外园直径数值;•SIGMA:栏中填0.016(总体σ)•TESTMEAN栏中填5.50(目标均值)•GRAPHS对话框可填可不填•OPTIONS对话框:•CONFIDENCELEVEL:95.0(置信度水平)•ALTERNATIVE:notequal(对立假设)•One-SampleZ:sample实施结果:•Testofmu=5.5vsmunot=5.5•Theassumedsigma=0.016•VariableNMeanStDevSEMean•sample355.501430.023900.00270•Variable95.0%CIZP•sample(5.49613,5.50673)0.530.597假设检验事例1SampleTTest1SampleTTest实例:Height66.0072.0073.5073.0069.0073.0072.0074.0072.0071.0074.0072.0070.0067.0071.0072.0069.0073.0074.0066.00●确认Height的平均个子是否70.(单,不知道母体的标准偏差.)-原假设:平均个子=70-对立假设:平均个子≠70Testofmu=70vsmunot=70VariableNMeanStDevSEMeanHeight2071.1752.5610.573Variable95.0%CITPHeight(69.976,72.374)2.050.054◎平均:71.175◎标准偏差:2.561◎平均的标准偏差:0.573◎母平均的95%置信区间:69.976~72.374◎p-value:0.054▶p-value比0.05大,接受0假设.即,可以平均个子看作7070包含在置信区间里面。MinitabMenu:Stat/BasicStatistics/1SampleTTest*注意:在Option上各greaterthan,lessthan,notequal的含义是什么?11-8/22•目标均值假设检验事例2SampleTTest2SampleTTest实例:•例3:A、B两种不同情况下测得某PCB焊点拉拔力数据如下:•A:5.655.894.374.285.12;B:5.995.785.264.994.88;问两种条件下PCB的焊点拉拔力是否有显著区别?H0:A=B;H1:A≠B•MinitabMenu:Stat/BasicStatistics/2SampleTTest两样本数据存于一栏两样数据存于不同栏对分散的同质性与否的check(在这里不是同质的no-check)11-9/22•数据•标注•数据假设检验事例2SampleTTest实施结果:•P值比0.05大,接受H0;即2种条件下的PCB板焊点拔取力没有差异从平均值看B比A拔取力大•总体均值的置信区间:(--1.278,0.642)Two-sampleTforAvsBNMeanStDevSEMeanA55.0620.7290.33B55.3800.4870.22Difference=muA-muBEstimatefordifference:-0.31895%CIfordifference:(-1.278,0.642)T-Testofdifference=0(vsnot=):T-Value=-0.81P-Value=0.448DF=611-10/22AB4.55.05.56.0BoxplotsofAandB(meansareindicatedbysolidcircles)假设检验事例成对数据的假设检验●英语分数向上程序运营后,比较程序实施前和实施后的英语分数,检讨向上程序是否实际上很有用程序实施前/后的分数入以下时,检讨程序是否有利于英语分数向上.(各10个随意抽出)Beforeafter7681605285875870918675778290646379858883PairedT-TestandCI:before,afterPairedTforbefore-afterNMeanStDevSEMeanbefore1075.8011.643.68after1077.4012.183.85Difference10-1.606.382.0295%CIformeandifference:(-6.16,2.96)T-Testofmeandifference=0(vsnot=0):T-Value=-0.79P-Value=0.448-10010DifferencesBoxplotofDifferences(withHoand95%t-confidenceintervalforthemean)[]X_HoMinitabMenu:Stat/BasicStatistics/PairedT•PairedT:CIMeanDifference•2SampleT:CIDifferencePairedT11-11/22假设检验事例1-Proportion◆DID事业部为了确认A厂家的6sigma的PJT成果,调查了300个sample,出现了15个不良品.A厂家交货部品的目标不良率为15%,能不能看做目标达成了?MinitabMenu:stat/BasicStatistics/1-ProportionClickTestofp=0.15vspnot=0.15SampleXNSamplep95.0%CIP-Value1153000.050(0.028251,0.081127)0.000▼实行结果11-12/22假设检验事例2-Proportion◆DID事业部为了比较A,B两个line上发生的不良率,收集了Data.其结果ALine上1000个当中有75个不良,BLine上1500个当中发现了120个不良。能不能看作Line间不良率有差异?MinitabMenu:stat/BasicStatistics/2-ProportionTestandCIforTwoProportionsSampleXNSamplep17510000.075000212015000.080000Estimateforp(1)-p(2):-0.00595%CIforp(1)-p(2):(-0.0263305,0.0163305)Testforp(1)-p(2)=0(vsnot=0):Z=-0.46P-Value=0.646◎P-value:0.646(64.6%)▶P-value值大,因此可以说0假设是对的。即,可以说A,B两个line上所发生的不良率没有差异。11-13/22假设检验事例◆需同时检验多个样本均值有无差异时,需要用到方差分析建立假设:H0:胶水A粘接力均值=胶水B粘接力均值=胶水C的粘接力均值H1:胶水A粘接力均值≠胶水B粘接力均值≠胶水C的粘接力均值确定显著水平:α=0.05选择假设检验类别:单变量方差分析Minitab计算P值。11-14/22•例:想了解三种不同胶水对元件粘接力的影响,分别测得不同胶水粘接力如下:胶水A胶水B胶水C5.674.884.895.345.365.214.984.995.365.565.755.895.86.216.116.716.075.29•问三种胶水粘接力均值有无差异?假设检验事例11-15/22•StatANOVAOne-way(Unstacked)•注:Unstacked指不同条件的数据存储在不同列的状态•实施结果:One-wayANOVA:A,B,C•AnalysisofVariance•SourceDFSSMSFP•Factor20.1450.0730.260.778•Error154.2730.285•Total174.419•Individual95%CIsForMean•BasedonPooledStDev•LevelNMeanStDev--------+--