6Sigma涉及的统计学基本概念统计概念目的:复习基本的统计学概念。目标:解释以下基本统计概念。1.波动(偏差)2.连续数据和离散数据3.平均值、方差、标准差4.正态曲线5.用Z值将数据标准化6.中心极限定理7.过程能力-使用Z值作为衡量工序能力的指标-通过改进关键值Xs来改进Y观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是波动!系统波动预期的和可预测的测量结果之间的差异。举例:夏季和圣诞节假日的电灶销售量不同。随机波动不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的结果。1.2.观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的电灶销售量是一样的,那么我们就会怀疑是数据库出了问题。.如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。波动的产生是很自然的,意料之中的,是统计学的基础统计学的作用统计学用以下方法处理误差:(置信区间和假设检验)。统计描述用图表和几个总结性数字(均值、方差、标准差)描述一组数据。统计推理确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。收集并分析数据,以估算过程变化的影响。试验设计数据的两种类型•连续(可变)数据使用一种度量单位,比如英寸或小时。•离散(属性)数据是类别信息,比如““通过”或““未通过”。连续数据离散数据问题解决办法举例:部件号离散连续1通过2.0312通过2.0343未通过2.0764通过2.0225未通过2.001连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。你能举出我们用来获得连续数据的三个器具例子吗?相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。连续数据(也称为可变数据)离散数据不能更进一步精确地细分。离散数据是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。离散数据(也包括属性或类别数据)烟火探测器离散数据•一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。•如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。.连续数据与离散数据进行比较的解释:离散数据举例:有凹痕的部件数量通过/未通过申诉决议产出生产线不合格品数量及时交货离散数据需要更多的数据点才能进行有效的分析请在下面的例子旁,写出它是“连续”还是“离散”1销售订单准确度2数据输入准确度3销售地区4使用“合格/不合格”测量仪器得到的孔径5孔径6应答中心对话时间7制冷氟利昂的重量(克)8每百万部件中有缺陷部件的数量9装配线缺陷(ALD)应用你所学到的东西•总体-全组数据,全部对象。-一个总体中的元素数量用N来表示•样本-总体的一个子集-样本的元素数量用n来表示•平均值-总体或样本的平均值-总体的平均值用来表示-样本的平均值用X或来表示•方差-数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用表示-样本的方差用s2或表示•均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用来表示-样本的标准差用s或来表示统计学术语^^^-统计学术语和定义总体-全部对象.举例–1998年5月在深圳生产的所有的16立方英尺冰箱样本-代表总体的一个子集数据。举例-1998年5月在深圳生产的一百二十台十六立方英尺冰箱举例:XXXXXXXXXXXXXXXXXXXXXXXXX这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。平均值-总体或样本的平均值。用x或来表示样本,用来表示总体。举例:给定一个样本:{1,3,5,4,7},平均值就是:统计学术语和定义x=xn在这里X1是样本的第一个点,Xn是样本的最后一个点。.i1n,平均值的公式x=(1+3+5+4+7)=20=4.055样本的平均值等于4。^标准差-衡量数据分散程度的一个指标。一般用表示总体,用s或表示样本。=(Xi-)2i=1NN总体的公式方差-与平均值之差的平方的平均值。一般用s2或2来表示。=S=(Xi-X)2i=1nn-1样本的公式统计学术语和定义^^举例课堂举例:计算样本{2,6,4}的方差和标准差首先计算均值:(2+6+4)/3=12/3=4计算平均值、方差和标准差x=xnii=1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1平均值方差标准差方差(s2)=8/(3-1)=4标准差(s)=sqrt(4)=2ixi(xi-4)(xi-4)212-2426243400和1208课堂练习课堂举例:计算样本{1,3,5,4,7}的方差和标准差(使用下面的表作为向导。)首先计算平均值X:计算平均值、方差和标准差x=xni1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1均值方差标准差方差(s2)=标准差(s或)=ixixi-x(xi-x)212345Totals^绘制直方图75706560151050高度频数59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390位女士的身高用直方图形成一个连续分布测定单位条形的中心点平滑的曲线连接每个条形的中心点许多(但非全部)数据符合“正态”分布,或钟形曲线。W7.6正态分布的标准差()拐点1USLp(d)上限(USL)下限(LSL)均值()标准差()3拐点与平均值之间的距离是一个标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”Copyright1995SixSigmaAcademy,Inc.平均值LSL曲线从较陡的状态变得越来越平坦面积和概率合格部件控制限曲线下的面积是1.0。我们可以计算规范上下限之外的面积,也就是出现缺陷的概率。一个缺陷部件的概率正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。正态分布可以用来将和转换为出现缺陷的百分比。规范上限出现缺陷的概率=.0643假设Z=1.52。1.52之外的正态曲线下部的面积就是出现缺陷的概率。Z值是工序能力的一种尺度,通常称为“工序的西格马”,不要与过程标准差混淆。Z曲线下的整个面积是1=0(在这里=1,=0)使用正态表下页上的表列出了Z值右边的面积。正态分布Z00.010.020.030.040.050.060.070.080.090.05.00E-014.96E-014.92E-014.88E-014.84E-014.80E-014.76E-014.72E-014.68E-014.64E-010.14.60E-014.56E-014.52E-014.48E-014.44E-014.40E-014.36E-014.33E-014.29E-014.25E-010.24.21E-014.17E-014.13E-014.09E-014.05E-014.01E-013.97E-013.94E-013.90E-013.86E-010.33.82E-013.78E-013.75E-013.71E-013.67E-013.63E-013.59E-013.56E-013.52E-013.48E-010.43.45E-013.41E-013.37E-013.34E-013.30E-013.26E-013.23E-013.19E-013.16E-013.12E-010.53.09E-013.05E-013.02E-012.98E-012.95E-012.91E-012.88E-012.84E-012.81E-012.78E-010.62.74E-012.71E-012.68E-012.64E-012.61E-012.58E-012.55E-012.51E-012.48E-012.45E-010.72.42E-012.39E-012.36E-012.33E-012.30E-012.27E-012.24E-012.21E-012.18E-012.15E-010.82.12E-012.09E-012.06E-012.03E-012.01E-011.98E-011.95E-011.92E-011.89E-011.87E-010.91.84E-011.81E-011.79E-011.76E-011.74E-011.71E-011.69E-011.66E-011.64E-011.61E-011.01.59E-011.56E-011.539E011.52E-011.49E-011.47E-011.45E-011.42E-011.40E-011.38E-011.11.36E-011.34E-011.31E-011.29E-011.27E-011.25E-011.23E-011.21E-011.19E-011.17E-011.21.15E-011.13E-011.11E-011.09E-011.08E-011.06E-011.04E-011.02E-011.00E-019.85E-021.39.68E-029.51E-029.34E-029.18E-029.01E-028.85E-028.69E-028.53E-028.38E-028.23E-021.48.08E-027.93E-027.78E-027.64E-027.49E-027.35E-027.21E-027.08E-026.94E-026.81E-021.56.68E-026.55E-026.43E-026.30E-026.18E-026.06E-025.94E-025.82E-025.71E-025.59E-021.65.48E-025.37E-025.26E-025.16E-025.05E-024.95E-024.85E-024.75E-024.65E-024.55E-021.74.46E-024.36E-024.27E-024.18E-024.09E-024.01E-023.92E-023.84E-023.75E-023.67E-021.83.59E-023.52E-023.44E-023.36E-023.29E-023.22E-023.14E-023.07E-023.01E-022.94E-021.92.87E-022.81E-022.74E-022.68E-022.62E-022.56E-022.50E-022.44E-022.39E-022.33E-022.02.28E-022.22E-022.17E-022.12E-022.07E-022.02E-021.97E-021.92E-021.88E-021.83E-022.11.79E-021.74E-021.70E-021.66E-021.62E-021.58E-021.54E-021.50E-021.46E-021.43E-022.21.39E-021.36E-021.32E-021.29E-021.26E-021.22E-021.19E-021.16E-021.13E-021.10E-022.31.07E-021.04E-021.02E-029.90E-039.64E-039.39E-039.14E-038.89E-038.66E-038.42E-032.48.20E-037.98E-037.7