常用质量管理方法、工具北京科立特管理咨询公司@QMC.COM.CN丰田公司利用统计技术的变化'87'88'89'90'91'92公司外发表件数多变量分析试验设计可靠性一般的SQC第一部分:数据分布特征第二部分:QC老七种工具第三部分:QC新七种工具第四部分:统计过程控制第五部分:统计推断第六部分:回归分析第七部分:方差分析第八部分:试验设计主要内容第一部分数据分布特征数据分布特征的测度数据基本统计量集中趋势的测度离散程度的测度偏态与峰度的测度学习目标1.掌握数据基本统计量2.掌握集中趋势各测度值的计算方法3.掌握集中趋势不同测度值的特点和应用场合4.掌握离散程度各测度值的计算方法5.掌握离散程度不同测度值的特点和应用场合6.掌握偏态与峰度测度方法7.用软件计算描述统计量并进行分析基本统计量最大值最小值平均值中位数众数标准偏差偏度峰度数据分布的特征集中趋势(位置)离中趋势(分散程度)偏态和峰度(形状)数据的特征和测度数据的特征和测度分布的形状离散程度集中趋势众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态集中趋势的测度一.定类数据:众数二.定序数据:中位数和分位数三.定距和定比数据:均值四.众数、中位数和均值的比较数据特征分布的和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态集中趋势1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定定类数据:众数众数1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能没有众数或有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242未分组数据的众数表3-1某产品缺陷类型的频数分布1001200合计56.025.54.58.05.01.00.5600.2550.0450.0800.0500.01011251916102裂纹砂眼毛刺划痕断裂其他缺陷频率(%)比例人数(人)缺陷类型【例】根据下表中的数据,计算缺陷众数解:这里的变量为“缺陷类型”,这是个定类变量,不同类型的缺陷就是变量值。我们看到,在所统计的报废200个产品当中,裂纹缺陷数最多,为112个,占总被统计个数的56%,因此众数为“裂纹”这一类别,即Mo=裂纹未分组数据的众数【例】根据下表中的数据,计算众数解:这里的数据为定序数据。变量为“回答类别”。客户中对产品表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意客户回答类别100.0300合计83631151024108934530非常不满意不满意一般满意非常满意百分比(%)个数(户)表:客户对某产品评价的频数分布分组数据的众数1.用于数值型分组数据2.众数的值与相邻两组频数的分布有关5.该公式假定众数组的频数在众数组内均匀分布Mo3.相邻两组的频数相等时,众数组的组中值即为众数4.相邻两组的频数不相等时,众数采用下列近似公式计算:iffffffLM)()(1110MoMo分组数据的众数(算例)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.1】根据第三章表3-5中的数据,计算50名工人日加工零件数的众数)(1235)1014()814(8141200个M定序数据:中位数和分位数中位数(概念要点)1.集中趋势的测度值之一2.排序后处于中间位置上的值Ni1Xi-Me=最小Me50%50%3.不受极端值的影响4.主要用于定序数据,也可用数值型数据,但不能用于定类数据5.各变量值与中位数的离差绝对值之和最小,即中位数的确定中位数位置1N2未分组数据:组距分组数据:中位数位置N2未分组数据的中位数为偶数时当为奇数时当NXXNXMNNNe1222121未分组数据的中位数【例】根据表中的数据,计算客户对产品满意状况评价的中位数解:中位数的位置为:(300+1)/2=150.5从累计频数看,中位数在“一般”这一组别中。因此Mo=一般客户回答类别100.0300合计83631151024108934530非常不满意不满意一般满意非常满意百分比(%)个数(户)表:客户对某产品评价的频数分布未分组数据的中位数(5个数据型数据的算例)原始数据:2422212620排序:2021222426位置:12345位置n+125+123中位数22未分组数据的中位数(6个数据型数据的算例)原始数据:10591268排序:56891012位置:123456位置n+126+123.5中位数8+928.51.用于数值型分组数据2.根据位置公式确定中位数所在的组3.采用下列近似公式计算:4.该公式假定中位数组的频数在该组内均匀分布分组数据的中位数(要点及计算公式)ifSNLMmme12分组数据的中位数(算例)表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据下表中的数据,计算50名工人日加工零件数的中位数)(21.12351416250120个eM四分位数(概念要点)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%四分位数(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N4未分组数据的四分位数(定序数据的算例)【例4.4】根据下表中的数据,计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为:QL位置=(300)/4=75上四分位数(QL)的位置为:QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“满意”这一组别中。因此QL=不满意QU=满意甲城市回答类别—300合计2413222527030024108934530非常不满意不满意一般满意非常满意累计频数户数(户)表甲城市家庭对住房状况评价的频数分布未分组数据的四分位数(7个数值型数据的算例)原始数据:23213032282526排序:21232526283032位置:1234567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30未分组数据的四分位数(6个数值型数据的算例)原始数据:232130282526排序:212325262830位置:123456QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)=28.5数值型分组数据的四分位数(计算公式)上四分位数:UUUUUifSNLQ4LLLLLifSNLQ4下四分位数:数值型分组数据的四分位数(计算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表:某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据下表中的数据,计算50名工人日加工零件数的四分位数(个)81.117588450115LQ(个)75.128510304503125UQ定距和定比数据:均值均值1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据均值(计算公式)设一组数据为:X1,X2,…,XN简单均值的计算公式为:设分组后的数据为:X1,X2,…,XK相应的频数为:F1,F2,…,FK加权均值的计算公式为:NXNXXXXNiiN121KiiKiiiNNNFFXFFFFXFXFXX11212211均值1.各变量值与均值的离差之和等于零ni1(Xi-X)=0ni1(Xi-X)=最小22.各变量值与均值的离差平方和最小众数、中位数和均值的比较众数、中位数和均值的关系对称分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值※众数※中位数※均值※均值—四分位数众数调和平均数—众数中位数几何平均数——四分位数中位数———四分位数———众数离散程度的测度一.定类数据:异众比率二.定序数据:四分位差三.定距和定比数据:方差及标准差四.相对离散程度:离散系数离中趋势1.数据分布的另一个重要特征2.离中趋势的各测度值就是对数据离散程度所作的描述3.它所反映的是各变量值远离其中心值的程度,因此也称为离中趋势4.从另一个侧面说明了集中趋势测度值的代表程度5.不同类型的数据有不同的离散程度测度值数据的特征和测度数据的特征和测度分布的形状离散程度集中趋势众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态定序数据:四分位差四分位差------概念要点1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差QD=QU-QL4.反映了中间50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表程度四分位差【例】根据表中的数据,计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2,QU=满意=4四分位差:QD=QU–QL=4–2=2表甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—定距和定比数据:方差和标准差极差----概念要点及计算公式1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910未分组数据:R=max(Xi)-min(Xi).=组距分组数据:R最高组上限-最低组下限5.计算公式为:平均差1.离散程度的测度值之一2.各变量值与其均值离差绝对值的平均数3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少5.计算公式为:未分组数据:组距分组数据:NXXMNiiD1KiiKiiiDFFXXM11平均差--------计算过程及结果31247.153.545.69.843.055.857.2|Xi-X|Fi—15.710.75.70.74.39.314.3|Xi-X|50—合计358141064107.5112.5117.5122.5127.5132.5137.5105~110110~115115~120120~125125~130130~135135~140频数(Fi)组中值(Xi)按零件数分组表某车间50名工人日加工零件标准差计算表【例