1数据的分析从总体中抽取样本,收集测定的数据,这些数据总是参差不齐的,即具有散差。我们需要对收集的数据进行整理和分析,然后才能对总体作出推测和判断。一、数据的种类数据大体可以分为计量值和计数值二种。所谓计数值数据,是指1,2,3,……这种非连续性取值的数据,如一批产品的不合格品数,缺陷的个数以及工厂的事故发生件数等。把不合格数用全部产品所除得到的不合格率,仍是计数值。而计量值数据,是指一些可以连续取值的数据。如钢材的厚度、抗拉强度,零件的尺寸等测定值都属于计量值数据。计量值与计数值数据差别,决定了数据所反映的统计的性质不同,进而数据的处理方法也有变化。例如,计量数据属于连续概率分布,最典型的使正态分布;而计数值数据属于离散概率分布,最典型的是二项分布和泊松分布。二、数据的分布即时在同样的条件下制造的产品,其质量都会有差别,故我们收集到的数据总是大小不等的,称这种数据的不均一性为具有散差。如果把数据控制在一定的范围哪,数据间的散差就会有某种规律性,我们称之为分布。可以构造频数分布来了解分布状态。们如下图所示,为某一个样本所反映的频数分布图。(相当于直方图)从两个图可以看出两个分布的不同,也很容易看出两个样本的差别,进而反映了总体的分布状况。三、数据分布的定量表示02468101214161.691.71.711.721.731.741.75频度02468101214161.691.71.711.721.731.741.75频度2上面的频数直方图,可以用来观察数据的大致离散情况即分布的形状,但是得不到数量方面的信息。特别是比较两个以上的分布时,尽管可以凭视觉观察出分布状态上的差异,却不能定量地求出他们的差别。如果能把分布状态的特性予以数量化,就便于比较。一般需要有表示数据整体即分布中心位置(中心趋向)和离散程度的尺度。前者可以用平均值,后者可以用标准偏差。有时,还需要从数量上表示分布状态的偏斜程度(可用偏斜度)以及表示分布峰顶的陡峭程度(可用陡度)1.中心位置的表示表示中心位置的量有平均值、中位值、最多值、中值以及众数等。最常使用平均值。平均值:各个测定值的总和除以测定值的个数,称为平均值(算术平均值),用表示X。计算分式为:中位值:将测定值按大小顺序排列,位居正中的那个数值称为中位值。若测定值的个数为奇数,则中位值为居于中央位置的那个数值;若测定值的个数为偶数,则中位值为中间两个数的平均值。中值M:测定值的最大值和最小值的平均值,称为中值。2、散差的表示1)极差(range)R测定值的最大值和最小值之差为极差,用R表示。通常,当测定个数n小于10的场合,用极差R表示离散程度;而当n大于10时,则用标准偏差s表示离散程度。2)偏差的平方和(sumofsquares)S各个测定值与平均值之差称为偏差。各测定值的偏差的平方和称为偏差平方和,简称平方和,用S表示。设各个测定值与为X1,X2,……Xn,其平均值为:则:3)无偏方差(unbiasedvariance)S2各个测定值的偏差平方和除以(n-1)后,所得到的值称为无偏方差(简称为差),用S2表示,其中n为测定值个数,由S的计算公式可以得到S2的公式为:方差的单位为测定值单位的平方。4)标准偏差(Standarddeviation)s方差S2的平方根称为标准偏差(简称标准差),s表示,标准差s的单位与测定值的单位相同,标准差的公式为:niixnxxxxn121ninxxi1/nxxnxxxxxxxxsniniiniiniiinxx/)()()()()(21122122122221212)(111nixxnnSSinixxnnSSsi122)(1113附录:方差的含义标准偏差是测量由于取样引起的估计的可变性。它指出样本估计的可变性,它可以从所有已知设计和规模的样本中获得。标准偏差用来测量从一组特定样本得到的数据的精确度。如果所有可能的样本都在类似的条件下接受调查,标准偏差在+1.96到-1.96的范围内的概率分布包括了95%的样品的情况,这个区间被成作是95%置信区间.()Excel的计算公式1、平均值测定值3.723.613.573.513.673.45平均值=3.5883公式:=AVERAGE(B2:G2)AVERAGEA也可以计算,不过包括逻辑值在内2、偏差测定值2.242.212.182.142.25偏差0.0081公式:=DEVSQ(B8:F8)3、无偏方差测定值2.242.212.182.142.25无偏方差0.0020公式:=STDEV(B13:F13)*STDEV(B13:F13)4、标准偏差测定值2.242.212.182.142.25标准偏差0.0451公式:=STDEV(B18:G18)在统计过程中,可以应用各种工具,其中最常用的统计方法有检查表、层别法、直方图、帕累托图、特性要因图、管理图和散布图,统称为常用的七种工具。其中,控制图用来直接监控过程,是七种工具的核心。随着全面质量管理的进一步发展,于20世纪70年代又提出了质量管理的新七种工具,即关连图法、KJ法、系统图法、PDPC法(过程决策程序图法)、矩阵法、矩阵数据解析法及箭头图法。但新七种工具已不是统计质量控制的具体方法,只是组织实施、计划调度等所采用的一些简明有效的方法,它们的许多思路来源于运筹学系统工程,这里不作介绍。七种工具可分为三类:一、用来作整理和分析数据用的目的:检查表和分层法二、普通的科学归纳分析方法:帕累托图和特性要因图三、数据统计方法:直方图、管理图和散布图层别法一、分层的定义层别即将很多的数据按照其所持有的特性进行层次划分。将数据以状况、原因分类进行4分析的方法二、分层的方法1.按问题的发生状况分:1)不合格项目、缺陷内容2)形状、长度、深度3)发生位置、发生区域4)天气、状态2.按可能有问题的原因分:通常可以根据层别获取比整体事件更多的分析结果。但由于某些层别的失败导致了错误的情报,所以在划分层别的时候必要使用工程技术方面的知识及经验,也要使用特性要因图,并要检讨其特性质及其同要因的关系,即运用特性要因图里的中骨、小骨的项目划分数据便得到较好的层别,在做层别的过程中,以下事件也是极其重要的:1)人的区别:在划分制造要因的层别时,通常也要根据实施人的区别进行层别。(从作业班分析)这样对作业管理、作业方法有益。另外,还可根据性别区分、年龄区分、经验区分。2)机械、装置的区别:在有几台相同机械的时候,可以根据每一台机械的数据进行判断不良原因是否因机械差异而产生,另外,像炉子这样的设备会因位置的不同而温度不同,所以在炉内的位置上考虑层别将会得到良好的效果。3)原材料区分:从供应者、前工程、批量、原材料的比例等方面考虑层别。4)时间区分:上午、下午、日期、季节5)环境区分:温度、湿度、气候、环境状况6)作业方法区分:作业的方法、作业条件、批量、测定方法。一个出色的层别应是将数据层别后,能清楚的将层间的区别表现出来三、层别的手顺手顺1:明确层别的目的手顺2:决定特性值手顺3:决定层别的项目手顺4:取数据手顺5:将数据层别手顺6:追究错误的原因手顺7:采取对策四、层别的实例例:为查明不良原因某汽车部件在生产过程中因折、弯曲所造成的不良多,将所出现的半成品不良按部品进行层别,将半成品不良中占不良比率的再按不良状况现象进行层别,然后将其中大的两项问题进行层别,如此反复试验就可查明不良原因图一部品帕累托图020406080支架B托架底板其他0%20%40%60%80%100%图二支架B现象别帕累托图01020304050折断变形伤痕0%20%40%60%80%100%层别n=545图三按发生场所再次层别(n=47为前两项多发生性不良)场所现象折断变形组装工程3211搬运工程04按原因分的层别项目(1)按人——按个人、年龄、工作年数、性别、组别(2)按机械设备——按机种、号机、型式、新旧(3)按原料——按生产厂家、购入地、产地、品牌、进货日期、接纳批量、成份(4)按方法——按加工顺序、条件、温度、湿度、转速、力度、销售方式(5)按测量检查——按测量器、测量者、测量方法、检查人员、检查方法(6)按工夹模具——按夹具、工具、模具、安装工具、螺丝板(7)按零件——按生产厂家、制造批量、接纳批量、包装(8)接流通——按市场、顾客、销售形式(9)按组织——按部门、小组、班组分层时注意:(1)很好的观察分类问题的内容(2)数据记录用纸事先设计好,并且能够简单的将分层的数据记录例题:上一节不良原因调查用检查表用层别方法可能得到几种结论?在调查服装品牌喜好和个人特性不同方面如何应用层别法呢?帕累托图一、概述工场内常常需处理不良品、灾害、故障、投诉等问题点,这些问题点按项目分类后会有2-3个项目占全体的大部分。帕累托图是针对这些问题点按现象、原因来分类,将数据按由大至小的顺序排列,以柱状图和累积曲线图作成帕累托图是在不良对策中发现重要问题点的情况下使用。也就是说,不良损失额的大部分是由几个主要项目构成,残余的小部分则为多数的不良项目。其意义在于对前者的不良项目采取相应的对策并实施,能够有效的降低不良数或使成本大幅度的减低。二、帕累托图的作法步骤1数据的收集对于发现的不良、灾害、及错误等问题点收集数据,数据收集期间我们可以根据问题发生状况及性质来决定数据集计的周期,例如:以一个月、三个月(一年四次)为周期,也可以根据问题的具体情况每星期每星期的来收集。下表是某制品检查中所发现的不良数,期间是一个月,检查台数为500台。表一不良的数据分类项目件数伤痕涂装镀层变形脏污其他1318723136合计74步骤2将数据根据原因及内容进行分类原因可按材料、机械、作业者、作业方法分类;内容可按不良项目、场所、时间进行分类步骤3根据分类项目来整理数据,并作成计算表分类项目按数据多少由大到小排列,“其他”项目不论多大都是排在最后表二计算表分类项目件数累积件数脏污涂装伤痕镀层变形其他311813723314962697174合计74——例如:到涂装位置的累积件数为(脏污)+(涂装)→31+18=49并且,最后项目的累积件数一定要等于总件数步骤4图表中纵轴和横轴的作成纵轴和横轴最好是一样长,并适当的决定刻度的间隔纵轴:坐标终点应稍大于数据的合计数,并且恰当选择(凑整)横轴:按项目的数据多少从左至右依次排列,并在下面记入相应的项目名称纵轴是记录件数、金额等特征值;横轴记录分类项目下面是纵轴、横轴记录项目的具体举例:表三项目举例项目项目的具体内容纵轴品质纳期成本安全士气不良率、不良数、修理数、投诉件数、欠点数、故障回数纳期遵守率、纳期延迟日数、作业时间、工作效率、待工时间损失金额、劳务费、办公经费灾害件数、无灾害记录日数出勤率、欠勤率、参加率、提案件数、发表件数、表彰件数横轴现象机械、设备作业者作业方法原材料时间不良项目、欠点内容、不良位置机械、设备机号、工夹具、计测器男女、年龄、经验年数、所属部门作业条件、一定时间内的作业量批号、厂家、成分月、周、季度、小时、午前、午后步骤5柱状图的作成柱状图中“其他”项放置最右端,各项目之间无间隔。“其他”项不论它有多大,应放在最右端作为最后一个项目,并且作为检讨的对象步骤6累积曲线的作成累积的值在各个柱状图的右上部打点,然后用直线连接这些点,做出折线,折线的起始点为0。折线即为帕累托图的累积曲线步骤7累积比率的作成在帕累托图的右侧作纵轴,与左侧轴相应的建立右纵轴的起点(0)、终点(100%),将0-100%的长度进行等分,并记录刻度,例如:20%可以五等分,10%可以十等分。而即7使数据比率的合计值超过100%(累积为100.1%,四舍五入的原因),但仍以100%为准记录纵轴。终点(100%)的确定:从左侧纵轴的数据合计数点引出横轴平行线(即垂直与左侧纵轴),其必与左侧纵轴相交,即其相交点位右纵轴100%点数据的修约口决:“五下舍五上入,整五偶舍奇入”,即4以下舍去,