统计学基础及QC常用工具李老师2015年9月2一、统计方法及用途(一)统计方法的含义统计是指对某一现象有关的数据进行搜集、整理、计算和分析等的活动。搜集整理计算分析为某一目的3一、统计方法及用途(二)统计方法的分类统计方法一般分为描述性统计方法和推断性统计方法。1、描述性统计方法常用曲线、表格、图形和指标(均值、标准差等)反映统计数据和描述观测的结果,以使数据更加容易理解。例如:学校中5班的班主任计算本班学生数学科目考试的平均成绩、最高成绩、最低成绩。2、推断性统计方法是在对统计数据描述的基础上,进一步对其所反映的问题进行分析、解释和做出推断性结论的方法。例如:上例中5班的班主任通过本班的学生考试成绩信息推断3班的学生的考试成绩。4一、统计方法及用途(三)统计方法的性质统计方法有三种性质:1、描述性。利用统计方法对统计数据进行整理和描述,以便展示出统计数据的规律。例如运用统计指标均值、中位数、众数等来表示数据分布位置,用极差、标准差等来表示数据的散布情况。再如使用直方图、折线图、柱状图等来直观的展示数据。2、推断性。统计方法都要通过详细研究样本达到了解、推测总体状况的目的,因此都具有由局部推断整体的性质。3、风险性。统计方法既然要用部分去推断全体,那么这种由推断而得出的结论就不会百分之百的准确,不准确就要承担风险。但是统计学可以给出推断存在风险的大小。5一、统计方法及用途(四)统计方法的用途1、提供表示事物特征的数据例如表示数据分布位置,用极差、标准差等来表示数据的散布情况。2、比较两事物的差异在质量管理活动中,实施质量改进后要判断与改进前是否有显著改进,就需要用到假设检验、显著性检验、方差分析和水平对比法等。3、分析影响事物变化的因素在质量管理活动中可以应用因果图、调查表、散布图、分层法、树图、方差分析等来分析影响某一问题的各种原因。6一、统计方法及用途4、分析事物间的关系在质量管理中往往会遇见两个以上变量之间虽然没有确定的函数关系,但往往存在着一定的相关关系。运用统计方法确定这种关系的性质(线性相关、高阶相关等)和程度,对于质量活动的有效性就显得十分重要。常用的比如散布图、回归分析、试验设计等等。5、研究取样和试验方法为了获得准确的数据来推断整体的情况,或者为了确定合理的试验防范,我们还需要研究数据取样的方法。这些方法有抽样方法、抽样检验、试验设计、可靠性试验等。7一、统计方法及用途6、发现问题我们还会遇见用收集到的数据或以一定的规则获取数据,通过一定的方法来分析,来发现是否出现异常。例如直方图、控制图、散布图、排列图等等。7、描述质量形成过程例如流程图、控制图等等。应当指出的是,统计方法起到的作用是归纳、分析问题,并客观的显示事物的规律的作用,而并不是具体解决问题的方法。要解决问题还需要专业技术和组织管理等措施。8二、产品质量波动(一)产品质量具有波动性和规律性。在生产实践中,生产过程受到操作者、机器、原材料、加工方法、测试手段、生产环境等因素的干扰,生产出的产品的质量特性数据都不完全相同,总是存在差异,这就是产品质量的波动性。这种波动是普遍存在的。但是当我们逐渐的减弱这些因素对产品的影响后,我们就会发现产品质量特性的波动会符合一定的规律,并可以被我们描述出来。这就是产品质量的规律性。9二、产品质量波动(二)质量波动的分类从统计学的角度来看,可以把产品质量波动分为正常波动和异常波动两类。1、正常波动正常波动时随机原因引起的产品质量波动。这些随机因素在生产中大量存在,并不容易消除,对产品质量经常发生影响,但是它们所造成的质量特性值波动往往比较小。例如机器的轻微震动;温度、湿度的微小变化等等。一般情况这些质量波动在生产过程中是允许存在的,而公差概念的存在就说明我们承认并接受这种波动,我们要做的是将这种波动控制在能承受的范围内,就是公差。10二、产品质量波动2、异常波动异常波动时由系统原因引起的产品质量波动,这些系统原因在生产中并不大量存在,一旦发生,对产品质量影响较为显著。例如机器设备带病运转、操作者违反规程作业、原材料质量不符合要求等等。由于这些因素引起的质量波动大小和作用方向一般具有一定的周期性或持续的倾向性,往往比较容易发现和预防,也易于处理和解决。11二、产品质量波动质量管理工作就是要找出产品质量波动的规律,把正常波动控制在合理范围内,消除系统原因引起的异常波动。从微观角度,引起产品质量波动的原因主要有以下6项:人:操作者的质量意识、技术水平、文化素养、熟练程度和身体素质。机器:机器设备、工夹具的精度和维护保养状况。材料:材料的化学成分、物理性能和外观质量。方法:加工工艺、操作规程和作业指导书的正确程度以及是否被严格执行。测量:测量设备、试验手段和测试方法等。环境:工作场地或测量场地的温度、湿度、含尘度、照明、噪声、震动等。12二、产品质量波动这六大因素涵盖了生产过程的方方面面,是从事生产过程质量管理工作的基础。我们要自觉的应用它们解决实际的问题。13三、统计数据及其分类从统计的角度来看,一般把形形色色的统计数据归成两大类,计量数据和计数数据。(一)计量数据凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的数据。例如长度、容积、质量、温度、化学成分、产量等等。计量数据一般服从正态分布。(二)计数数据凡是不能连续取值的,或者说即使测量工具也得不到小数点以下数据,而只能得到自然数的这类数据。例如不合格品数、瑕疵点、缺陷数等。计数数据分为计件数据和计点数据。例如不合格数、电视机数量、检验项目数量等为计件数据。例如瑕疵点数、沙眼数等为计点数据。计件数据一般服从二项分布,计点数据一般服从泊松分布。14四、总体与样本通常我们不可能为了掌握一批产品的质量信息而检查整批产品,更何况如果检查是破坏性检验时。而只能按照一定的抽样规则,从中抽取一定数量的样品进行检测,从样品检测结果来推断整批产品的质量。总体是某次统计分析中研究对象的全体,上例中就是一批产品的所有。样本是从总体中按照一定抽样规则抽取的一本个体的综合。被抽出的样本中的每一个产品叫做样品。15五、随机抽样方法随机抽样就是在从总体中获取样本的过程中要使每一个样品都有同等的机会被抽取出来的活动过程。随机抽样的方法有简单随机抽样法、系统抽样法、分层抽样法和整群抽样法。具体的方法有兴趣的可以查阅抽样理论的相关书籍。16六、统计特征数在研究样本的时候我们需要用一些特征数来描述样本的情况。在统计方法中常用的统计特征值可以分为两类。一类是表示数据的集中位置的,如样本均值、样本中位数等;一类是表示数据的离散程度的,如样本极差、样本标准差等。17六、统计特征数(一)样本平均值(二)样本中位数将样本按照大小顺序重新排列。当样本量为奇数时,正中间的数就是样本的中位数;当样本量为偶数时,中间的两个数据的平均值为样本的中位数。11niiXxn18六、统计特征数(三)样本方差(四)样本标准差样本方差的量纲和样本不一致,在某些问题的处理上不方便,这是我们取样本方差的正平方根作为样本的标准差,用符号S来表示。(五)样本极差极差是样本中最大值与最小值之差。用符号R表示。2211()1niisxxn19七、QC活动中常用的统计工具和方法(一)调查表(Data-collectionsForm)1、调查表又叫检查表,核对表、统计表分析表。他是用来系统的收集资料和积累数据,确认事实并对说据进行粗略整理和分析的统计图表,他能够促使我们按照统一的方式收集资料,便于分析;2、应用调查表的步骤:1)明确收集资料的目的。2)确定为达到目的的所需要收集的资料(这里强调问题)。3)确定对资料的分析方法(如运用哪种统计方法)和负责人。4)根据不同的目的,设计用于记录资料的调查表格式,内容要包括:调查者、调查时间、地点和方式栏等内容。5)对收集和记录的部分资料进行预先检查,目的是审查表格设计的合理性;20七、QC活动中常用的统计工具和方法3、调查表事例:1)不合格品项目调查表主要是用于调查生产现场不合格品项目频数和不合格品率,以便继而用于排列图等反系研究。下面是某卷烟厂月成品抽样检验及外观不合格品项目调查表:批次产品型号成品量(箱)抽样数(支)不合格品数(支)批不合格率(%)外观不合格项目切口贴口空松短烟过紧钢印油点软腰表面1烤烟型1050030.61112烤烟型1050081.6112223烤烟型1050040.81214烤烟型1050030.6215烤烟型1050051.011111………………………………………………………………………………250烤烟型1050061.211211合计25001250009900.880297458352810151255调查者:王XX日期:年月日地点:卷烟车间21七、QC活动中常用的统计工具和方法3、调查表事例:2)缺陷位置调查表许多产品或零件常存在气孔、疵点、碰伤、脏点、油物等外观质量缺陷。缺陷位置调查表可用来记录、统计、分析不同类型的外观质量缺陷所发生的部位和密集程度,进而从中找出规律性,为进一步调查或找出解决问题的办法提供依据。例下图是反映汽车车身喷漆质量缺陷位置调查表。从中可以看到,“色斑”、特别是车门容易发生色斑缺陷是很明显的,因此工厂首先应从这里采取措施提高喷漆质量。这种调查表分析的做法是:画出产品示意图或质量缺陷的表示符号。然后注意检查样本,把发现的缺陷,按规定的符号在同一张示意图中的相应位置上表示出来。这样,这张缺陷位置调查表就记录了这一阶段(这一批)样本的所有缺陷的分布位置、数量和集中部位,便于进一步发现问题、分析原因、采取措施。车型xx检查处车身工序xx检查者xx调查目的喷漆缺陷调查数2139辆尘粒尘粒色斑色斑流漆流漆年年月月日日22七、QC活动中常用的统计工具和方法3、调查表事例:3)质量分布调查表质量分布调查表是对计量数据进行现场调查的有效工具。它是根据以往的资料,将某一质量特性项目的数据分布范围分若干区间而制成表格,用以记录和统计每一质量特性数据落在某一区间的频数。下面是零件实测值分布调查表:正正正正正正-正正正正正-正正正正正正正正正-241023322614631频数调查方式:根据原始凭证统计调查数(N):121件调查日期:_____年____月____日调查人:李××05101520253035400.55.510.515.520.525.530.535.540.545.540.523七、QC活动中常用的统计工具和方法(二)分层(Stratification)法1、分层法又叫分组法、分类法。它是按照一定的标志,把收集到的大量有关某一特定主题的统计数据加以归类、整理和汇总的一种方法。由于引起质量波动的原因是多种多样的,因此收集到的质量数据往往带有综合性。为了能真实地反映产品质量波动的原因和变化规律,就必须要对质量数据进行适当的归类和整理。分层的目的在于把杂乱无章或错综复杂的数据加以归类汇总,使之能确切地反映客观事实。分层发常用于归纳整理所收集到的统计数据说。分层法常与其他统计方法结合来应用,如分层直方图法、分层排列图法、分层控制图法、分层散布图法和分层因果图法等等。24七、QC活动中常用的统计工具和方法(二)分层(Stratification)法2、分层法的原则和标志分层法运用的原则是:使同一层次内的数据波动尽可能的小,而层与层之间的差别尽可能的大,否则就起不到归类、汇总的作用。分层的目的不同,分层的标志也不一样。分层可以采用以下标志:1)人员:可按年龄、工级和性别等分层;2)机器:可按设备类型、新旧程度、不同的生产线和工夹具类型等分层;3)材料:可按产地、批号、制造厂、规格、成分等分层;4)方法:可按不同的工艺要求、操作参数、操作方法、生产速度等分层;5)测量:可按测量设备、测量方法、测量人员、测量取样方法和环境条件等分层;6)时间:可按不同的班次、日期等分层;7