第二章常用统计技术第一节统计方法基础知识第二节方差分析第三节正交实验设计第四节相关和回归分析QualityControl-----QCQualityImprovement------QIQualityManagement-------QMQualityEngineering-------QE质量数据的特点:不确定性、随机性、波动性、变异性;确定统计规律、分布特征统计学(Statistics)统计学是通过研究数据(资料),包括数据的产生、收集、整理、描述、分析和推断,发现新知识和有用的信息,从而对所研究的问题给出解答和说明的一门学科。统计学任务:统计方法(statisticalmethods)统计方法是指统计学中关于数据的产生、收集、整理、描述、分析和推断等方面所采用的方法。(1)思考性方法(thinkingmethods,情理型方法或非定量统计方法)(2)描述性统计(descriptivestatistics),数理统计方法或定量统计方法):描述统计这一术语是概括并表示定量数据,以显示数据分布特性的方法。统计技术(StatisticalTechnologyforQuality)统计技术是指运用统计学的方法原理,通过获取和提炼信息,高效益地解决实际问题的一门通用技术。因此,统计方法的应用就是统计技术,它是统计方法成功实践的经验积累,是一门技术。tocollectinformation——toarrangement&toprocessdata——toreduce&refineinformation——statisticallytoanalysis&tooperate——statisticallytoinfer&topredict,tocontrol采集信息——整理、加工数据——提炼和精练信息——统计分析和运算——统计推断和预测统计控制统计技术按用途分为:(1)统计推断:依据样本提供的信息,通过统计计算和分析,对事物进行预测和推断。例如参数估计、假设检验、方差分析等。(2)统计控制:依据样本提供的信息,通过统计计算和分析,认识事物发展的现状、预测事物发展的趋势,并采取措施对过程实施有效的控制。例如过程能力分析,控制图等。统计技术应用的场合可以是:(1)获取信息:通过科学地进行观测、调查或试验,从而经济有效地获取数据资料;(2)提炼信息:运用所获得的数据资料,用统计分析方法对实际问题的规律性及其因果关系进行科学地分析和推断。第一节统计方法基础知识一、统计方法及其用途二、产品质量的波动三、质量特性数据及其分类四、质量特性数据的采集(一)总体和个体(二)数据的采集随机抽样方法五、统计特征数六、质量特性数据的分布特点和分布规律一、统计方法及其用途1、、什么是统计方法2、、统计方法的性质3、、统计方法的用途1、什么是统计方法统计方法:是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。包括:统计调查,信息采集——数据整理——统计分析——统计推断描述性统计方法:——是对统计数据进行整理和描述的方法;——常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等。推断性统计方法:——是在对统计数据描述的基础上,进一步对其所反映的问题进行分析、解释和作出推断性结论的方法;——思考性统计方法(thinkingmethods,情理型方法或非定量统计方法)2、统计方法的性质1.描述性——利用统计方法对统计数据进行整理和描述,以便展示统计数据的的规律;——统计数据可用数量值加以度量,如平均数、中位数、级差和标准差等,亦可用统计图表予以显示,如条形图、折线图、圆形图、频数直方图、频数曲线等。2、规律性——定量分析、从不确定中发现统计规律,找出趋势和倾向。特别注意异常波动的发生。3、推断性——统计方法都要通过详细研究样本来达到了解、推测总体状况的目的,因此它具有由局部推断整体的性质。4、风险性——统计方法既然要推断用部分整体,那么这种由推断而得出的结论就不会是百分之百正确,即可能有错误。犯错误就要担风险。两类错误和风险第一类错误(弃真错误):把质量好的一批成品当作质量坏的一批成品去看待、处理的错误;α:第一类错误的概率值,也叫第一类错误的风险率。第二类错误(取伪错误):把质量坏的一批成品当作质量好的一批成品去看待、处理的错误;:第二类错误的概率值,也叫第二类错误的风险率。β返回目录3、统计方法的用途1.提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差)2.比较两事物的差异;(假设检验、显著性检验、方差分析、水平对比法)3.分析影响事物变化的因素;(因果图、调查表、散布图、分层法、树图、方差分析)4.分析事物之间的相互关系;(散布图、试验设计法)5.研究取样和试验方法,确定合理的试验方案;(抽样方法、抽样检验、试验设计、可靠性试验)6.发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图)7.描述质量形成过程。(流程图、控制图)二、产品质量波动1、正常波动2、异常波动——chancecausesofvariation——assignablecausesofvariation1、正常波动——正常波动是由随机原因引起的产品质量波动;——仅有正常波动的生产过程称为处于统计控制状态,简称为控制状态或稳定状态。2、异常波动——异常波动是由系统原因引起的产品质量波动;——有异常波动的生产过程称为处于非统计控制状态,简称为失控状态或不稳定状态。引起产品波动的原因主要来自六个方面(5M1E):人(Man):操作者的质量意识、技术水平、文化素养、熟练程度、身体素质等;机器(Machine):机器设备、工夹具的精度、维护保养状况等;材料(Material):材料的化学成分、物理性能和外观质量等;方法(Method):加工工艺、操作规程和作业指导书的正确程度等;测量(Measure):测量设备、试验手段和测试方法等;环境(Environment):工作场地的温度、湿度、含尘度、照明、噪声、震动等;3、波动的原因三、质量特性数据及其分类质量特性数据:定量分析是现代质量管理中的基本特征之一。为了进行定量分析,就必须有数据描述产品质量特性的数值和信息。检测产品质量特性的结果,用数值记录下来。质量特性数据分为:1、计量数据——VariablesData2、计数数据——AttributesData.又分为计点和计件1、计量数据—VariablesData——凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据。如:长度L=1.55m、噪声n=52.3电流I=3.2A还有容积、直径\质量、化学成分、温度、产量、职工工资总额等。——计量数据一般服从正态分布。continuousmeasurements2、计数数据-AttributesDatadiscretedata,oftenintheformofcounts.——凡是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3•••等自然数的这类数据。——计数数据还可细分为计件数据和计点数据。计件数据是指按件计数的数据,如不合格品数、彩色电视机台数、质量检测项目数等;计点数据是指按缺陷点(项)计数的数据,如疵点数2个/cm2、砂眼数4个/cm2、气泡数、单位(产品)缺陷数等。——计件数据一般服从二项式分布,计点数据一般服从泊松分布。——当数据以百分率表示时,要判断它是计量数据还是计数数据,应取决于给出数据的计算公式的分子。四、质量特性数据的采集(一)总体与样本统计学任务:1、研究总体的分布是什么?2、这个总体的均值、方差是多少?总体(母体):是指在某一次统计分析中研究对象的全体。个体:组成总体的每个单元(产品)叫做个体。有限总体:被研究对象是有限的,如一批产品的总数;无限总体:被研究对象是无限的,如某个企业、某个生产过程从前、现在、将来生产的全部产品。总体含量(总体大小):总体中所含的个体数,常用N表示。(一)总体与样本样本(子样):是指从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(产品);样本是由1个或若干个样品组成的。样本容量(样本大小):样本中所含的样品数目,常用n表示。抽样:是指从总体中随机抽取样品组成样本的活动过程。随机抽样:是指要使总体中的每一个个体(产品)都有同等机会被抽取出来组成样本的活动过程。(一)总体与样本数据、样本和总体的关系无限总体有限总体工序一批产品一批半成品样本样本数据数据判断判断目的总体样本数据对工序进行分析控制对一批产品质量进行判断,确定是否合格(二)随机抽样方法1、简单随机抽样法2、系统抽样法3、分层抽样法4、整群抽样法1、简单随机抽样法——又叫随机抽样法,是指总体中的每个个体被抽到的机会是相同的。优点:抽样误差小缺点:抽样手续比较繁杂。2、系统抽样法——又叫等距抽样法或机械抽样法。优点:操作简便,实施不易出差错。缺点:容易出较大偏差。适用场合:总体发生周期性变化的场合,不宜使用这种方法。3、分层抽样法——也叫类型抽样法。它是从一个可以分成不同于总体的总体(或称为层)中,按规定的比例从不同层中随机抽取样品(个体)的方法。优点:样本的代表性比较好,抽样误差比较小。缺点:抽样手续较简单随机抽样还要繁杂。适用场合:常用于产品质量验收。4、整群抽样法——又叫集团抽样法。是将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽取若干群,并由这些群中的所有个体组成样本。优点:抽样实施方便。缺点:代表性差,抽样误差大。适用场合:常用在工序控制中。案例某种成品零件分装在20个零件箱装,每箱各装50个,总共是1000个。如果想从中取100个零件作为样本进行测试研究。简单随机抽样:将20箱零件倒在一起,混合均匀,并将零件从1~1000编号,然后用查随机数表或抽签的办法从中抽出编号毫无规律的100个零件组成样本。系统抽样:将20箱零件倒在一起,混合均匀,并将零件从1~1000编号,然后用查随机数表或抽签的办法先决定起始编号,按相同的尾数抽取100个零件组成样本。分层抽样:20箱零件,每箱都随机抽取5个零件,共100个组成样本。整群抽样:先从20箱零件随机抽出2箱,该2箱零件组成样本。五、统计特征数(一)样本平均值(二)样本中位数(三)样本方差(四)样本标准偏差(五)样本极差表示数据的集中位置表示数据的离散程度NumericalSummaryofDataImportantsummarystatisticsforadistributionofdatacaninclude:Samplemean,(平均值)Samplevariance,s2(样本方差)Samplestandarddeviation,s,(标准差)Samplemedian,(中位值)Mode(众数)xxˆ(一)样本平均值niixnx1_1如果从总体中抽取一个样本,得到一批数据X1,X2,X3….Xn,则样本的平均值::样本的算术平均值;n:样本大小。(二)样本中位数和样本众数把收集到的统计数据X1,X2,X3….Xn,按大小顺序重新排列,排在正中间的那个数就叫作中位数,用符号来表示。当n为奇数时,正中间的数只有一个;当n为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。21~nxx12122~nnxxx众数是指收集到的统计数据X1,X2,X3….Xn,按大小顺序重新排列,其中出现频数最高的那个数用符号表示。xˆ(三)样本方差样本方差是衡量统计数据分散程度的一种特征数,其计算公式:S2:样本方差;:某一数据与样本平均值之间的偏差。(四)样本标准偏差国际标准化组织规定,把样本方差的正平方根作为样本标准偏差,用符号S来表示。其计算公式:(五)样本极差极差是一组数据中最大值与最小值之差。常用符号R表示,其计算公式:R=Xmax-Xmin(六)变异系数——用于不同数据集的分散程度的比较xscxsC