第二章数理统计基础及应用统计质量控制的概念为了贯彻预防原则,应用统计技术对过程中的各个阶段进行评估和监察,从而保证产品与服务满足要求的均匀性。统计质量控制的重要性质量是变化的、有规律的统计质量控制的特点与全面质量管理相同,强调全员参与,而不是只依靠少数质量管理人员强调应用统计方法来保证预防原则的实现可判断过程的异常,及时告警;一、质量波动及原因分析1.质量的影响因素:影响工程质量的因素有五种,人、材料、机械、方法和环境(4M1E)。由于这五个方面随时都在发生变化,因而工程质量也是不断在变化。2.利用统计分析的目的应用数理统计的方法加以整理,就可以从这种波动性的特性中找出影响质量变化的因素,从而改进生产,提高工程质量和效益。3.影响因素的类型按照质量因素变动对生产过程影响的程度和消除它们的可能性,可将这些因素分为两大类:正常作用因素和不可避免因素。4.正常作用因素经常作用因素又称为随机因素或偶然因素,它们对工程质量特征值产生的影响具有以下特征:①误差得出现无确定的规律性,无法预知影响结果,大多具有偶然性。②随着同一特征值测量次数增多,这种误差的平均值趋向于零。③对同一质量特征值,数量相等,符号相反的随机误差出现概率大致相同。④值小的随机误差比值大的随机误差出现频率要大。5.偶然因素的评述在工程中,材料的性能、成分的微小变化(称量误差)、工人操作的微小变化、机械设备的正常磨损、环境条件的细微变化等都属于这种情况。根据它的特征用数学表达式来表示,是正态分布函数,这种误差在工程中是不可避免的,只要质量波动在允许的范围内,就不必纠正,是生产过程中的正常现象。在一定的科学技术条件下,要强行消除这类因素,不仅在技术上难以达到,而且也不经济。6.可避免因素称为系统性因素或非偶然因素,其对质量特征值的影响具有以下特征:(1)这种误差与某一因素有明显的相关关系,可能是某一因素的函数,也可能是一个常数。(2)如果重复测量某一相同质量特征值,系统误差可能重复出现,且正负号不变。(3)测量的结果经过修正后,可接近实际值。6.可避免因素评论这种质量误差与某一因素有明显的相关关系,用数理统计的方法进行分析,可以很快找出原因,加以纠正,使误差值控制在要求的范围内。但是,既是误差并不超出允许的范围,这种误差也有可能存在,也应找出原因加以纠正。因此,在任何情况下,纠正系统误差都是必要的。用数理统计的方法不断地找出这种系统误差及其原因,在生产过程中加以调整和消除,使工程的质量和效率得到提高,这是质量管理的目标和任务。第一节数理统计基础数理统计的基本思路就是抽取少量数据(样本),用数理统计的方法对取得的数据进行分析研究,以此来分析总体产品的质量状态、产生质量波动的原因以及预防措施。在实际工程中,我们控制某一工程的质量,不可能采用全额检查(全数检验,人力、物力、时间有限),而是按一定的频率抽验(抽样检验),根据抽验的结果来分析、研究、推测总体的质量,因此,数理统计方法有很强的实用性。一、总体、个体和样本的概念(1)总体:也称母体,是分析对象的全体。(2)个体:组成总体的每个单元。比如:要分析路基的压实情况,总体是这段路基上所有各点的压实度值,个体为段内每个点的压实度值。总体中含有个体的数目通常是用“N“表示。总体是一批产品时,N是一个有限值,称为有限总体。总体是一个连续的过程时,它包含过去、现在和将来的产品,N是无限的,称为无限总体。总体的说明在统计方法中,所研究的问题不是一个具体的特性,而是讨论其代表特性的数据。例如路面的强度、厚度、平整度是否达到要求,这些个体的特性数据的集合就能判断路面是否达到规定要求。因此总体的内容不仅要表明所指的对象,还要看所了解的特性是什么。一、总体、个体和样本的概念(3)样本:又称为子样。是从总体中随机抽选出来的一部分个体。样板含个体数目的多少通常是用“n“表示,称为样本容量,通常是1<n<N。样本的容量越大,越能反映总体的实际特征,规范上规定的检查频率就是根据样本的最小容量来确定的。即至少应检测多少才能反映其基本特征。二、质量数据•质量数据反应产品的某项质量特性指标的原始数据。•质量数据的作用质量信息的重要组成部分,工程质量控制、评价是以数据为依据,“一切用数据说话”•质量数据的来源工程建设中的各种检验:即材料检验、工序检验、竣工验收检验;使用过程中的必要检验二、质量数据质量数据的分类计量值数据可以连续的数据;长度、厚度、直径、强度等计数值数据不能连续取值,只能计算个数。表示方法:1.直接用计数出来的次数、点数表示2.Pn数据与总检测次或点数相比二、质量数据质量数据的特性1.差异性工程质量波动性2.规律性存在一定规律二、质量数据质量数据的修约出现规定程度精度范围之外的数字的取舍问题。奇升偶舍法四舍五入法三、数据统计特征量统计特征量的两类:•表示数据的集中位置算数平均、中位数•表示数据的离散程度极差、标准离差、变异系数三、数据统计特征量1)样本平均值(又称算术平均值):它是反映变量的平均水平。niixnx11Xi——样本(抽样数据)i=1、2、3……n。N——样本容量数据统计特征量(2)中位数:全部数据由小到大排列,位置居中的数据。为偶数为奇数nxxnxXnnn)(2~12221数据统计特征量(3)极差:数据中最大值与最小值之差;它反映数据变化的幅度,不反映样本的变化分布。极差易受极端数据的影响。minmaxxxR(4)标准偏差:反映质量数据分散程度。2)(11xxnSi(5)变异系数:表示数据相对波动大小的指标,Cv值越小表示离散性越小,则均匀性越好。%100*xSCv例2.1四、数据的分布特征质量数据具有一定的规律性,这种规律性一般用概率分布来描述。•正态分布•t分布1.正态分布正态分布的概率密度函数222)(21)(xexf平均值u是f(x)曲线的位置参数,决定曲线最高点的横坐标;标准差delta是f(x)曲线的形状参数,它反映了曲线的宽窄程度。正态分布的特征1.正态曲线(normalcurve)在横轴上方均数处最高。2.正态分布以均数为中心,左右对称。3.正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用表示均数为,方差为的正态分布。用N(0,1)表示标准正态分布。正态分布的特征①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数和标准差S分别代替μ和σ,按式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。4.正态曲线下面积的分布有一定规律。态分布曲线下有三个区间的面积应用较多,①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布时区间(μ-1.96σ,μ+1.96σ)的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ,μ+2.58σ)的面积占总面积的99%。如图3.2所示。正态分布的特征正态分布的双置信区间单边置信区间t分布从平均值为、方差为2的正态总体中抽取容量为n的一个样本,其样本平均数服从平均值为,方差为2/n的正态分布,因此,但是总体方差2总是未知的,从而只能用s2来代替,(1)如果n很大,那么,s2就是2的一个较好的估计量,仍然是一个近似的标准正态分布;(2)如果n较小,s2常常与2的差异较大,因此,统计量就不再是一个标准正态分布,而是服从t分布。t分布的特征1、t分布是对称分布,且其均值为0。2、当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1,t分布也就趋近于标准正态分布。3、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。4、与标准正态分布相比,t分布的中心部分较低,2个尾部较高。5、变量t的取值范围在—∞与+∞之间。五、可疑数据的取舍对可疑数据应该用数理统计的方法判断其真伪,并决定取舍。常用方法:拉依达法肖维纳特法格拉斯布法五、可疑数据的取舍取舍方法:归纳三种方法,可用一个表达式表示,即注:拉依达法k=3.0、肖维纳特法k=f(n)、格拉布斯法k=f(α,n);f(n)及f(α,n)查表2-1和表2-2(P40~41)KSxxi五、可疑数据的取舍例子2.3第二节常用的数理统计方法与工具工程质量控制与评价是以数理统计方法作为基本手段。质量控制中比较常见而有效的统计方法有:直方图、排列图法、因果分析图法、控制图法、相关图法和统计调查法一、频数直方图法(1)、质量特征数据收集。(2)、确定组数B(举例时B=10比较好)和计算组距h(3)、确定界值(4)、统计频数(5)、作图(6)、直方图的利用(7)、质量状态及施工能力判断2)12(2)32(22minminminminhixhixihxhx上界组下界第上界第一组下界BRh组数极差组距直方图的应用1)估计可能出现的不合格率2)考察工序能力3)判断质量分布状态4)判断施工能力1)估计可能出现的不合格率质量控制标准界限值:上限、下限不合格率:换算为标准正态分布:查表等方法计算概率2)考察工序能力工序能力:工序处于稳定状态下的实际生产合格产品的能力。工序能力指数Cp:质量标准范围T与该工序生产精度的比值。工序能力指数的计算:3)判断质量分布状态6种常见的直方图分布及其解释二、控制图法控制图是通过对过程中各特性值进行测定、记录、评估和监察过程是否处于控制状态的一种用统计方法设计的图。在控制图中有两条平行的上下控制界限和中心线,并有按时间序列排列的样本统计量数值的描点序列。如果控制图中描点落在控制界限之内,则表明过程正常;若控制图中描点落在控制界限之外或描点序列在界限之间有某一种或几种不正常的趋势,则表明过程异常。控制图的原理控制图法的做法(1)、质量特征数据收集(容量50~100)(2)、列表计算每层或每个工作日的平均数和极差(3)、计算样本平均数和极差平均值。(4)、计算控制界限(5)、作图(6)结果分析SxLCLSxUCLxCL33三、相关图法(1)、根据收集数据作相关图(Y〈结果〉;X〈要因〉)(2)、判断相关性(见P60图2–10)相关程度高注:相关系数其中:回归方程1)())((121yyxxxyniixxniiixyxxxyLLLrxxLxbyayyxxLLLbbxay(3)、进行回归分析相关图的应用1)确定两变量(因素)之间的相关性2)变量控制当变量之间的关联性很强时,对容易控制的变量间接控制3)回归分析确定变量之间的定量表达式——回归方程第三节抽样检验基础检验的定义:通过测量、试验等质量检测方法,将工业产品与其质量标准相比较做出的质量判断过程。检验的分类:检验可分为全数检验和抽样检验两大类。抽样方法正确与否,直接影响到数理统计分析结果的可靠性和客观公正性。为了达到分析结果的客观公正,必须采用正确的抽样方法。一、抽样检验的类型非随机抽样:此法不科学,抽样结果受人的主观因素影响大。因此,在工程中不能使用。(但有时可取、质量要求高)随机抽样:抽样数据消除了人的主观因素影响,其分析结果客观公正。因此,在工程中普遍使用。抽样检验的条件(1)要明确批的划分:例如抽样检验水泥、沥青等材料的质量特性时,应将相同厂家、相同品种或标号的产品作为一批。(2)必须抽取能代表批的样本。(3)要明确检验标准,即明确的标准要求。(4)要有统一的检测试验方法。二、随机抽样的方法单纯随机抽样:在总体中直接抽取样本。利用随机数表、掷骰子