注册可靠性工程师培训时间:2008.7.21-7.25地点:杭州培训目的和感受此次培训着重突出工程能力应用,而非很“玄”的学术研究。因此,老师在讲解时主要通过其在几十年的工作实践中的经验,教训转变成生动的例子,深入浅出的阐述了可靠性工程基础和相关概念。产品的高质量高可靠性是设计出来的,管理出来的,制造出来的。培训总结培训总结开展可靠性工作的基本思路:预防故障发现故障纠正故障验证纠正有效性和指标培训总结培训总结可靠性与性能相比的最大特点——随机性和不确定性培训总结一.可靠性工程基础二.可靠性试验三.可靠性设计与分析一.可靠性工程基础可靠性的基本概念可靠性定义:产品在规定的条件下和规定的时间内,完成规定功能的能力。“三个规定”是理解可靠性概念的核心。“产品”:新版ISO9000中定义的硬件和流程性材料等有形产品以及软件等无形产品。在这里,我只把“产品”定义缩小为零件,元器件,部件,设备或系统。规定的条件:工作条件:电压,负载,使用方法,维修方法,输出功率等。环境条件:温度,湿度,压力,振动,冲击,电场,磁场,电磁场等。储存条件:运输,保管等。规定的时间:指产品的生命周期(如交换机寿命20年,手机寿命5年,手机划盖工作寿命6万次,汽车寿命30万公里等)。产品的可靠性和时间呈递减函数关系。规定的功能:指产品标准或产品技术条件中所规定的各项技术性能(技术指标)。可靠性分类固有可靠性:产品在设计,制造中赋予的固有特性,是产品的开发者可以控制的。使用可靠性:产品在实际使用过程中表现出的一种性能的保持能力。基本可靠性:产品在规定条件下无故障的持续时间或概率,它反映产品对维修人力的要求。任务可靠性:产品在规定的任务剖面内完成规定功能的能力。故障(失效)定义及其分类故障:产品或产品的一部分不能或将不能完成预定功能的事件或状态。对于不可修复的产品,也称失效。故障(失效)机理:引起产品故障的物理,化学或生物等变化的内在原因。按规律分按后果分按统计特性分偶然故障:由偶然因素引起,重复出现的风险可以忽略,只能通过概率统计方法来预测。耗损故障:通过事前检测或监测可统计预测到,由于产品规定的性能随时间增加而逐渐衰退引起。致命故障:产品不能完成规定任务或导致人或物的重大损失,最终是任务失败。非致命故障:不导致任务失败,但导致非计划的维修。独立故障:不是由于另一个产品引起的故障。从属故障:由于另一个产品引起的故障。产品除可靠性以外的其余四性:维修性:产品在规定条件和时间内按规定程序和方法进行维修时,保持或恢复到规定状态的能力。测试性:产品(系统,子系统,设备或组件)能够及时而准确地确定其状态(可工作,不可工作或性能下降)并隔离其内部故障的一种设计特性。安全性:不导致人员伤亡,危害健康和环境,不给设备或财产造成破坏或损失的能力。保障性:系统的设计特性和计划的保障资源满足平时战备和战时使用要求的能力。可靠性、维修性、保障性与寿命周期费用关系可靠性基础术语可靠度:产品在规定条件下规定时间完成规定功能的概率,描述的是产品功能随时间保持的概率,即产品可靠度是时间的函数。可靠度函数表达式:R(t)=P(Tt)式中:T——产品发生故障的时间t——规定的时间可靠度的对立事件:F(t),同样是时间的函数累积故障分布函数表达式:F(t)=P(T≤t)因此:R(t)+F(t)=1试验故障统计表可靠度若产品的总数为N0,工作到t时刻产品发生的故障数为r(t),则产品在时刻的可靠度的观测值为:00NtrNtR故障率工作到某时刻尚未发生故障的产品数,在该时刻后单位时间内发生故障的概率,称之为产品的故障率。故障率一般用表示。一般情况下,可用下式进行工程计算:ttttNtrts平均故障(失效)前时间(MTTF)设个不可修复的产品在同样条件下进行试验,测得其全部故障时间为…。其平均故障前时间为:当产品的寿命服从指数分布时:0N,,21tt0Nt0101NiitNMTTF/10dteMTTFt平均故障(失效)间隔时间(MTBF)一个可修产品在使用过程中发生了次故障,每次故障修复后又重新投入使用,测得其每次工作持续时间为…。其平均故障间隔时间为:当产品的寿命服从指数分布时,其故障率为常数:0N,,21tt0Nt01001NTtNMTBFNii/1MTBFMTTF平均修复时间(MTTR)在规定的条件下和规定的时间内,产品在任一规定的维修级别上,修复性维修总时间与在该级别上被修复产品的故障总数之比。简单地说就是排除故障所需实际时间的平均值。其观测值是修复时间t的总和与修复次数之比:niintMTTR1/浴盆曲线大多数产品的故障率随时间的变化曲线形似浴盆,如图所示,故将故障率曲线称为浴盆曲线。产品故障机理虽然不同,但产品的故障率随时间的变化大致可以分为三个阶段:改变浴盆曲线就能尽可能的降低故障率可靠性试验是对产品的可靠性进行调查,分析和评价的一种手段。目的:通过试验发现产品设计,元器件,零部件,原材料和工艺方面的缺陷,以便采取有效的纠正措施,使产品可靠性增长。二.可靠性试验可靠性试验的一般分类和区别1.工程试验2.统计试验工程试验统计试验环境应力试验可靠性增长试验可靠性鉴定试验可靠性测定试验可靠性验收试验什么是环境应力试验?定义:通过在产品上施加一定的环境应力,以剔除由不良元器件、零部件或工艺缺陷引起的产品早期故障的一种工序或方法。环境应力不必准确模拟真实的环境条件,但不应超过设计的极限,其大小应根据产品总体要求确定。对电子产品施加的环境应力最有效的是随机振动和温度循环应力。不论是产品开发阶段,还是批生产阶段早期,环境应力筛选在元器件、组件、部件等产品层次上都应100%的进行。在批生产阶段后期,对组件级以上的产品可根据其质量稳定情况抽样进行。环境应力试验不能提高产品的固有可靠性,但通过改进设计和工艺等可以提高产品的可靠性水平。什么是可靠性增长试验?定义:在规定的环境应力下,为暴露产品薄弱环节,并证明改进措施能防止薄弱环节再现而进行的试验。规定的环境应力可以是产品工作的实际环境应力、模拟环境应力或加速变化的环境应力。可靠性增长试验是通过发现故障、分析和纠正故障、以及对纠正措施的有效性而进行验证以提高产品可靠性水平的过程。一般称为试验——分析——改进。增长试验包含对产品性能的监测、故障检测、故障分析及其以减少故障再现的设计改进措施的检验。什么是可靠性鉴定试验?定义:为了验证开发的产品的可靠性是否与规定的可靠性要求一致,用具有代表性的产品在规定条件下所作的试验叫可靠性鉴定试验,并以此作为是否满足要求的依据。可靠性鉴定试验是一种验证试验。验证试验就其方法而言是一种抽样检验程序,与其它抽样验收的区别在于,它考虑的是与时间有关的产品质量特性,如平均故障间隔时间(MTBF)。因此,产品可靠性指标的验证工作原理是建立在一定寿命分布假设的基础上。目前使用最多的是指数分布假设情形下的统计试验方案。转下页!常用的定时截尾试验方案方案序号方案特征参数鉴别比试验时间判别标准(失效次数)判断风险标称值%d=θ0/θ1(θ1的倍数)拒收数(r≥)(大于或等于)αβ110%10%1.545.037210%20%1.529.926320%20%1.521.118410%10%2.018.814510%20%2.012.410620%20%2.07.86710%10%3.09.36810%20%3.05.44920%20%3.04.331030%30%1.58.171130%30%2.03.731230%30%3.01.11表中的θ0、θ1、d、α、β均为统计试验的一些基本参数,它们的具体含义为:θ0——MTBF检验的上限值。它是可以接收的MTBF值。当试验产品的MTBF真值接近θ0时,指数分布标准型试验方案,以高概率接收该产品。θ1——MTBF检验的下限值。当试验产品的MTBF真值接近θ1时,指数分布标准型试验方案,以高概率拒收该产品。d——鉴别比。对指数分布试验方案d=θ0/θ1按照地点分类的可靠性试验三.可靠性设计与分析可靠性设计①规定定性定量的可靠性要求。最常用的可靠性指标是平均故障间隔时间,即MTBF。②建立可靠性模型。建立产品系统级、分系统级或设备级的可靠性模型,可用于定量分配、估计和评价产品的可靠性。③可靠性分配。可靠性分配是为了将产品总的可靠性的定量要求分配到规定的产品层次。通过分配使整体和部分的可靠性定量要求协调一致。它是一个由整体到局部,由上到下的分解过程。④可靠性预计。可靠性预计是在设计阶段对系统可靠性进行定量的估计,是根据相似产品可靠性数据、系统的构成和结构特点、系统的工作环境等因素估计组成系统的部件及系统的可靠性。系统的可靠性预计是一个自下而上,从局部到整体的系统综合过程。可靠性预计结果可以与要求的可靠性相比较,估计设计是否满足要求,通过可靠性设计还可发现组成系统的各单位中故障率高的单元,找到薄弱环节,加以改进。⑤可靠性设计准则。可靠性设计准则是把已有的、相似产品的工程经验总结起来,使其条理化、系统化、科学化,成为设计人员进行可靠性设计的所遵循的原则和应满足的要求。⑥耐环境设计。产品使用环境对产品可靠性的影响十分明显。因此,在产品开发时应开展抗振动、抗冲击、抗噪音、防潮、防霉、防腐设计和热设计。⑦元器件选用与控制。制定并实施元器件大纲是控制元器件的选择和使用的有效途径。⑧电磁兼容性设计。对电子产品来说,电磁兼容设计是不可缺少的。它包括静电抗扰性,浪涌及雷击抗扰性,电源波动及瞬间跌落抗扰性,射频电磁场辐射抗扰性等。⑨降额设计与热设计。元器件、零部件的故障率是与其承受的应力紧密相关的,降低其承受的应力可以提高其使用中的可靠性,因此设计时应将其工作应力设计在其规定的额定值之下,并留有余量。产品特别是电子产品周围的环境温度过高是造成其故障率增大的重要原因。因此应利用热传导、对流、热辐射等原理进行合理的热设计,以降低其周围的环境温度。⑩冗余与容错设计。“容错(faulttolerance)”定义:系统或程序在出现特定的故障情况下,能继续正确运行的能力。“冗余(redundancy)”定义:用多于一种的途径来完成一个规定功能。“容错”反映了产品或系统在发生故障情况下的工作能力,而“冗余”是指产品通过多种途径完成规定功能的方法和手段。“容错”强调了技术实施的最终效果,而“冗余”强调完成规定功能所采用的不同方式和途径。严格地说,冗余属于容错设计范畴。可靠性分析常用的可靠性分析有故障模式、影响及危害性分析(FMECA)和故障树分析(FTA)两种。这里主要介绍FMECA方法。FMECA是对产品所有可能的故障,并根据对故障模式的分析,确定每种故障模式对产品工作的影响,找出单点故障,并按故障模式的严酷度及其发生概率确定其危害性。所谓单点故障指的是引起产品故障的,且没有冗余或替代的工作程序作为补救的局部故障。包括故障模式及影响分析(FMEA)和危害性分析(CA)。FMECA分析方法的分类FMECA分析方法在产品寿命周期各阶段的应用论证与方案阶段工程研制阶段(含设计定型)生产阶段使用阶段方法功能FMECA·硬件FMECA·软件FMECA·DMEA过程FMECA使用中的FMECA目的分析研究产品功能设计的缺陷与薄弱环节,为产品功能设计的改进和方案的权衡提供依据。分析研究产品硬件、软件、工艺和生存性与易损性设计的缺陷与薄弱环节,为产品的硬件、软件、工艺和生存性与易损性设计的改进提供依据。分析研究产品的工艺过程的缺陷和薄弱环节,为产品工艺过程的设计改进提供依据。分析研究产品使用过程中实际发生的故障、原因及其影响,为提高产品使用可靠性和进行产品的改进、改型或新产品的研制提供依据。ThankYou!