IV.可靠性与风险管理本章目标A.术语与定义(例如MTTF,MTBF,MTTR,可利用率,失效率)B.可靠性寿命特性概念(例如,浴盆模型)C.可靠性系统设计(重复,系列,平行)D.可靠性和可维修性E.可靠性失效分析和报告F.可靠性/安全/危险评估工具产品的两类质量指标质量指标性能指标可靠性指标满足所规定功能的程度指标保持性能指标的能力可靠性的定义可靠性(Reliability)产品在规定的条件下和规定的时间内,完成规定功能和能力规定的时间时间是可靠性的核心,不谈时间就没有可靠性可谈。可靠性是时间的递减函数。规定的功能在可靠性中,产品丧失规定的功能成为实效(Failure),对可修复的产品也成为故障(Fault),一般不加以区别。规定的条件指产品的使用条件,如环境条件、维护条件和操作技术水平,同一产品在不同的使用条件下的可靠性会不同。条件是可靠性比较的基础。能力单一产品的失效存在不确定性,所以可靠性能力都使用了统计术语,如概率、函数,置信度等。基本概念可靠度函数R(t)某一产品(设备)在某一个时刻t之前不发生失效的概率,简称可靠度。R是t的递减函数不可靠度函数F(t)某一产品(设备)在某一个时刻t之前发生失效的概率,简称不可靠度。F(t)=1-R(t)失效概率密度函数P(t)dttdRdttdFtp)()()(基本概念失效率函数λ(t)在已工作到时刻t尚未失效的产品中,在时刻t后单位时间内失效的概率称为该产品在时刻t的失效率函数,简称失效率100个微波发射管,条t=4000h时有30个发生失效,4100小时的时候失效个数增加至35个,求:t=4000h和4100h时的可靠度Rt=4000h时的失效率λ)()()()()()(tRtptRtttRtRt基本概念当失效时间的衡量单位为小时(h)时,由失效率的定义可知,失效率的单位为:失效率的基本单位为菲特(Fit),其定义为:个失效小时后只有个产品工作指的是每21000100102)1000()1000/(%2102)1000(***)()()()(15151hhhhtRtttRtRt...101011010001110154619hhh(个)(个)(个)(个)菲特菲特基本概念我国的电子元器件的可靠性登记就是按失效率大小来制定的。我国电子元器件的可靠性按失效率共分七级,其级别和失效率如下:级别名称符号最大失效率亚五级Y3*10-5h-1五级W1*10-5h-1六级L1*10-6h-1七级Q1*10-7h-1八级B1*10-8h-1九级J1*10-9h-1十级S1*10-10h-1基本概念平均失效前时间(MTTF)产品失效前工作时间的期望值对于可修复的产品,MTTF表示为首次失效前的平均工作时间平均寿命(θ)平均失效间隔时间(MTBF)用于可修复的产品当失效率λ恒定时,则:ntnii0总体中产品的数量个产品总体总第::niirTMTBF失效数总工作时间::rT1MTBF术语汇总失败密度函数P(t)可靠度函数R(t)不可靠度函数F(t)失败率函数λ(t)平均失效前时间MTTF平均失效间隔时间MTBF(λ恒定时,MTBF=1/λ)可靠性的分布基础要确定以上的可靠度有关的函数,必须确定产品可靠性的模型。人们发现,以下的分布能够拟合大部分产品的可靠性模型:正态分布对数正态分布指数分布威布尔分布以上分布都是随机变量t所服从的分布正态分布应用产品的磨损失效分布往往足够服从正态分布。正态分布中,失效密度函数为:222)(21)(tetp标准正态分布概率密度值可查附表而得可靠度和不可靠度都可以通过t对进行Z转换后查标准正态分布表而得。)()()()(tTPtRtTPtF>例子发电动服从正态分布,μ=300h,σ=40h,求任务时间为250h时,发动机的可靠度和200h时的失效率。对数正态分布对数正态分布是随机变量的自然对数呈正态分布的一种分布,其密度函数为:222)(ln21)(tettp可靠度和不可靠度都可以通过对进行Z转换后查表标准正态分布而得μ:lnt的均值σ:lnt的标准差)()()()(tTPtRtTPtF>tZln例子炮管失效规律服从对数正态分布,μ=7,σ=2(μ和σ是lnt的均值和标准差),求发射1000发炮弹时可靠度。指数分布指数分布可能是可靠度工作中最重要的一种分布,而且几乎专门用于电子设备的可靠度预测上。指数分布的优点是:λ恒定而且容易估计数学上容易处理实用性广泛具有可加性其应用场合包括:失效率随着工作时间的增长没有显著变化的产品没有过多余度的复杂、可修复的产品某一合理的时间内已经经过老练处理而消除了早期失效的设备指数分布密度函数为:11)()()(MTBFetRetptt对于可修复的产品:平均寿命例子某一计算机的错误率是恒定的,即每连续工作17天发生一次失效。设有一个任务需要连续使用该计算机5个小时,求成功解决这个问题的可靠度是多少?威布尔分布威布尔分布用来对广泛的波动分布进行预测,这些分布也包括了正态分布和指数分布:由于这些分布涵盖了许多分布因此降低了对不同分布应用不同预测方法而带来的麻烦。威布尔分布由三个参数决定:β:形状参数:反应了曲线的模式β=1,指数分布;β=2,对数正态分布;β=3.5,近似正态分布η:尺度函数或特征寿命(在该寿命时总体中的63.2%的个体将会发生失效γ:位置函数:最低的寿命,一般取γ为0威布尔分布密度函数:在大多数情况下,γ=0,那么密度函数变为:)(1)()(tettp)()(1)()()(ttetRettp案例某种特定的发射管的失效时间服从威布尔分布,其中β=2,η=1000h,求当任务时间为100h时这些发射管中1支管子的可靠度即失效率。失效模型的建立建立失效模型是可靠性工程中一项重要的工作,其对可靠性的预计、系统设计和分析、试验和验证程序的建立以及控制程序的建立有重要的意义。一个被广泛认可的失效模型即为“浴盘曲线”模型。“浴盘曲线”模型“浴盘曲线”模型特别适用于电子设备和系统,它分成以下三个时期:早期故障期初期具有较高的失效率,造成失效的原因通常是设计不良、使用了不合格的元器件、或者是生产过程中缺乏有效的质量控制所致。使用寿命期具有恒定的失效率在此期间的失效往往是偶然的,引起失效的原因往往是随机原因或偶然原因引起的可靠性工作关注的主要是这一阶段使用寿命期失效的分布服从指数分布耗损期失效率上升,这是老化和损耗的结果这一时期的失效往往服从正态分布失效分布的识别(供参考)识别失效所服从的分布可从多个方面进行,如果收集了相关的时效时间的数据就可以识别出时效时间所服从的分布。例子:收集了历史上失效的100个零件的失效前的工作时间,利用Mintab识别此零件失效错服从的分布。使用Minitab文件:失效时间.mtw选择菜单:统计质量工具个体分布标识,并如下设置对话框:选择候选分布失效分布的识别(供参考)“P”最大的分布最有可能是失效服从的分布可靠性系统的设计简单结构的可靠性模型串联结构并联结构串联结构+并联结构K/N结构串联结构串联结构是可靠性数学模型中最简单和最常见的一种结构,在这种结构中,系统能否正常工作取决于所有部件是否能够正常工作。串联结构如何每个部件的失效率λ是恒定的,则:这就是指数分布系统的可加性。niinstRtRtRtRtRtR1321)()(...)()()()(R1(t)R2(t)R3(t)R4(t)Rn(t)......假定任何一个部件的失效和其他部件没有关联,如果存在关联就需要考虑条件概率1......)(321321ntttttseeeeetRnθ:系统的平均寿命并联结构在并联系统中,假设所有的部件都处于工作态度,所有的部件都失效系统才失效。系统的不可靠度和可靠度为:并联结构是冗余设计思想的基础。R1(t)R2(t)R3(t)Rn(t)并联结构)(1)()()(...)()()()(1321tFtRtFtFtFtFtFtFssniins串联结构+并联结构实践中,串联结构+并联结构的组合结构更加常见。如下例系统的方框图。问题:以上组合系统的可靠度是多少?当系统很复杂时,利用计算机进行可靠性分析是可行的方法R1=0.8R3=0.8R2=0.9R7=0.7R4=0.8R5=0.9R6=0.9abcdcK/N结构如果系统由N个部件或分系统组成,而系统成功完成任务只需其中的K个部件或者分系统工作时,这种系统称为K/N系统(KN)例如:发射4枚导弹打击目标,每枚导弹成功击中目标的几率为0.9,只要至少三枚导弹击中目标就能把目标摧毁,问任务成功的几率(可靠度)是多少?可维修性可维修性(Maintainability)的定义产品在规定的条件下和规定的时间内,按规定的程序和方法进行维修时,保持或恢复执行规定状态的能力。维修分为以下两类:预防性维修为了避免设备故障而采取的预防性清洁和润滑,定期检查,必要的功能检验,定时拆修,定时报废更换等措施。恢复性维修故障发生后,识别鼓掌类型,修理故障,使产品恢复到可执行任务的规定状态所进行的维修活动。可维修性主要指的是恢复性维修。维修度可修复产品从出现故障开始到修理完毕所经历的时间T称为维修时间,在{0,t}时间内能完成维修工作的概率称为维修度,记为G(t)。G(t)=P(T≤t)G(t)是T的分布函数,常用的维修分布为指数分布或者对数正态分布,其中,对数正态分布得到最广泛的使用。维修性的基本概念修复时间的概率密度函数:维修率平均恢复时间(MTTR)成功维修时间的期望值可用以下公式估计:dttdGtg)()(服从对数正态分布或者指数分布ti:第i次维修时间)(1)()(tGtgtniitnTRTM11ˆ例子某产品生产现场有多台设备,在一周内共发生24次故障,其维修时间分别为(min):MTTR的估计值是多少?5528125475853368851110407564115485260728710555826665P分位维修时间修复P(%)的所有系统失效所有时间称为P分位维修时间。如100mins可以完成95%的维修任务,则100mins为0.95分位维修时间。通常有以下的分位时间:中位维修时间t0.5最大维修时间tmax(t0.95)最大维修时间是产品设计中要考虑的一个指标。可靠性和可维修性比较可靠性可维修性密度函数p(t)密度函数g(t)可靠度R(t)可维修度G(t)失效率λ(t)维修率μ(t)故障前平均工作时间MTTF平均修复时间MTTR可用性可用性(Availability)针对的是可修复的设备或者系统,其是对在某一时刻设备正常工作的概率。常用的可用性指标为可利用率(可用度):固有的可利用率达到的可利用率MTTRMTBFMTBFAiAi不包括预防性维修时间,行政时间和后勤时间。MWT:平均等待时间,组织的效率的衡量。MWTMTTRMTBFMTBFAA总时间开机时间总时间停机时间1ˆAA可靠性/安全/危险评估工具1.FMECAFMECA故障模式、影响与危害度分析(FMECA)是可靠性分析的一种重要方法,它由两部分(阶段)组成:FMEA+CA通过FMECA,能够:选择一种具有工作成功高概率的人员安全高概率的设计由来评估故障模式及其对系统工作成功的影响的同一形式的成文方法系统接口问题的早期预见性按鼓掌影响分类及其发生的概率可以排列出的可能的鼓掌一览表对任务成功或人员安全为致命的单一故障点的识别试验计划的早期准则输入到可