农业无人机系统的可靠性工程方法初探珠海绿卫士/潘海洋2014年11月在生活中,对于任何一种民用产品或者武器系统,人们希望它不但具有优良的性能,价格适中,而且不易发生故障,经久耐用。后两者就是指产品的可靠性和耐久性。美国空军的提法,“可靠性与维修性是战斗力的乘数,今天的可靠性与维修性,就是明天的战斗力”。可靠性(Reliability)产品在规定的条件下和规定的时间内完成规定功能的能力。可靠性的概率度量称为可靠度。为了达到产品的可靠性要求所进行的一系列技术和管理活动。可靠性工程(ReliabilityEngineering)名词术语a.基本可靠性:产品在规定的条件下和规定的时间内,无故障工作的能力。确定基本可靠性值时,应统计产品的所有寿命单位和所有的关联故障。(寿命单位:产品使用持续期的度量单位。如工作小时、次数等。)(关联故障:在解释试验结果或计算可靠性值时必须计入的故障。)b.任务可靠性:产品在规定的任务剖面内完成规定功能的能力。(任务剖面:产品在完成规定的任务这段时间内所经历的全部事件和环境的时序描述。)c.固有可靠性:设计和制造赋予产品的,并在理想的使用和保障条件下所具有的可靠性。d.使用可靠性:产品在实际的环境中使用时所呈现的可靠性,它反映产品设计、制造、使用、维修、环境等因素的综合影响。可靠性试验1)目的a)发现产品在设计、材料、元器件和工艺方面的各种缺陷;b)确认是否符合可靠性定量要求,可靠性试验是产品在研制和生产阶段提高和验证可靠性的必要工作项目;c)改善产品的使用完好性、减小维修费用提供信息。可靠性是设计出来的,是制造出来的,也是试验出来的。2)分类环境应力筛选(ESS)工程试验可靠性研制试验(RDT)可靠性增长试验(RGT)可靠性试验可靠性鉴定试验(RQT)统计试验可靠性测定试验(RDT)可靠性验收试验(PRAT)名称目的应力水平及试验特性应用阶段环境应力筛选(ESS)产品出厂前剔除早期缺陷可使用加速应力,一般用快速温变循环和随机振动生产阶段,寻找设计、工艺缺陷研制阶段可靠性增长、鉴定、验收试验前消除早期故障(预处理)研制阶段生产阶段可靠性研制试验暴露缺陷,提高产品可靠性水平可以采用加速应力研制阶段早期可靠性增长试验寻找设计缺陷,以改进设计并验证改进措施的有效性,评估可靠性水平施加模拟真实的综合环境应力,有增长目标,有增长曲线,用杜安模型对增长过程跟踪,用AMSAA模型评估。研制阶段后期,环境鉴定试验后、可靠性鉴定试验前进行可靠性鉴定试验验证产品可靠性是否满足合同规定的要求,为定型(鉴定)和投产提供决策依据施加模拟真实的综合环境应力,使用统计试验方案得到的可靠性值是一定置信度下的区间范围。试验中的关联故障均用于计算观察值θ设计定型阶段可靠性验收试验验证产品可靠性是否保持其固有水平,为产品交付接受提供决策依据生产阶段e.其他名词术语产品:一个非限定性的术语,用来泛指元器件、零部件、组件、设备、分系统或系统。可以指硬件、软件或两者的结合。故障:产品不能执行规定功能的状态。失效:产品丧失完成规定功能的能力的事件。可靠性工程的实质可靠性工程是与故障作斗争的一门科学,其实质是研究产品故障的发生、发展、在故障发生后的诊断、修理、保障,以及如何预防产品故障的发生,直至消灭故障的规律。用通俗的话来说,可靠性系统工程是在研究产品“防病、治病”的规律。这与研究人类生命过程以及同疾病作斗争的医学系统工程颇有相似之处。可靠性工程期望达到的目的–设备尽可能不坏(连续工作时间长)–一旦坏了尽可能损失小(人-〉设施-〉设备)–快速修复,任务尽量不中断–可以通过保障计划延长寿命和进行故障预防,降低故障概率及潜在损失实现手段--可靠性设计Content•传统可靠性工程的局限•农用无人机应用环境的特点•适用的可靠性工程方法体系探索•案例及探讨农用无人机可靠性:效能-费用模型可靠性维修性保障性任务可靠性生存性可用性A可信性D能力C效能E=A*D*C全寿命费用LCC研发费用生产成本使用与保障E-LCC模型维修性三要素:(1)产品结构的维修方便性(2)修理人员的修理技能(3)维修系统的效能传统可靠性工程的应用局限•可靠性试验—验收/评估寿命•可靠性筛选—选择器件•冗余/降额—控制风险•FMEA—可靠性建模/评估问题:•HASS/HALT试验费时费力,设备环境要求高•在半导体器件高集成度,高工艺水平条件下,筛选可有可无•FMEA面临高复杂度和人机交互使用环境下,无能为力•模型复杂,非专业人士很难掌握方法和工具•冗余/降额成本太高•基于概率分析的可靠性分析方法和建模方法遇到数据不可获取情况下,要么无能为力,要么太理论化失去实用价值现有常规可靠性/耐久性验证•模拟5*7的实战作业–优点:接近实战环境,能验证配套设施–缺点:样本太少,受人的操作一致性影响太多,数据利用不充分(只有简单的故障记录),计算方法不规范(不具有可比性)。加大样本数的话,投入巨大。时间太长,需要更多的基础试验支持,不适合可靠性增长可维修产品的可靠性模型•修复时间和持续使用效能•影响范围–实际使用寿命–运行和维修/保修/保养政策–备件储备级别的设计–设计优化–软件升级策略•可靠性增长策略持续改进/可靠性增长策略•适用情况–通过评审的新产品–开发阶段产品–未达到要求的现有产品•试验本身只是暴露缺陷,本身并不会改善可靠性•在生命周期内,通过可靠性增长策略,能够减少保修期内维修,减少保养次数和成本,优化备件库存,减少客户及售后服务商负担,提升产品经济效益农用无人机生产环境的特点•环境较恶劣(温度、湿度、粉尘、日照、电磁辐射等)•使用较粗暴(搬运、操作、维护保养等)农用环境的可靠性需求•全生命周期的经济性•能够用于评价选择不同产品•农户、售后服务商、4S店的经营策略需要评估数据的支持及优化现实中和可靠性相关的经济性问题•保修多久才合适?•备件按什么计划准备?•成本如何测算?•人员计划和操作规程如何安排生产应用企业的考虑•经济性•实用性–切实提高交付–指导设计和工艺控制的持续改善–人员素质的掌握•简洁便利的应用考虑•备件,可维护性•维护品牌口碑声誉适用性的民品可靠性方法•经济性•简单易用•标准化/流程化•工具化可靠性方法融合•系统工程•硬件可靠性•软件可靠性(嵌入式)•结构可靠性•人机系统可靠性•环境因素变化影响•…..覆盖生命周期的闭环可靠性工程产品设计工艺设计制造使用和维护可靠性增长部件筛选定型鉴定设计验证失效分析/缺陷-故障库产品效能-成本分析以FMECA为核心建立可靠性增长机制•由失效发现缺陷,并追溯设计预防缺陷•针对失效模式设计测试方案•针对失效机理设计测试环境•设计缺陷预防:设计规则检查/评审•过程缺陷预防:过程控制核心方法工具•可靠性设计---设计规则检查表•适当降额规则•测试计划+FMEA—产品测试过程增加模式分析•DMS--全生命周期的缺陷记录与数据分析系统•ESS关键部件筛选•FTA故障树分析•后勤资源计划•全生命周期使用成本分析FMECA方法分类设计FMECA过程FMECA功能FMECA硬件FMECA软件FMECA损坏模式及影响分析DMEA核心方法:FMECA图FMECA方法的分类统计FMECA明确分析范围产品功能与任务分析明确产品的故障判据故障模式分析故障原因分析故障影响分析故障检测方法分析补偿措施分析危害性分析得出分析结果系统定义FMEAFMECA实施的步骤:代码产品或功能标志功能故障模式故障原因任务阶段与工作方式故障影响严酷度类别故障检测方法设计改进措施使用补偿措施备注局部影响高一层次影响最终影响(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)对每一产品采用一种编码体系进行标识记录被分析产品或功能的名称与标志简要描述产品所具有的主要功能根据故障模式分析的结果,依次填写每一产品的所有故障模式根据故障原因分析结果,依次填写每一故障模式的所有故障原因根据任务剖面依次填写发生故障的的任务阶段与该阶段内产品的工作方式根据故障影响分析的结果,依次填写每一个故障模式的局部、高一层次和最终影响并分别填入第(7)栏-(9)栏根据最终影响分析的结果,按每个故障模式确定其严酷度类别根据产品故障模式原因、影响等分析结果,依次填写故障检测方法根据故障影响、故障检测等分析结果依次填写设计改进与使用补偿措施简要记录对其它栏的注释和补充说明表16故障模式及影响分析(FMEA)表核心方法:失效分析1)目的和作用失效分析(FailureAnalysis)是通过对失效的元器件进行必要的电、物理、化学检测,并结合元器件失效前后的具体情况进行技术分析,以确定元器件的失效模式、失效机理和造成失效的原因。失效分析既要从本质上研究元器件自身的不可靠性因素,又要分析研究其工作条件、环境应力和时间等因素对器件发生失效所产生的影响。主要作用体现如下:1.找到影响元器件可靠性的根源,为改进设计、工艺提供依据,采取有效的纠正措施;2.在工艺控制、筛选等方面,为器件制造者和使用检验制定合理的方法和规范提供依据;3.判断元器件的失效是否属于批次性质量问题,为整批报废或整批元器件的使用提供决策依据;4.为用户合理选用元器件、整机可靠性设计提供依据;5.通过实施纠正措施,提高成品率和减小使用的故障率。2)适用范围(1)对关键的、重要的以及多次出现失效而未找到原因的元器件应进行失效分析,提交专门的或主管部门认可的失效分析机构进行,以便了解元器件失效机理,采取有效纠正措施。(2)对一般元器件的失效也应组织有关人员进行分析和试验,找出原因,并采取纠正措施。3)简要介绍(1)有关概念;(2)失效分类;(3)元器件和设备失效分析的原则;(4)失效分析工作方式和基本内容。(5)设备和元器件失效分析常用的方法(1)有关概念a.失效:产品丧失完成规定功能的能力的事件;b.故障:产品不能执行规定功能的状态;c.失效(故障)模式:失效(故障)的表现形式。如短路、开路、断裂、过度耗损等;d.失效(故障)机理:引起失效(故障)的物理的、化学的、生物的或其他的过程;e.失效(故障)原因:引起失效(故障)的设计、制造、使用和维修等有关因素。(2)失效分类a.按失效模式:有短路、开路、断裂等;b.按失效原因:有设计、制造、使用和维修等;c.按失效阶段:有早期、偶然期和耗损期;d.按失效程度:有部分和完全;e.按失效表现:有明显和隐蔽;f.按失效场合:有试验和现场;g.按失效的时间特性:有突然间隙渐变等;h.按失效的关联性:有关联、非关联、责任和非责任等;i.按失效后果:有轻度、严重和致命。(3)失效分析工作方式和基本内容失效分析是综合学科,它跨越各种领域并把相有关的技术综合在一起。失效分析有时需将元器件设计、制造、使用等几方的人员召集在一起,从元器件设计、制造、失效物理、使用、设备设计和制造以及可靠性管理等方面进行综合分析研究。只有这样才可能准确地找出失效的真正根源,提出纠正措施,防止这种失效模式和失效机理的重复出现。失效分析的主要内容包括:a.明确分析对象;b.确定失效模式;c.研究失效机理;d.判断失效原因;e.提出预防措施(包括设计改进)。4)失效分析工作程序(1)推荐的失效分析工作程序(工作程序不是固定不变的)a.明确失效分析的目的;b.失效情况汇总和分析;c.确认失效模式;d.根据失效模式,列出失效部位全部疑点;e.制定排除疑点的方案和方法;f.定位失效部位;g.提出导致失效部位失效的假设和采用分析技术与试验验证;h.通过验证提出对失效的纠正措施;i.验证纠正措施的效果,并在全部元器件中实施。例如:对微电路的失效分析实施技术项目约有20项左右,包括外观检查、电测试、X照相、密封性试验、PIND、开帽,再使用光学、电学、化学、力学等分析方法。可靠性问题分类•硬件可靠性•软件可靠性•机械(结构)可靠性•人件(manware)可靠性•系统接口可靠性核心方法:FTA故障树分析FTA是将一个不希望的产品故障事件或灾难性的产品危险事件做为顶事件,通过由上向下的严格按层次的故障因果逻辑分析,建立故障树。逐