FMEA方法培训

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT)课程目的1、概述--通信网的可用性接入层骨干网设备层骨干网接入层骨干网设备层骨干网骨干网1、设备都是通信网络中的一个接点,网络的可靠性或者说端到端的可靠性是用户最终关心的。不能仅仅关注设备可靠性而忽视组网、网络其他部件对可靠性的影响;2、不同网络层次的设备有不同的可靠性要求。核心层设备偏重于HA,中间层设备偏重于成本与HA的良好结合,终端设备偏重于成本与返修率;3、HA不仅仅包括设备软、硬件的HA,而且包括计划性中断、人为差错等的HA,所以也要关注升级、数据配置、补丁等造成的业务中断;4、需求的落实需要可靠性工程师对产品设计方案的了解,需求跟踪,FIT测试验证。更需要开发人员的并肩作战。HA网络级HA设备HA人为差错HA系统HA连接设备HA计划性活动HA交换模块HA线路处理模块HA平台软件模块HA主控模块HA电缆HA背板HA硬件HA软件HA机电模块HA服务器模块HA………………功能框1HA功能框2HA功能框3HA……产品的可靠性可以理解为三个规定,即规定条件下、规定时间内、产品完成规定功能的能力。从用户的角度考虑,可简单地理解为几个层面的要求:硬件故障,仅对性能有部分影响,设备的功能不受损。硬件不出故障硬件故障,设备部分或全部功能受损。但能尽快恢复业务。第二层面第一层面第三层面1、概述--可靠性的层次电路应用规范、器件应力降额、环境适应性、EMC、防护、安规、HALT试验等冗余、倒换策略,倒换条件完善,数据备份策略故障检测、隔离,定位,维修性等元器件降额分析可靠性FMEA、CA分析系统结构的考虑。如冗余、负荷分担。其他容错设计故障检测。重要故障需要“知情”。检测灵敏度;故障隔离。能隔离到影响最小,定位到FRU;故障恢复。倒换策略、复位、重启、数据恢复等;故障测试验证。重要、影响或措施不明确的故障、故障模式,FIT模拟测试;器件使用的考虑。如降额、热设计、器件应用审查;简化设计等AWP:availabilityworkprocess故障插入计划故障恢复设计故障隔离设计故障检测设计可用性计划更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流1、概述--业界可靠性流程(MOTOROLA的AWP)1、概述--可靠性流程验证阶段概念阶段计划阶段开发阶段需求提出需求分析综合映射需求分解与回溯规格形成概要设计详细设计与实现单元测试、SDV、SITBeta测试《工程设计调研与设计建议》可靠性工程基线2.0《板间信号级FMEA分析报告》《单板总体设计方案》(可靠性)《系统可靠性设计报告》《可靠性指标论证报告》TR2TR3TR1《器件级FMEA分析报告》《单板硬件详细设计报告》(可靠性)《元器件降额分析报告》TR4TR4ASVTIPD-SEHCMM3.0FIT可靠性验证测试可靠性工程师硬件/软件开发工程师可靠性工程师测试工程师可靠性工程师1、系统可靠性设计报告2、板间信号级FMEA分析报告1产品构成及功能定义2产品功能层次框图3产品可靠性框图4产品编码原则5环境定义6严酷度等级定义7功能模块(单板)接口信号FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5分析总结1产品概述2产品系统结构及可靠性建模3系统可靠性分析4主控类单板可靠性设计5网板(交叉)类单板可靠性设计6业务类单板可靠性设计7时钟子系统设计8电源子系统设计9监控及散热系统保护设计10存储保护与数据安全11系统及单板复位设计12系统可靠性设计规格及测试验证需求汇总1、概述--可靠性流程1、器件级FMEA分析报告1单板构成及功能定义2单板功能层次框图3单板可靠性框图4编码原则(可选)5环境定义6严酷度等级定义7单板器件级FMEA分析7.1单板器件级FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5故障定位率计算8.6冗余单元倒换成功率计算8.7分析总结2、产品元器件降额分析报告1、系统功能2、环境定义3、测试环境4、单板元器件降额分析4.1单板1元器件降额分析4.2单板2元器件降额分析5、总结1、概述--可靠性流程可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT)课程目的故障检测在线故障诊断故障隔离故障恢复故障修复离线故障诊断预警告警2、故障管理设计故障插入计划故障恢复设计故障隔离设计故障检测设计可用性计划更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流故障检测:发现故障故障诊断方法:1、自诊断(如:电压模块、风扇自带诊断);2、在线诊断;故障定位方法:1、功能单元隔离(如影响到总线或通信通道的故障、二路电源的二极管隔离等)2、禁止功能单元工作;3、安全值输出(如:参考时钟的自激振荡)4、重选路由;故障检测方法:1、数值范围检查;(如:温度、电压、槽位号、MAC地址等)2、数据正确性检查(如:奇偶校验、求检验和、CRC校验、槽位号异或校验等)3、比较检查(有冗余输出时)4、时间检查(如:心跳检测)5、用户直观检查(如:告警、声光显示)故障诊断(定位):确定造成故障的单元故障定位:把检测到的故障隔离到必须进行修理范围的过程,通常是现场可更换单元。即确保单元的故障不会造成系统的故障。故障恢复方法:1、倒换;(对主备用冗余)2、重新分配资源(对N+1冗余、资源池)3、软件复位;4、重启;故障恢复(自动):恢复产品执行规定功能的能力。2、故障管理设计故障修复方法:1、更换功能单元;2、调试和诊断(离线)3、软件补丁;4、软件升级;告警方法:1、趋势图法;2、多变量综合分析法;3、专家系统法;故障修复:故障完全排除的过程。2、故障管理设计1、报警;2、信息文本(如:写入运行日志中)3、故障分级处理(不同级别的故障采取不同的告警方法)预警方法:可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT)课程目的系统薄弱环节可靠性设计故障概率高故障影响大可靠性定性分析FMEA可靠性定量分析建模预计可靠性分析方法3、可靠性分析方法在产品设计过程中,通过对产品各组成单元潜在的各种故障模式及其对产品功能的影响进行分析,并把每一个潜在的故障模式按它的严酷度予以分类,提出可以采取的预防改进措施,以提高产品可靠性的一种设计分析方法。FailureModeEffectAnalysis,故障模式影响分析遍历性、系统性。FMEA的基本思想:.3、可靠性分析方法--可靠性FMEAFMEA目的:能帮助设计者和决策者从各种方案中选择满足可靠性要求的最佳方案保证所有元器件、单元的各种故障模式及影响都经过周密考虑能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分析其影响程度有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价能为进一步更改产品设计、定量计算提供资料FMEA的分析层次:系统级:按各功能模块进行分析板间信号级:单板的接口信号进行分析器件级:按各器件的故障模式进行分析3、可靠性分析方法--可靠性FMEAFMEA的分析方法:硬件法:从硬件的角度,对每个器件管脚输出分别去考虑故障模式、故障影响、检测补偿措施。功能法:每个产品可以完成若干功能,而功能可以按输出分类。这种方法将输出一一列出,并对它们的故障模式进行分析。对应系统级、单板级分析。3、可靠性分析方法--可靠性FMEAFMEA分析步骤:3、可靠性分析方法--可靠性FMEA从可靠性工程师的角度去理解系统;包括对系统完成的功能、工作阶段以及各种工作方式给出详细的描述;网络位置、组网方式和典型配置描述系统功能系统按照功能划分,通常可以分为:电源模块、风扇监控模块、网管模块、功能模块。对于功能模块,再继续划分到功能实体上,如主控功能模块、交换网功能模块、线路处理功能模块等。3、可靠性分析方法--可靠性FMEA定义严酷度类别给产品故障造成的最坏潜在后果规定一个量度。功能模块名称故障模式严酷度备注电源子系统输出异常高电压导致系统功能异常,甚至烧毁I电源子系统电源模块一路-48V供电故障,且不能检测II电源子系统电源配电子系统监控电路滤波部分故障,且系统不能检测II电源子系统电源配电子系统监控电路电压检测部分故障,且系统不能检测III风扇监控子系统全部风扇停转,导致系统温度过高而不能正常工作甚至烧毁I风扇监控子系统单个风扇框的所有风扇停转,导致系统温度升高而不能正常工作II风扇监控子系统风扇框监控电路故障,但系统能够检测,可以控制风扇全速运转III背板背板总线信号开路、短路故障,导致整个系统故障I主控模块主用主控模故障,不能倒换到备用I主控模块备用主控模故障,能检测III主控模块一路业务同步时钟故障,能检测,且有相应的补偿措施III主控模块双路业务同步时钟故障,导致系统无法工作I交换网模块一个交换网模块故障,故障,不能检测并将业务切换到其它交换网模块II交换网模块一个模块故障,故障,能将业务切换到其它交换网模块,但交换能力严重下降II交换网模块一个模块故障能检测,并将业务切换到其它交换网模块,对系统性能基本无影响III线路处理模块一个线路处理模块故障,能检测II线路处理模块线卡个别端口故障,能够通过端口捆绑的负荷分担将业务切换到其它端口IIII.这种故障会导致整个系统崩溃或主要功能受到严重影响;II.这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患;III.系统次要功能丧失或下降,须立即修理,但不影响系统主要功能实现的故障;IV.部分次要功能下降,只须一般维护的,不对功能实现造成影响(一般告警或指示灯故障等)。I~II类故障通常称为重大故障,也即“单点故障”;III类故障可简单理解为需要尽快修复的故障。当一个故障不能被检测出来时,是“隐患”,级别上升一级。具体产品具体定义;3、可靠性分析方法--可靠性FMEA描述功能层次框图目的:为了描述系统各功能单元的工作情况、相互影响及相互依赖关系,以便可以逐层分析故障模式产生的影响。表示系统及系统各功能单元的工作情况和相互关系,以及系统和每个约定层次的功能逻辑顺序。3、可靠性分析方法--可靠性FMEA描述可靠性模型框图目的:表示系统可靠性与各功能模块可靠性之间的关系。可靠性模型框图分为基本可靠性模型框图和任务可靠性模型框图。3、可靠性分析方法--可靠性FMEA描述结构图目的:清晰功能模块之间的相互关系,主要输入/输出信号。确定故障模式和故障原因(板间信号级)光信号--无光、光功率衰减过大、时序错误电信号--常高、常低、开路、时序错误确定故障模式和故障原因(器件级)分类类型失效形式百分比电容器纸/塑料薄膜电容器短路74开路13参数漂移13玻璃釉电容器短路53开路25参数漂移22云母电容器短路83开路10参数漂移73、可靠性分析方法--可靠性FMEA确定故障模式和故障原因(系统级)业务类功能故障;对接类功能故障;信息上报类故障;故障诊断类故障;业务保障类故障;安全类故障;用户界面类故障;子系统层面:全部功能不能实现;各部分功能不能实现;功能异常。FMEA分析表格3、可靠性分析方法--可靠性FMEA软件故障管理需求列表硬件故障管理需求列表3、可靠性分析方法--可靠性FMEA测试验证需求列表CriticalityAnalysis,危害性分析按每一种故障模式的严酷度类别及故障模式发生概率所产生的影响对其分类,以便全面地评价各种可能的故障模式的影响。是FMEA的补充和扩展。用RPN(RiskPriorityNumber,风险占先数)来定量表示RPN=S×P×D*其中:S--严重程度,对于I~IV类故障分别选取100,5,1,0.2P--故障发生的概率,器件失效率与故障模式发生概率的乘积,FIT;D--客户

1 / 31
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功