故障报告、分析和纠正措施系统故障报告、分析和纠正措施系统英文名称为:FailureReporting,AnalysisandCorrectiveActionSystem1980年颁布的美军标MIL-STD-785B《系统和设备研制生产的可靠性大纲》,要求军用系统承包商建立FRACAS和故障审查委员会(FRB),以监督和控制研制过程中的故障分析和纠正活动。为使这一工作更加规范化,1985年美国国防部又颁发了军用标准MIL-STD-2155(AS)《故障报告、分析和纠正措施系统》对故障报告、分析和纠正活动规定了统一要求和准则我国军用标准按照等效采用美军标的原则,也先后于1988年颁布了国军标GJB-450《研制装备和生产的可靠性通用大纲》,1990年颁布了GJB-841《故障报告、分析和纠正措施系统》,要求军工产品承制单位在军工产品研制过程中建立FRACAS,并规定了程序和方法1988年,航天系统颁布了行业标准QJ1408《航天器和导弹武器系统可靠性大纲》,1993年9月又颁布了《航天型号可靠性维修性管理暂行规定》,两者都对在型号研制过程中建立FRACAS提出了具体要求和方法目的和作用建立FRACAS的目的是为了确保研制过程所有故障能及时报告,彻底查清,正确纠正,防止再现,从而实现产品可靠性增长,以保证达到并保持产品的可靠性和维修性FRACAS是一个故障信息系统,其输入是信息-故障报告,输出的也是信息-纠正措施,通过一套规范化的严格的管理程序,保证产品及其组成部分在各种试验中发生的极其分散的故障信息能及时、准确、完整的收集,为分析、评价和改进产品可靠性提供科学依据。FRACAS与各方面的关系实施要求FRACAS是一个闭环的故障报告系统,由一系列活动组成,涉及到各研制、试验、使用单位和各类人员,必须对管理机构、各方面指责、各项活动程序、内容以及必要的资料(人员、设备)作出全面计划,并纳入型号的可靠性保证计划之中。型号负责人应研究并确定如何使用各单位现有的信息系统和追加要求,以及管理本型号FRACAS的各单位负责人应制定一项制度,对以下诸方面作出明确规定1机构与职责具体规定FRACAS的管理机构和人员职责;故障评审委员会的组成及职责;与外协、外购件供应单位的关系;总体、分系统、设备研制和生产单位的关系;与用户的关系2活动与程序具体规定故障报告程序、故障分析程序、故障纠正程序、悬案和遗留问题处理程序、故障件流程和保留要求、信息流程等3记录和文档具体规定产品发生故障处理过程中产生的全部信息记录、故障报告表、故障分析报告表、纠正措施申请表、定期的故障综合报告、故障趋势分析和报告及资料归档要求4资料保证据国外经验,FRACAS是可靠性工作项目中需投入人力、物力较多的一个项目。各单位、各型号应投入一定专业人员、资金和设备从事这项工作。建立专业的失效分析机构,产品的故障分析组以及故障审查委员会,配置FRACAS的信息贮存和处理设备,FRACAS管理机构的人员与活动所需的费用等,均应纳入型号研制计划典型的FRACAS活动步骤1在某一工作或试验期间观察故障2仔细记录所观察到的故障3故障核实,重复观察或试验以验证故障的真实性4隔离故障,查找故障部位,直到最低一级故障元件5更换可疑故障产品,并证实故障仅在更换下的产品中6验证有怀疑的产品,对故障进行检测7故障分析,查找证实的故障模式、原因、机理8收集有关资料9确定根本原因10提出纠正措施建议11纠正措施实施12试验验证纠正措施的有效性13评审确定纠正措施的有效性14全面实施纠正措施故障报告故障发生后,应立即采取措施防止故障扩展,保护好故障现场。负责试验的单位和人员应在规定的时间、用规定格式,向规定级别的管理部门进行报告报告范围在研制、生产和早期使用过程中发生的所有硬件故障、软件错误、接口问题和异常现象均应记录并报告,进入FRACAS的故障范围至少应包括:1从产品最低层次组件加载后的每一产品层次的试验和检验中发生的故障2造成非计划的维修故障3不可拆除的元器件故障4产品可靠性试验期间的故障5软件或硬件接口引起的功能故障报告内容FRACAS的有效性取决于作为输入信息的故障报告的及时性、准确性和完整性。故障报告的内容应能反映故障发生时的一切条件,至少应包括以下内容1发生时间、地点及何种试验2发生故障时产品所处的工作状态,环境条件3故障产品的详细描述4故障现象和特征的详细描述5试验的操作者和故障发现者报告要求通常运用合同、任务书、技术条件和物品保证大纲规定的故障报告的各种要求。一般要求为:1一个单位或一个型号的故障报告格式应统一,以便统计处理和贮存2型号的故障报告应按总体、系统、设备、部组件等不同产品层次和故障的严重等级规定各类故障报告至哪一管理等级3应规定报告的时限,重大故障应在24小时内报到型号最高管理级,一般故障可在三天内报告到规定的管理级4外协、外购件在供应单位检验、试验中的故障应汇集到产品承制单位的FRACAS之中故障核实FRACAS管理部门接到故障报告后,应根据故障报告的详细程度和故障严重等级,组织有关方面人员进行故障调查,以确认故障报告的准确性。核实故障可以用复现试验或有关故障证据来证实,故障核实应至少包括以下工作1重新证实初次观察故障的真实性,进一步录取故障数据2查找故障部位,一直到最低一级可更换的故障件3用相同良好件更换、代替故障件,重新进行测试和试验,看是否纠正了原来报告的故障4对更换下来的故障产品或故障件进行测试,以核实该可疑产品或故障件确有故障,初步确定故障范围5对不可重复试验的产品,主要通过故障影响和后果(如泄露、断裂、损坏等)的详细观察来证实故障分析故障分析是由故障现象、后果去查明故障原因和机理的过程,追查原因中的原因,一直到查处根本原因,并能构造出反映故障因果逻辑关系的故障连。只有彻底查明故障原因,才能解释故障发生的过程,才能提出有针对性地纠正措施故障分析是一件极其重要、却又非常困难的工作,影响故障分析彻底性、准确性的因素很多1思想上的顾虑,因为故障原因涉及到责任,关系到名利2故障数据不全,故障现场未保护好3分析人员的水平、经验和客观性4分析设备的功能和精度5单位或工程负责人的态度和作风6监督机制的完备性7奖惩政策的合理性故障分析工作组针对某一特定的故障,特别是重大故障应成立故障分析工作组,其成员包括与产品试验和故障有关单位和部门代表、专业失效分析机构和质量可靠性部门的人员组成。其任务是负责故障调查、分析嘎作,做出分析结论,编写故障分析报告,提出改进措施建议。故障分析工作组组长应由无直接责任的有资格的专家担任,故障分析结论评审、确认后,故障分析工作组自动解散。故障分析工作步骤1分析有关产品和故障方面的资料,如产品设计和工艺资料、试验程序、FMEA报告、故障报告、证词等2分析故障产品的全不工作历史和故障历史3分析测试、试验设备、操作环境条件等产品外不情况是否包含导致故障发生的因素4对故障进行测试检查5提出故障原因和机理假设,并验证6整理、分析各种数据,提出分析结论,编写故障分析报告7提出纠正措施建议8整理各种记录、数据资料,并汇编成档案故障分析方法一般分为三种:工程分析法、失效机理分析法和统计分析法工程分析:根据工程原理和工程经验,对故障产生的原因和机理进行分析,可以通过计算和故障模拟试验来进行分析。应充分利用FMEA分析结果提供的信息,运用故障数方法来查明故障模式和原因之间的逻辑关系所谓故障树分析就是把故障作为顶事件,运用演绎法,自上而下逐级寻找到站该故障模式的故障原因,通过一系列中间事件,直到底事件代表的最基本原因,各事件之间的逻辑关系用逻辑符号加以连接,构造出一颗故障数,进而找出各种可能的路径,并逐一排除不可能导致故障的路径,最终找出可能导致故障的路径。该方法主要适用于复杂系统和设备级失效机理分析利用观察、测试、理化分析、解剖、X光检查、电子扫描县委镜观察等方法研究物质结构、工艺过程可能产生的缺陷,分析导致这种缺陷的机理和过程。该方法主要适用于元器件、零部件和材料等硬件统计分析通过故障产品累计工作时间、次数、和工作次数,对该故障模式在类似产品出现的次数加以系统的整理,以估计该股涨模式的性质和出现率故障分析要求故障分析的结果应能判明以下问题1该故障是相关故障,还是非相关故障?以便估计产品在未来现场使用中是否会发生2该故障是责任故障还是非责任故障?以便在估计产品可靠性时考虑是否将其计入,同时,也有利于分清故障产品是故障源还是受害者3该故障是何种原因引起的如:设计不周、制造不良、元器件或材料或外购设备缺陷、试验操作中认为错误、软件错误、未查明确切原因等4该故障是初期发现,还是类似产品中早已出现过5该故障是需要纠正的系统性缺陷引起的,还是偶然性缺陷引起的?如果是偶然性故障,那么它出现的概率是多少?是否需要纠正?故障分析报告故障分析报告是对整个故障报告、分析和纠正措施的总结,是确定和实施纠正措施的依据,必须经主管技术负责人审批。重大故障分析结论应由相应管理级别组织有关方面评审、确认后方可提出纠正措施建议。故障分析报告内容至少应包括:1产品工作历史和故障现象、特征的描述2故障调查和分析过程3故障原因和激励的分析、论证4建议的纠正措施5需说明的问题建议故障分析报告编写完成后,还应按要求格式整理摘要故障报告工作结束故障报告工作结束的标志是编写出故障分析报告并采取纠正措施。对原因一时难以查清的故障,也应写出故障分析总结报告,说明理由,经主管技术领导批准后,可暂时结束故障报告工作。对已查明原因但未采取纠正措施的地故障,应写出故障分析总结报告,并说明不采取纠正措施的理由,可暂时结束故障报告工作。但是,在飞行试验前,对上述暂时结束的故障报告工作应重新组织一次审查,才能最后结案。故障产品管理故障产品应加以明显的标志,在完成故障分析之后到纠正措施实施之前,应妥善加以保管和控制,不应丢失或随意处理故障纠正在研制过程的试验和检验中,产品发生故障一般要做两种处理1应急处理:更换有故障的产品,把系统恢复到可工作状态,这种修理过程不能改善系统固有可靠性,只对故障产品采取措施2防止再发生:在故障原因分析清楚的基础上,采取纠正措施,即改进设计、工艺、试验程序,消除产生故障根源,从而系统固有可靠性得到增长,同时,对同批次产品和有可疑产品的类似缺陷加以改进质量与可靠性工作的根本任务是防止再发生,绝不能只停留在应急处理的水平上有时,却难查清原因,只好采取综合治理的办法,即对产品中可疑的各个薄弱环节进行改进纠正措施的确认纠正措施必须通过一定试验至少是产品发生故障的试验来验证其有效性;同时,应分析纠正措施实施的可能性,是否会带来新的故障模式或附加的不可靠性在纠正措施申请正式审批前,应组织有关专家和部门代表进行评审,以保证其有效、可行,并于其他相关部分接口相协调纠正措施的实施批准的纠正措施反馈到设计、工艺、试验程序之中,要通过技术状态管理系统(CMS)完成相应的文件更改和产品更改。对可能出现相同的故障模式的类似产品应举一反三,研究是否需要采取措施。与故障有关联的可疑产品,应做必要的分析和试验,证明其可靠性并未降低,寿命未受损管理改进产品的故障往往反映出设计、制造、采购、试验、检验等方面的问题,而进一步研究其原因,又大多数可以追查到管理的不善,诸如培训、考核、激励政策、法规、制度等要求不明确,不严格。责任不明,关系不顺,要从管理上采取措施改善质量体系和产品保障系统,以便推动产品可靠性的不断改进故障审查组织1目的故障和故障处理对产品可靠性有重大影响,特别是复杂的可靠性、安全性要求较高的系统,应建立故障审查委员会,对故障分析和纠正活动进行监控,以保证故障分析的彻底性和纠正措施的正确性2任务故障审查组织主演任务:审查重大故障的分析工作与结论,以及纠正措施建议利用研制过程中的故障统计资料,分析故障趋势,提出改进的建议对故障原因不明的疑案进行审查,提出结案的原则和补救工作3组织故障审查组织不是一个职能机构,而是一个为工程最高层进行故障处理提供决策支持的委员会。根据型号特点,可由设计、工艺、试验、可靠性及采购部嫩的代表组成,型号负