可靠性的定义与指标计算机控制系统的可靠性通常是指计算机控制系统在规定的时间和规定的条件下完成规定功能的能力。可靠性只是个定性的概念。实际中往往需要以量的形式具体表示可靠性的高低,如可靠度、维护率、失效率、平均故障间隔时间MTBF、平均维护时间MTTR、有效度等。具体含义如下:假定系统投入运行后,工作了一段时间t1后出现了故障,不得不停机维修。经过一段时间的T1的维修后,故障排除,系统又正常运行。这样,在时间坐标轴上,t1,t2,…tn是系统的正常工作时间T1,T2,…,Tn是维护时间,则有:1、故障率(失效率)Tn总工作时间失效次数表示单位时间内发生故障的次数。2、维护率)(1niiTn总维护时间维护次数表示系统单位时间内修改的次数。3、平均故障间隔时间MTBF1/1ntMTBFnii失效次数总工作时间表示系统多次发生故障的情况下平均连续工作时间。4、平均维护时间MTTR1/1nTMTTRnii失效次数总维护时间5、有效度A11MTTRMTBFMTBF)(A不可工作时间可工作时间可工作时间6、可靠度RR(n)=P{n次运行不发生故障}可靠度R表明运行n次不发生故障的概率。如果按限定的时间计算,可靠度为R(t)=P{在时间[0,t]内运行不发生故障}。它表明在限定时间内[0,t]内发生故障的概率。有效度表明在某一特定的瞬间,维持其正常工作的概率。其中λ/μ是系统的重要指标。λ/μ较大,表明系统不能可靠的工作。由上可知,提高可靠性有两个方面:一是尽量使系统在规定的时间内少发生故障和错误;二是发生了故障能迅速排除。为了提高计算机控制系统的可靠性,通常可从硬件可靠性及软件可靠性两方面来解决。硬件主要考虑如何提高元器件和设备的可靠性;采用抗干扰措施,提高系统对环境的适应能力和冗余结构设计。软件主要考虑测试技术、故障自诊断技术、自动检错、纠错技术、系统恢复技术方面的设计。