1制造网络系统可靠性评价方法的研究李娇娇化工机械2011200722摘要:本文针对制造网络进行系统可靠性分析,探讨制造网络系统可靠性评价指标的确定。并在分析制造网络体系结构的基础上,确定其可靠性框图,定义其可靠性评价模型,为有效地实施管理提供理论指导。关键词:制造网络系统;可靠性评价1系统可靠性理论1.1系统可靠性定义系统可靠性是指在规定的条件下,系统在规定的时间区间内完成规定功能的能力。其中,“规定条件”是指系统的环境条件、使用条件、维修条件和工作方式等。“规定的时间”是该定义的核心,将可靠性用时间直接或间接地描述出来。“规定的功能”是指系统重要的性能指标和技术要求。系统可靠性理论体系包括可靠性预测、可靠性分配、可靠性优化和可靠性实验。可靠性预测即在设计系统阶段,按元件-子系统-系统,逐一估算可靠性指标,找出其薄弱环节,以使系统达到最大可靠性;可靠性分配即根据系统与元件之间的可靠性功能关系将系统可靠性指标在元件之间进行合理分配,也就是按系统-子系统-元件,逐一地落实可靠性指标;可靠性优化即运用最佳备用设计、故障诊断技术和最佳预防措施来解决系统设计、制造和运行中的优化问题,使之在满足一定可靠性前提下,使系统各方面性能达到综合的最佳组合;可靠性实验即贯穿在系统的规划、设计、制造和运行的全过程,包括评价实验、证实试验、生产试验和寿命试验。1.2常用系统可靠性度量指标系统可靠性的参数,主要有:可靠度(Reliability)、可维度(Maintainability)、可用度(AVailabjlity)和保能度(Performability)等。1.2.1可靠度(Reliability)可靠度参数R(t)从一个系统能够正常工作的时间长短来描述系统的可靠性。它定义为系统在在时刻正常工作的条件下,在01[,]tt时间区间内正常工作的概率,表示为R(){}tPXt不可靠度F(t)为:F(t)=1-R()t1.2.2可维度(Maintainability)维修性是衡量系统发生故障时维修难易程度的一种指标,其定量测度称为可维度,即系统失效后在时间间隔t内被修复的概率,记为M(t):(){}MtPXt。1.2.3可用度(Availability)系统的可用性是指在任意时刻系统正常工作的概率,是反映系统有效性的参数。用稳态可用度SSA作为系统连续工作的令人满意的度量;平均可用度1,2()Att作为系统在一定周期内的度量,而在任意时刻的瞬问可用性A(t)是系统的最好度量。表示如下:11,2211()2()ttAttAtdtttlim()sstAAt对于不可维修系统有()()AtRt。1.2.4保能度(Performability)保能度(,)PLt的定义是:系统在时刻t其性能保持在三级或三级以上水平的概率。它是把性能与可靠性结舍起来的一项指标,其中引入了一个部分失效的概念。系统发生一定的故障,但并不影响系统的运行,只不过系统性能降了一定的等级。保能度和可靠度的一个重要区别是:可靠度是衡量系统能够正确执行全部功能的可能性的一种指标,而保能度则是衡量系统能正确执行最低限度部分功能的可能性的一种指标。1.2.5MTTF,MTTR和MTBFMTTF(MeanTimeToFailure)即平均故障前时间,MTTR(MeanTimeToRepair)即平均维修时间,MTBF(MeanTimeBetweenFailure)即平均故障间隔时间,它们三者的关系为:MTBF=MTTF+MTTR2制造网络系统可靠性指标2.1制造网络系统可靠性定义系统可靠性应包括一下三方面的内容:系统工作可靠性Ro,是系统在运行时的可靠性,是一种综合性的可靠性指标。系统固有可靠性RI,是系统在生产过2程中就已确立了的一种可靠性,它和系统所选用的材料、零部件、设计方案、软件结构、硬件结构、制造工艺、装配工艺有密切关系,是系统的内在可靠性。系统使用可靠性Ru,与系统在由制造厂转给用户过程中的包装、运输、保管以及在实际使用过程中的环境、操作水平、维护技术等因素有关。三种可靠性不是互不相关的,它们之间存在有一定的关系,这种关系可以用数学公式表述如下:*OUIRRR。对于制造网格系统,关心的是它工作时的状态,即系统工作可靠性UR。对于由多个组件组成的一般系统,可靠性定义为在时间段[0,t]内系统无故障运转的概率。可用性定义为在时刻t系统可用的概率。本文将制造网格系统可靠性定义为:在其整个运行的过程中,在各种制约性因素的影响下,能够持续完成规定功能的能力,即用来衡量制造网格系统在完全提供其功能时的成功程度。2.2制造网络系统的可靠性指标层次全面评价系统的优劣必须有性能指标反映系统的技术水平,还要有可靠性指标反映系统性能的维持能力,所以系统的可靠性指标不仅是衡量系统可靠性的定量尺度,而且也是描绘系统可靠性特性的参数。要表达一个复杂系统的可靠性并非某一单项指标就能完整全面描述的,而需要建立系统的可靠性指标体系。系统可靠性指标体系研究应解决:确定可靠性指标体系,确定体系中包含哪些可靠性指标以及它们的定义。建立对系统可靠性指标体系的清晰认识是开展系统可靠性分析工作的前提。通常的情况下都假设系统及其单元有两种状态:正常状态和故障状态,与此假设相关联的系统称为二态系统。制造网格(MG)系统是可降级的多态系统,具有多种失效状态,将其离散化,定义四个等级,其状态空间为:{0,1,2,3}VS。其中“0”表示系统不可用,“1”表示系统可用,“2”表示系统运转可靠,“3”表示系统能够高性能运转。具体含义如下:可用状态,MG系统在0t时刻能否运转;可靠状态,MG系统在0t时刻正常运转的情况下,能否在时间区间0(,)tt内正常运转;高性能状态,MG系统在时间区间0(,)tt内其性能保持在L级或L级以上的水平。相应的,对于运行期间的制造网格系统主要从三个层次对系统的可靠性进行监控和管理:应用可用度,MG系统在0t时刻能否运转的概率;应用可靠度MG系统在0t时刻正常运转的情况下,能否在时间区间0(,)tt内正常运转的概率;应用保能度,MG系统在时间区间0(,)tt内其性能保持在L级或L级以上的水平的概率。应用可用度是用来衡量MG系统在某一时间点能否提供服务;应用可靠度则关注MG系统在某一时间段内的性能状态;应用保能度考察系统在某一时间段内的运行效率。MG系统是可降级系统,系统中的失效仅仅引起性能的下降,系统仍处于工作状态,我们认为系统在如此低性能状态下的工作是不可靠的。应用保能度就是衡量这种随着失效的增多系统性能下降的可降级系统的可靠性指标,是把性能与可靠性结合起来的一项指标。2.3相关量化可靠性指标评价系统可靠性的单项指标很多,如可靠度、失效率、平均寿命等,这些都是从设计的角度出发评价系统的可靠性。对MG系统的可靠性评价,应依据系统运行过程中的状态来评价。为此,针对MG系统的具体情况,引入如下相关的可靠性指标。2.3.1系统可靠度系统可靠度是指MG系统时刻t处于状态i或i以上的概率,表示为:1(,){(),[0,]}(,)mjRtiPytitptj其中,状态序号i∈VS,系统状态变量y(t)∈VS,p(t,i)是制造网格系统在时刻t处于状态i的概率,且R(t,m)≤……≤R(t,1)≤R(t,0)=1。2.3.2可靠性水平系统可靠性水平指系统处于状态i的平均逗留时间,表示为:0()(,)sMiptidt其中,p(t,i)是MG系统在时刻t处于状态i的概率。2.3.3平均寿命系统平均寿命指系统处于状态i或i以上的平均逗留时间,表示为:000()(,)[(,)](,)mmssjiMiRtidtptjdtMtj其中,状态序号i∈VS,p(t,j)是MG系统在时刻t处于状态j的概率。32.3.4失效概率在组件的生命周期内,不能准确预测它的失效时间,因为它是一个以潜在的失效时间整体的随机属性为特征的随机变量。由于组件的失效是一个随机过程,在特定时问,之前的失效概率定义为:0()()itFtftdt,其中f(t)是组件的失效概率密度函数。F(t)是失效密度函数的积分,当f趋近无穷大的时候,它趋近于1。这表示没有项目能够永远不失效。由R(t)表示的可靠性函数表示组件至少在时刻t之前有效,定义为:()()tRtftdt2.3.5瞬问失效或故障率故障率是表示在某一时刻组件失效的概率,假设他们在那一刻之前都是可用的。故障率由下式求出:()()()1()()ftfthtFtRt。组件的失效分布一般通过对失效时间观测的有效历史记录进行曲线拟和、统计分析和其它数值处理得到的。可靠性分析研究的主要目的是为决策提供信息基础。3制造网格系统可靠性评价模型3.1制造网络系统可靠性框图制造网络是基于网格平台Globus构建的,其运行模式如图1所示:图1制造网络系统运行模式可靠性框图分析法(ReliabilityBlockDiagramAnalysis)是从可靠性的角度出发来研究系统与部件之间的逻辑关系的一种分析方法。制造网格系统可靠性框图是考虑各组成部分的故障或失效对系统所产生的影响。从MG系统的运行模式可知,MG门户是用户访问MG系统的入口,也是系统的瓶颈,必须保证它持续、稳定地运转。因此,在进行监控和管理的同时,采用硬件冗余的方式提高其可靠性,从可靠性方面来讲,这两个门户服务器是并联关系。系统中的各种应用服务器和数据库服务器是系统运转的系统和数据保障,其中一个失效,将导致系统的失效,因此在可靠性框图中是串联关系。MG中的服务节点分散在Intemet上,相互独立,因此其可靠性是并联关系。由此,可得制前端用户(GUI)接口服务信息服务认证文件/数据管理工作流管理资源分配资源管理资源监控动态信息服务静态信息服务MG门户MG中间件MG服务4造网格系统可靠性框图,如图2所示:图2制造网络系统可靠性框图由此,我们可以用下式表示制造网格系统的可靠性:()MGSYSServicePotalSysServiceRRRRRR其中SYSR表示系统资源的可靠性,而SysR指除Portal以外的系统资源的可靠性。系统的可靠性框图只能表示定性的功能关系,而不能精确地表示定量关系。若进行定量分析和定量计算只能用可靠性数学模型来进行。3.2制造网格系统可靠性层次评价模型进行系统可靠性分析的关键在于建立正确的系统可靠性评价模型。制造网格系统是个复杂的系统,在其可靠性评价中将整个系统分成了四个层次:系统层、分系统层、子系统层及组件层,如图3所示:图3MG系统可靠性评价层次模型组成MG系统的各个子系统具有一定的独立性又相互联接成有机整体。对MG系统的可靠性评价,首先要考察各个子系统的可靠性。对单一功能子系统,其可靠性评价模型(REM)可表示为:(,,)vREMVVS,其中12(,,,)nVvvv…是表征制造网络系统可靠性MGPortal可靠性系统资源可靠性共享资源可靠性系统层分系统层子系统层服务器1数据服务器MGService!#服务器2应用服务器组件层组件m#……组件1#组件m#……组件1#其他应用(SAP)OS(WindowsNT)DBMS(Oracal)OS(WindowsNT)GlobusToolkit3OS(Linux)GlobusToolkit3OS(Linux)MGServicen#MG门户服务器(主)MG门户服务器(从)数据库服务器应用服务器MG服务1MG服务1MG服务1…5具体监控对象运行状态的一组变量,{0.1.2.3}VS是变量状态空间;而v则是由V向VS的映射关系,它可以是阈值判定,也可以是模糊识别判定。整个MG系统的可靠性是建立在子系统的可靠性基础之上的,其可靠性评价模型(MGREM)可以形式化地表示为:12(,,,)nMGREMfremremrem…,其中irem表示第i个子系统的可靠性。不同的子系统可靠性对整个系统可靠性的影响不尽相同,因此应确定各予系统影响程度的权重系数(1,2,)ii…,n,且11nii,则12(,,)m…