主从多机通信系统可靠性建模研究摘要:目前的电子器件的可靠性度量非常重要,开发人员必须针对特定的产品或服务给出恰当的界定,以评判其好坏实用性。本文通过研究一个主从式多节点声纳系统中同步时钟机制,以实际应用系统为研究对象,研究其可靠性问题,并针对实际系统做数学建模,模拟电子器件的使用寿命,并做算法研究、仿真实验,得出系统的模拟使用时间,从而为系统设计提供最佳方案。关键词:主从多机,可靠性,使用寿命,算法研究,仿真模拟。1.引言:(研究课题)物理模型:如图1所示,某分布式部署的声纳系统共有n个独立节点构成。各节点内部均是物理同构的。各节点必须保持严格的时钟信号同步才能有效协同工作,使系统发挥作用。所有节点经由时钟信号总线连接,由其中一个节点担当主节点,它的时钟电路工作于主模式,向总线输出时钟信号;其余节点均应担当从节点,节点内部时钟电路工作于从模式,仅从总线获取信号,不向总线输出信号。节点可能发生故障。由于应用场合的特殊性,故障一旦发生就无法修复。图1一个多节点声纳系统中的时钟同步机制示意图2.模型假设:2.1模型中的元件为了降低运算复杂度,这里仅仅将切换器A和切换器B视作不可靠元件,而将系统中的其余元件均视作不失效的可靠元件,这些元件的失效风险已被等效地折算计入不可靠元件的失效风险中。2.2元件的期望寿命和故障在工程中,我们常常假定电子元件使用寿命的概率分布为负指数分布,即tTetf)(。不同元件随机状态的统计特性彼此独立。元件一旦发生故障,故障类型即刻确定,且其后不会发生变化,故障均不可修复。假定切换器A的期望寿命为hourA4105/1,切换器B的期望寿命为hourB5102/1。为防止模拟过程中出现永远工作的情况,切换器工作寿命最大值定义为hour70000。切换器A可能出现3种类型的故障,分别称作A1、A2、A3。故障A1:切换器A不能正常受控,掷刀无法与触点1脱离。发生概率为:0.4Pr()A|A11故障发生EAP故障A2:切换器A不能正常受控,掷刀无法与触点2脱离。发生概率为:0.2Pr()A|A22故障发生EAP故障A3:切换器A不能正常受控,掷刀无法与任何一个触点接合。发生概率为:0.4Pr()A|A33故障发生EAP切换器B可能出现2种类型的故障,分别称作B1、B2。故障B1:切换器B不能正常受控,掷刀无法与触点脱离。发生概率为:0.7Pr()B|B11故障发生EBP故障B2:切换器B不能正常受控,掷刀无法与触点接合。发生概率为:0.3Pr()B|B22故障发生EBP3.算法设计:3.1模型失效的情况系统可能发生如下情况归纳如表2:表2可能导致系统失效的条件及其数学表达式条件数学表达式C11)(tQFB即1)(5NgQC22)(tQMO即2)(3NgQC30)()()(tQtQtQDMMOPF即0)()()(230NNNgQgQgQC4ktQtQtQtQDMMOSOPF)0))()(((1)()(即kgQgQgQgQNNNN)0))()(((1)()(2310C80)()(tQtQMOFB即0)()(35NNgQgQC91)()(ktQtQSOPF即1)()(10kgQgQNNC10))()(/()()Pr(98|tQtQtQPFDMPFCCPFg节点作主节点任一即在系统失效时的状态和发生该状态的条件关系如下表所示:表3系统失效时的状态及其条件关系系统失效状态条件关系1sysGC1||C2||C3||C44sysGC8&&C9&&C103.2仿真过程固定步长仿真:固定步长仿真的基本思路是,取一小时为基本步长,利用蒙特卡洛算法模拟下一个运行状态,反复运行,观察和统计运行结果。大体步骤如下:1.对每一个节点进行检测,看节点是否失效。若节点已经失效,利用随机数方法模拟节点的失效状态。2.比较所有节点状态,看看系统是否失效。如果系统已经失效,记录下此时系统工作时间(即工作寿命);若系统未失效,则继续步骤1。3.对10000个系统同时进行模拟,计算它们的平均工作寿命。4.改变n的值,判断在n的值为多少时,系统的有效工作寿命最长。在模拟过程中,我们参考表4对n个节点状态变化进行判断,将每种节点状态细分,目的是保留没有完全损坏的个体,以便再次参与运算。表4状态跳转123456情况组合/w0Ng1Ng2Ng3Ng4Ng5Ng10Ag0Bg1Ag2Bg无2Ag1Bg2Ag2Bg+3Ag1Bg+3Ag2Bg1Ag1Bg2(A没坏)无0Ag2Bg无0Ag1Bg无无3(B没坏)无1Ag0Bg2Ag0Bg无3Ag0Bg无例如,切换器A和B均为正常工作状态0Ag0Bg。在某一时刻,切换器B不能正常受控,掷刀不能脱离,变为状态1Bg。则此时状态从0Ag0Bg跳转到0Ag1Bg,变为情况组合3Ng。同理,若切换器A不能正常受控,掷刀无法与任何一个触点接合,而切换器B正常工作。此时为状态3Ag0Bg。在某一时刻切换器B不能正常受控,掷刀无法与触点接合,达到状态))()(/()(()200NNNgQgQgQrand2Bg。则切换器3Ag0Bg从跳转到3Ag2Bg,仍保持为情况组合4Ng。对上表中的每一列求和,即为该情况组合的节点个数。在编程过程中,用一个36的矩阵进行数据记录,然后可以判断是否满足系统失效条件。整个系统采用matlab仿真,模拟仿真流程图如图4:图4模拟仿真流程图3.3仿真结果通过matlab仿真结果如表5:表5matlab仿真结果节点数nSTwASiif/)25000(1)(1)()(fTE(hours)n=466.3%38788n=578.2%46166n=680.3%48379n=783.9%50149n=881.6%49458n=978.8%48524n=1079.2%48241n=1177.0%45742n=1273.6%44480其中STwASiif/)25000(1)(1)(表示寿命超过25000小时的概率,)(fTE表示进行10000给定初始时间t=0模拟下一个时间各个节点状态是否满足失效条件?t的值增加1NY记录此时经过时间t,此时t即为系统有效寿命将各个节点状态记录到矩阵中次模拟之后有效寿命的平均值。从表格中可以明显看出,当n=7时,系统期望得到的有效寿命最长,寿命超过25000小时的概率最大。所以我们可以得出结论,在给定的数学模型下,在一定的误差允许范围内可以认为7个节点的主从多机系统较稳定。4.系统探究4.1改进切换器B使得寿命增加如果投资采购质量更好的切换器B,使得其期望寿命增加一倍为hourB5104/1,而切换器A不变,则系统仿真结果如表6:表6改进切换器B后matlab仿真结果节点数nSTwASiif/)25000(1)(1)()(fTE(hours)n=467.2%41088n=583.2%50958n=689.6%55475n=793.4%58283n=892.8%58499n=990.6%58302n=1090.2%58307n=1188.6%56134n=1289.4%56003改进切换器B后n=7时寿命超过25000小时的概率最大,比原来提高9.5%。n=8时寿命的平均值最大,比原来提高16.7%。4.2改进切换器A使得寿命增加如果投资采购质量更好的切换器A,使得其期望寿命增加一倍为hourA5101/1,而切换器B不变,则系统仿真结果如表7:表7改进切换器A后matlab仿真结果节点数nSTwASiif/)25000(1)(1)()(fTE(hours)n=481.8%50156n=586.8%52975n=687.6%55578n=787.8%55294n=882.6%52498n=981.6%50922n=1080.4%49506n=1173.0%44985n=1273.6%43980改进切换器A后n=7时寿命超过25000小时的概率最大,比原来提高3.9%。n=6时寿命的平均值最大,比原来提高10.8%。4.3对比两种改进改进两个切换器寿命,得到的对比结果如图5和图6所示。从以上两个改进可以发现,如果实际情况只能投资改进其中一个切换器,使其寿命翻倍,则在现有的设备基础上应该选择改进切换器B。从理论上也可以看出,切换器B点由于其失效状态只有两个,所以对系统状态的改变比较明显,它会使得某些节点进入只能当主机的状态而且更有可能跟切换器A失效一起造成总线阻塞。改进切换器B以后,可以使得在切换器A失效之后,系统可以控制正常工作的余地会大一点,因而能够显著提高系统稳定性。但是如果系统还可以减少节点以减少开支,那么还可以选择减少一个节点来改进切换器。从结果中看出,系统在6个甚至5个节点时,改进切换器A、B结果基本同样理想,所以可以把省下来的资金用于投资改进切换器,使得系统正常工作的稳定性提高。60.00%65.00%70.00%75.00%80.00%85.00%90.00%95.00%n=4n=5n=6n=7n=8n=9n=10n=11n=12未改进切换器寿命切换器B寿命增加一倍切换器A寿命增加一倍图5.改进切换器寿命后百分比对比图30000350004000045000500005500060000n=4n=5n=6n=7n=8n=9n=10n=11n=12未改进切换器寿命切换器B寿命增加一倍切换器A寿命增加一倍图6.改进切换器寿命后寿命对比图5.参考文献:[1]《基本条件和实验要求》V2.1_2012-2-26updated[2]《案例1》课件一个RS485多机通信系统的可靠性评估的建模和仿真组号:05姓名:赵亦燃学号:5100309147姓名:刘金山学号:5100309049摘要:目前的电子器件的可靠性度量非常重要,开发人员必须针对特定的产品或服务给出恰当的界定,以评判其好坏实用性。本文通过研究一个RS485多机通信系统,研究其可靠性问题,并针对实际系统做数学建模,模拟电子器件的使用寿命,做算法研究、仿真实验,得出系统的模拟使用时修理次数、无故障运行时间、无重大故障运行时间等重要参数,从而为系统设计提供最佳方案,为系统的改进提出合理化建议。关键词:主从多机,可靠性建模,RS4851.引言:(研究课题)我们研究的系统为一个“1主3从”通信系统,其结构图如下。图1基本配置下系统的组成在基本配置下,其组成示意图如图1。为提高该系统的可靠性,实际可能采取的工程措施有以下三项:措施1:微处理器中引入Watchdog机构措施2:防止接口电路板故障阻塞总线措施3:主机的双机热备2.模型假设:2.1发生故障概率及修理时间所有元件连续无故障运行时间t的概率密度分布都遵从负指数分布tTetf)(构成控制硬部件、接口部件、集线器部件的所有元件特性满足独立同分布,对应参数hour51103/1控制电路接口电路通信主机控制电路接口电路通信从机1集线器通信总线控制电路接口电路通信从机2控制电路接口电路通信从机3构成控制软部件的单元件,对应分布参数hour42102/1对故障进行人工修理,排除故障所需花费的时间t是随机变量,其概率密度分布遵从负指数分布tTetf1)(控制软部件由Watchdog重启从故障状态中恢复,所需花费的时间是随机变量,其概率密度分布遵从负指数分布,参数hour1/12。2.1发生故障概率及修理时间控制硬部件、集线器部件、接口部件组成元件的故障需要依靠人工修复。未采取措施1时,控制软部件组成元件的故障需要依靠人工修复;采取措施1以后,控制软部件组成元件的故障中有97%可以通过自动重启恢复,还有3%的故障需要依靠人工修复。未采取措施2时,接口部件组成元件的故障中有7%会引发总线阻塞;采取措施2以后,可完全避免引发总线阻塞,但并不能降低元件故障发生率。未采取措施3时,通信主机子系统一旦有故障即刻完全失效。采取措施3以后,在互为备份的双机同时失效时