如何建设可靠性99.99%的FTTx有线电视网庄杰,胡斌,林如俭上海凌云天博光电科技有限公司[摘要]下一代广播电视网和三网融合要求有线电视网具有电信级的可靠性水平。本文从可靠性工程的概念出发,对有线电视网络的可用度进行计算和分析,论述网络的设计思路和提高其可靠性的措施。[关键词]网络可靠性,可靠度,可用度,可维护性,平均故障间隔时间,平均修复时间HowtoBuildHighlyReliableCATVNetworkswithAvailabilityof99.99%ZhuangJie,HuBin,LinRujianShanghaiLusterTerabandPhotonicsCo.,Ltd.[Abstract]NextGenerationBroadcastNetworkandnetworksconvergencerequiretheavailabilityofCATVnetworktoreachthecarrierlevel.Startingfromtheconceptofreliabilityengineering,thispaperpresentsacalculationandanalysisofCATVnetworkavailabilityanddiscussesthenetworkdesignandtheproceduresforreliabilityenhancement.[Keywords]NetworkDependability,Reliability,Availability,Maintainability,MTBF,MTTR一、概述随着国家政策、外部环境、用户需求和通信网络技术的发展变化,广播电视有线网络除了传统的模拟电视广播业务之外,大量的DTV/HDTV/UltraHDTV、宽带数据等新业务,并以此为基础开发了互动电视(VoD等)业务和将要开发VoIP等电信增值业务。在这样的形势下人们认识到,有线电视网络的可靠性及其对各项业务质量的影响是网络改造和建设必须研究的重要问题。为了改善网络可靠性所需要的巨大投资,也是各有线网络公司面临的巨大挑战。在下一代接入网的总体波长安排中,国际IEEE802.3ah/av和ITU.984等国际标准都建议采用1550nm波长做射频业务(包括广播电视业务和载波数字传输业务),因此1550nmA平台的可靠性建设必须提上议事日程。为了使广播电视网络达到电信级的可用度水平(99.99%,年中断时间53分钟),应当应用可靠性工程的概念对有线电视网的可靠性进行计算和分析,从而形成设计网络的思路和找到提高其可靠性的措施,这就是本文要探讨的问题。本文首先给出可靠性工程的基本概念,然后探讨了5个网络模型,分别给出可靠性的分析结果,最后得出关于网络可靠性建设的若干结论。二、有线电视网的可靠性分析1可靠性工程的基本概念1.1定义根据ITU-TG.106建议,可靠性最基本的几个概念定义如下:可靠性(Dependability):用来描述系统可用性及其影响因素(可靠度、可维护性、维护支持性能)的一个集合的术语。可用性(Availability):一个系统在给定时间内完成某项预定功能的概率(假定外部资源已提供)。可用性的内涵包括可靠度、可维护性和维护支持等方面,如图1所示。图1可用性的内涵可靠度(Reliability):一个系统在给定状态下、给定时间内完成某种功能的能力。对于不可修复的系统,从开始使用到报废为止的这段时间称为该系统的寿命;对于可修复的系统,两次故障之间的时间间隔也称为寿命。寿命T是一个随机变量,其概率分布函数F(t)表示寿命T小于和等于时间t的概率。与之对应的1-F(t)表示寿命T大于时间t的概率,即到时间t系统尚在正常工作的概率,称为系统的可靠度R(t),满足下列关系:+tR(t)=1-F(t)=f(T)dT∞∫(1)式中f(T)是寿命的概率密度函数,通常表示为T-f(T)=ell,l称为失效率。于是有tR(t)=-el。通常电子和光子产品,其失效率与时间有关,具有“浴盆曲线”,两头高,中间平坦。早期高坡来源于产品制造过程中器材和工艺的不完善,一般通过例行试验和高温加速老化来筛除早期失效,使合格产品进入一个失效率为常数l的稳定阶段,通常持续若干年。后期高坡反映产品进入老化期,失效率会随时间上升。可维护性(Maintainability):一个系统在规定的使用状态下,使用规定的程序和资源、在给定条件下进行维护,保持或回复其原有功能的能力。维修支持性能(Maintenancesupport):一个维修组织在给定条件下,根据规定的维修政策,一旦要求即可提供维修一个系统所需的资源的能力。1.2研究对象可靠性研究的对象可分为三个层次:元器件可靠性、设备可靠性和系统可靠性。元器件的可靠性指标是在大量试验基础上的统计结果,而设备和系统的可靠性则在前一层次指标基础上,运用可靠性技术来进行预测。按照研究对象的可修复性,可靠性工程的对象可分为两大类:可修复系统和不可修复系统。研究的目的也可分为两种:研究对象(元器件或设备)在某一时刻的可靠性,研究对象(设备或系统)在一段时间内的可靠性。1.3主要指标可靠性理论基于比较复杂的统计数学方法。工程上可予以简化,常用到以下几个指标:(1)l:平均故障(失效)率。l的单位是Fit;1Fit=10-9/h,或者表示为109小时内的故障次数。一般常用“次/年”作为故障率单位;1次/年≈114155Fit。(2)MTBF:平均故障间隔时间(即平均寿命)。当l为常数时,++001MTBF=Tf(T)dT=R(t)dt=l∞∞∫∫(2)通常l是用于元器件的可靠性指标,MTBF是用于设备的可靠性指标。(3)MTTR:平均修复时间。即从故障发生到故障消除所需要的平均时间。(4)A:可用度(Availability)。可用性的定量描述。(5)U:不可用度(Unavailability)。与可用度相对,U=1-A。需要指出,上述各项指标都是概率统计意义上的平均值或计算值。1.4可靠性模型在可靠性研究中,需将实际的研究对象按可靠性技术抽象为可靠性模型。基本模型有两种:串联和并联。N个串联单元的不可用度:US=U1+U2+……+UN(3)N个并联单元的不可用度:Up=U1×U2×……×UN(4)还有串并联混合模型,可先处理并联部分,得到一个等效部件,然后进行串联计算。2有线电视网可靠性工程的意义2.1多功能开发的需要有线电视网的发展方向是宽带综合信息网。显然,综合信息网上所有业务要求的可靠性都比广播电视要求的高。在有线电视网上要开发多功能业务,除了技术上的升级改造外,还必须具备相当于电信网的可靠性,才能有用户、有市场、有竞争能力、有投资效益。2.2实用价值(1)在网络规划阶段,根据网络构建方案和规定的功能绘制可靠性模型,可以通过计算比较不同方案的可靠性指标,作为方案优选的评价条件。(2)通过可靠性计算,了解各种设备(器件)造成中断的概率的可能分布,预测系统可靠性的薄弱环节,为设备选型决策提供参考。(3)对建成系统,若较完整地收集实际运行中的故障和维护数据,并按可靠性工程的方法进行分析,就可以使系统维护组织(包括组织机构、管理体制、维护计划、工具仪表车辆配置等)更科学、更有预见性和针对性。(4)可以根据可靠性分析提供的数据,科学合理地确定设备器材备品备件的库存(型号、规格、数量等)。(5)总之,可靠性工程运用于有线电视网的规划、设计、施工、运行等各个环节,都可以起到强化管理、优化决策、科学投入、提高网络整体水平和效益的重要作用。3有线电视系统可靠性分析方法3.1基本前提无论对于一个系统或一台设备,它开始工作后发生故障的时间和故障发生后恢复功能所需的时间都是随机变量,只能用概率论和统计的方法来研究处理。只要遵循正确的法则,这样研究处理所得的结果,与在较大范围(如城域网)内和较长时间段(如几年)内一个系统实际运行的状况是相当接近的。根据可靠性工程理论,有线电视系统是一个可修复的系统,即当系统因故失去规定功能时,可以通过维修恢复该系统的规定功能。因此,用系统的可用性来衡量它的可靠性性能。由于我们关心的是系统在长期运行中的可用性,因此可以使用“固有可用度”(或称“稳态可用度”),即:AMTBFMTBFMTTR系统的可用时间系统可用度=系统的可用时间+系统的不可用时间=+(5)这里,“可用时间”和“不可用时间”都是概率统计意义上的平均时间,而在有线电视系统,无论是正向传输还是反向传输,目前还没有明确的定义。工程上,现在是以“信号中断”定义为“不可用”。3.2有线电视系统可用度的简化计算方法按国际电工委员会在IEC-728-1标准中的规定,有线电视系统的定义域为前端输入口至系统输出口之间。对于没有备份设备的有线电视HFC系统,可看作串联结构,即其中任何一个设备或器件失效,都会造成系统失效,而且每个设备的失效事件都是统计独立的。其下行可靠性模型图2所示。图2有线电视HFC系统的串联模型对于系统中有热备份和自动切换设备或光缆线路有路由保护(如环形网络)的情况,即对于有冗余保护的网络部件,可看作局部并联结构。将其按U=U1×U2折算后,再按串联元件进行系统计算。在实际计算中,MTTR常取“小时”为单位,MTBF取“年”为单位,则MTBF的倒数(l)就是设备(器件)在系统运行中的年故障率AFR。一般情况下,对于各设备(器件),MTBFMTTR总能成立,而且U也总是1。在这种条件下可以认为,系统总的中断时间是串联结构中各个设备(器件)引起的中断时间之和。经过上述简化,有线电视系统可用度可按以下步骤计算:由第i个设备(器件)造成的平均中断时间(单位:分/年):Ti=AFRi×MTTRi×60(6)若第i个设备有冗余保护,则Ti=(AFRi)2×MTTRi×60(7)系统在一年中的平均中断时间(单位:分/年):Ni1siTT==∑(8)系统的不可用度:ssTU525600=(9)系统的可用度:ssTA1525600=-(10)3.3设备和器材的可靠性数据设备和器材的两个基本数据为MTBF(或AFR)和MTTR。严格讲,设备的MTBF值应该是根据其基本元器件的l值(在美、英、日等国都有规范化的数据表)按可靠性理论计算出来,结合高温老化试验数据和一定数量设备在相当长时间实际运行的统计数据而得出的。一些设备(器件),如放大器、分支分配器等,国家标准有明确的MTBF要求和检测方法。进口设备一般都可提供其MTBF数据。我们在工程计算时,只能依据标准或有关厂家提供的数据。有一些故障,如光缆、电缆的中断,大部分是外力的破坏;电缆接头接触不良一类的故障,则主要由于施工质量原因,属于人为的失误。这类故障率,只有通过积累系统运行数据并进行统计处理后获得,其结果还会因时因地而异。故障出现后,要经过检查、识别、定位、修复和核查过程,还可能出现技术延迟和后勤延迟。MTTR不仅与设备(器件)的种类和所在位置有关,与网络营运商是否使用网络设备管理系统及该设备管理系统的响应速度和告警能力有关,还特别与维修队伍的整体素质(包括体制、管理、责任心、技术素质及维修支援能力等因素)有关。因此也会因时因地不同。在做一个有线电视系统的可靠性分析时,只能尽可能收集有关数据,并根据本系统的实际情况和自己的经验加以确定。实际应用中,也常将程序反过来,即先制定一个系统要达到的可用性目标,再据以确定某一个设备被要求的MTBF和MTTR,也就是对其质量档次和维修时限提出要求。三、有线电视系统可靠性分析示例3.1系统概况考虑一个中等城市的有线电视HFC网,采用1550nm光纤传输系统,包括光发送机、光开关、光放大器、光接收机等设备。对系统可靠性分五种情况进行计算分析:(1)网络结构为星-星-树形。没有采用网络设备管