ZXJ10硬件问题处理方法探析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

ZXJ10硬件问题处理方法探析ZXJ10硬件在工作使用中,因各方面的原因,会发生如通话时出现杂音,PCM不能上报分析与定位等方面的的问题,出现影响或中断用户接听电话等方面的故障,如何排除和解决好这些问题,不但是提高效益的关键,也是提升服务质量的必然要求,为此本人就此作一些探析。一、ZXJ10远端用户单元通话时出现杂音的处理远端模块用户反映通话时出现间断性杂音。首先我们排除由网络情况、环境等原因造成的杂音。进行诊断测试,发现有一条HW有误码。倒换PMSP后再进行测试,无误码。之后更换了当时测试主用出现误码的PMSP,,之后进行拨测,杂音依旧。再次进行诊断测试,和原先情况一样。更换另一块PMSP,,故障排除。一般我们在解决问题的时候首先会想到是由主用板件引起的故障,而PMSP工作方式为负荷分担方式。当话路占上有问题的PMSP时就会出现误码,不管这块PMSP是主用还是备用都会出现误码,也就是说不管这块PMSP是主用还是备用都会出现故障。二、子单元告警屏蔽导致PCM告警不能上报的分析与定位出现具有极快DT板上没有接中继线的PCM子单元不上报告警故障。分析及处理如下:1、首先排除数据配置问题。进入数据配置,察看这些PCM子单元配置是否配置为“暂不使用”,发现这些PCM子单元都是位置为PRA子单元,数据配置没有问题。2、排除告警客户端显示或告警屏蔽问题。查询当前告警,没有发现与这些PCM相关的告警,察看告警屏蔽信息,后台没有评比这些PCM的告警,说明前台MP没有发送这些PCM的告警.3、排除DT单板问题。通过前台信息打印功能,观察这些DT端口的状态上报情况,发现这些PCM子单元上报的状态为3,应该发送告警原因为“PCM物理层断”的告警,排除了DT单板故障的可能性4、排除上面的两个可能性后,问题只能处在告警系统中,但通过测试,除了现在有问题的几个PCM外,其他PCM的告警是能够正常上报的,说明程序处理流程上是没有问题的。5、经过上面的几步分析,可以判断问题可能与这几个PCM子单元的设置有关系,联系到版本中有子单元告警屏蔽功能,如果子单元设置了告警屏蔽,该子单元上的告警不会上报。6、在告警客户端上,启动“子单元告警屏蔽”界面,察看子单元屏蔽信息,发现没有任何子单元屏蔽信息。7、考虑到没有其他故障可能性,只能继续尝试查找其他原因。首先找一个故障PCM,将该子单元屏蔽,传变化表到前台,然后又将该子单元去屏蔽,再传变化表到前台,DT上出现该PCM的告警。至此,问题原因已经找到。一次对其故障进行第步的处理,故障全部排除。至于开始进入“告警子单元屏蔽”界面市委和查询不到子单元告警屏蔽信息呢。这可能是由于在版本升级过程中,保存在数据库中的子单元屏蔽信息丢失而引起的。由于子单元告警屏蔽功能一般使用较少,所以很多人都不知道该功能。所以以后在维护过程中碰到子单元相关的告警问题时,可以通过该程序查看一下,或许问题就会迎刃而解。三、备用MP无法与主用MP同步,网管中显示MP主备颠倒备用MP插上不断复位,更换MP无效;单MP运行时,主备MP均正常,左右槽位也没有问题。网管MP主备显示颠倒(MP运行在左槽位,网管显示在右槽位),更换一对网板后,备用MP能运行起来,但无法同主用MP同步(从网管看。上报状态超时),先后更换后备板,SMEM板,COMM板均无效。四、2M断开却没有告警上报的处理有一个2M,已经断开,却没有告警上报。遇到该问题,首先查看该模块的当前告警是否已满,新告警无法上报。因为一个模块当前告警不能超过300条,否则钱太告警池满,将无法上报。所以复位一个备用SP板,发现告警可以上报,说明不是此问题。再看看告警是否被屏蔽了。从告警屏蔽设置中看,此机架槽位无屏蔽,进入子单元屏蔽设置,也没有发现针对此2M的屏蔽。在子单元屏蔽设置中增加对此2M的屏蔽,传送数据,然后再解除此2M的屏蔽,再传送数据(子单元屏蔽设置需要传送数据!)。告警可以上报了。进一步了解得知,以前因告警太多,曾经屏蔽了一些告警。后来重装服务器。可能为恢复以前数据,而是重新配置的,所以导致屏蔽告警在后台查不到。总结上面问题的处理方法:在告警屏蔽设置的子单元屏蔽设之中,先增加屏蔽,传送数据,然后再解除屏蔽,传送数据。五、交换机时间同步首先说明,ZXJ10交换系统的时间同步和时钟同步是两个概念,两者互不相同,但又相互关联。(在此可加入ZXJ10交换系统的时间同步和时钟同步解释)MP加电后从COMS中读取当前时间的基准值,但是之后的时间累加是参考SYCK累加值,而不是COMS中的时间。所以时钟同步会影响到时间同步。前后台系统(各模块、终端)与2号模块主用MP会20分钟定时同步一次,这个时间间隔是由272号定时器决定的,可修改。时间同步操作可在话单中相应字段体现,同时在前后系统中MP中的CLOCKLOG中记录的文件也可以记录响应时间调整信息,但注意是304B5和V311才支持。2号模块MP复位不会进行同步时钟(无论主备),20分钟以后才进行;一般来说,即使复位了,COMS时钟还在跑,因此各个模块时间不会因此产生太大差异。六、交换机和zxj10对接出现双不通的故障处理交换设备和zxj10对接后,zxj10上新增加了两个模块,偶尔会出现双不通的情况。现场拨打测试,在出现故障时被叫用户可以振铃,但提机后双方听不到声音。进行信令跟踪,发现双方的收发消息都是正常的,挂机后再次拨测又自动恢复正常,并且ss和某局交换设备以及zxj10上没有任何告警。1、在zxj10老模块上对所有该局向所有S个的2M均指定中继拨测过正常,排除交换设备与zxj10之间的话路中继鸳鸯线或CIC对错可能。2、SS测到该局向的中继分布在A个TG,B块SDTB板上,而且这些SDTB板在不同架不同框上,在SS侧分布在C个中继群,每个中继群均在不护为主备的SPC板上处理,但故障时这C个群均出现过双向不通的现象,排除SS侧个别设备故障导致问题。3、故障时从SS侧看,制定同一个时隙拨测也有时通,有时双向不通。4、由于交换机侧新扩模块后出现问题,怀疑交换侧模块间连接故障。5、在交换侧采用模块间HW拨测发现有HW异常,检查这些HW都是固定在新扩模块的第二对FBI上的。检查这对FBI的面板指示灯都是正常的,后将单板拨出后检查,发现其中的平衡/非平衡跳线跳成平衡状态。6、FBI的X3、X5、X6跳线是表示输入、输出工作状态跳线。如果FBI单板插在BNET层,则此处应该选择非平衡输入,非平衡输出时跳在“100”;如果FBI单板插在OPT层,则此时要工作在平衡输入,平衡输出时跳在“100”;如果FBI单板插在OPT层,则此时要工作在平衡输入,平衡输出时跳在“001”(“0”表示短接,“1”表示断开)。7、现场将第二对FBI的相应跳线改为非平衡状态后测试观察正常。这个问题很典型,由于新扩模块用了两队FBI,其中第一对跳线正常,而第二对跳错了。所以出现上述问题。如果现场只配置了一对FBI并且跳线异常,这个问题就比较简单了;此时会出模块间通信中断故障,我们首先会检查模块间的HW和相关单板硬件。但是现场这种特殊错误导致了故障时消息走第一对正常的FBI,话路走第二对故障FBI,进而表现为故障时信令查看正常,被叫侧能振铃,但提机后双方不通。对于这种故障(FBI跳线出错),无论在面板上还是在告警上看到的都是正常的,无法识别这种错误状态。故而此问题具有一定隐蔽性。现场工程中,由于FBI跳线错误导致的模块间不通、话路异常的问题发生频率较高,因此无论是新开局还是扩容、更换单板,都需要注意FBI单板跳线情况。七、电话接通后却无法通话的处理用户反映20#模块有电话接通后无法通话的现象。电话可以接通,证明消息通信正常;无法通话,证明话音接续有问题。诊断测试模块间连接2#与20#,发现2#模块的平面10与平面(1、2、3、4)的HW16-19有严重误码,而2#与20#模块间测试正常。怀疑问题出在2#模块平面间接续。倒换HW16-19的DSNI板,故障仍存在。倒换平面10的FBI,故障恢复,诊断测试也通过。联系用户测试也正常了。在倒回FBI板,诊断测试又报严重误码。说明原备用FBI有问题,需要更换。这个故障其实不只是影响到20#远端模块,而是所有通过这块故障FBI板与2#模块接续的远端模块都会出现无法通话的现象。八、用户板铃流故障的排查某模块的用户反映有很多用户的电话振铃异常,并且问题出现在整个模块,有的用户矿比较严重。用112测试有问题的话机发现铃流电压为20~60V之间,而正常话机的铃流电压为80V左右,并且出问题的用户主要集中在第二架的第一二框,其他框不是很多。1、首先检查单板硬件版本既有B09905又有BO105还有B0206的,都存在问题,证明不是某个批次影响的;2、检查现场的接地情况没有问题;3、检查背板上的铃流电压都是-74V,没有问题;4、用万用表测量用户线上的铃流电压发现,正常的电话摘机电压稳定在-52V,振铃时的电压峰值为-72v,而有问题的用户摘机电压也是-50V,但是振铃时的电压峰值都远小于-72V,听到的铃音也是短促,并且声音较小,最后将有问题的用户单板更换,问题解决。九、一个远端模块通信瞬断故障的定位有一个远端模块,通过2M连接,有时在告警上看会出红叉,即模块间通信端,有时又恢复。主备通讯链路分布在2个2M上。用moniporj观察,发现主备链路的状态都是1,即链路是存在的,但线路状态中,接受错误中的各项参数都比较大,尤其IVBA值不断增加。这个值是MPMP板中的HDLC芯片的一个参数值,主要与时钟有关,与传输也有关(传输不好当然可能影响到时钟)。启动模块间通讯测试后,有时正常,但有时会突然产生大量收发失败。派人到远端配合检查,将2个通信所在2M分别断开测试,发现都有误码,从传输设备看,其误码告警只是灯亮的与moniproj产生失败正好是一致的,所以确定是传输通道不好,需要解决传输问题。zXJ10硬件系统的故障当然还有许多,其产生的原因也是多种多样的,本人只是根据在工作中的实践经验和做法,以及撑握的相关知识,对相关故障的查找、排除作一个探索,希能达到抛砖引玉的作用,而且使同行在出现相同故障时,能节省时间,尽快的达到排除故障提高工作效益的目的。PMSP:外围多功能用户外理器板,用于远端用户单元,相当于A型机的PP板或B型机的SP板。每板配置2路E1,同时集成了烟雾、红外、温度、湿度监控功能,两块板工作于负荷分担方式。PCM:脉冲编码调制。引申意为数字中继基群,一个PCM系统即一个2M,或者一个E1COMS:是否应该为CMOS?(本意是指互补金属氧化物半导体,一种大规模应用于集成电路芯片制造的原料)是微机主板上的一块可读写的RAM芯片,用来保存当前系统的硬件配置和用户对某些参数的设定值。CMOS可由主板的电池供电,即使系统掉电,信息也不会丢失。MP其实就是一台工控微机,所以也有CMOS设置FBI:光接口板,ZXJ10机用于通过光纤连接中心模块CM和近端模块PSM的接口板,工作于热主备方式。可位于光电接口层BNET层和光接口层BFBI(OPT)层,在BNET层的PCM线是不平衡驱动的而在BFBI层的PCM线则是平衡驱动的,两者接口实现采用跳线方式。DSNI板:数字交换网接口板,主要提供MP/SP/DTI/ASIG与T网之间信号的接口,完成MP/SP等与T网间各种传输信号的驱动功能MPMP:模块间通信板

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功