HUAWEITECHNOLOGIESCO.,LTD.35pt32pt):18pt中国电信LTE常见问题案例介绍Page2HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体目录中国电信LTE问题汇总分析LTE故障排查流程和故障处理方法业务类故障处理---CL互操作类设备类故障处理---传输类设备类故障处理---射频类业务类故障处理---吞吐量类业务类故障处理---接入类/切换类附-ANR与X2自建链Page3HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体中国电信LTE问题分析汇总能力建设经验固化问题处理①④③②⑤⑥案例查询问题接收专项提升反向审视补充完善总结分析通过30地市实验局,30000+基站的交付情况看,问题类型聚集,主要类型问题占比:90%,非质量问题占比:91%问题类型聚集,非质量问题占比很大问题分析两个靶心:1.质量问题2.非质量问题问题汇总分析Page4HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体中国电信LTE问题分析汇总非质量问题质量问题吞吐量RR平台RRU互操作算法操作维护告警切换接入开站/升级CELLML2问题占比3.63%2.72%3.63%1%8.18%3.36%16.2%1.27%11.8%13%28.4%1.81%1%措施81.2%18.8%1、完备的武器库2、有效的传递渠道,将问题闭环在前端质量问题问题汇总分析Page5HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体目录LTE故障排查流程和故障处理方法中国电信LTE问题汇总分析业务类故障处理---CL互操作类设备类故障处理---传输类设备类故障处理---射频类业务类故障处理---吞吐量类业务类故障处理---接入类/切换类附-ANR与X2自建链Page6HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体故障排查流程LTE故障排查流程序号步骤说明1备份数据需备份的数据包括配置文件、告警信息、日志文件等。2故障信息收集故障信息是故障处理的重要依据,任何一个故障的处理过程都是从维护人员获得故障信息开始,维护人员应尽量收集需要的故障信息。3确定故障范围和类别根据故障现象,确定故障的范围和种类。4定位故障原因根据故障现象,结合故障信息,从众多可能原因中找出故障原因。5排除故障确定故障原因后,采取适当的措施或步骤排除故障。6确认故障是否排除在执行故障排除步骤后,还需要验证故障是否已被排除。如果故障已排除,故障处理结束;如果故障未排除,返回到确定是否可以判断为另一个故障范围和类别。7联系华为技术支持如果无法确定故障的范围和种类,或者无法排除故障,请联系华为技术支持。Page7HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体故障处理方法LTE故障处理方法备份数据•自动备份,在M2000的集中任务管理中创建周期性备份任务。•手动备份,在M2000的软件管理下创建网元备份任务,选择从“网元上传到OSS服务器”,备份相关文件故障信息收集•具体的故障现象•故障发生的时间、地点、频率•故障的范围、影响•故障发生前设备运行状况•故障发生前对设备进行了哪些操作、操作的结果是什么•故障发生后采取了什么措施、结果是什么•故障发生时设备是否有告警、告警的相关/伴随告警是什么•故障发生时是否有单板指示灯异常确定故障范围•接入类故障:用户无法接入,接入成功率低•切换类故障:同频/异频切换,切换成功率低•掉话类故障:切换掉话,异常释放•异系统互操作类故障:异系统切换异常•速率类故障:速率低或者无速率,速率波动•S1/X2/SCTP/IPPATH链路异常,IP传输异常•时钟类故障:时钟参考源故障、IP时钟链路故障、系统时钟失锁故障•射频类故障:驻波异常,接收通道RTWP异常,ALD链路异常定位故障原因•设备类故障原因相对业务类故障简单,故障范围较窄,系统会有告警和错误提示等信息。用户根据指示灯信息、告警处理建议或者错误提示,可以排除大多数的故障。•接入类故障:一般通过依次检查S1接口、UU接口,逐段定位,根据接口现象判断是否为eRAN故障。•速率类故障:一般先查看是否有接入类故障,若有接入类故障先按照接入类故障进行排查,然后再通过查看IPPATH流量,最终确定故障点。•切换类故障:一般启动信令跟踪,对照协议流程,判断故障点。排除故障•检修线路•更换单板•修改配置数据•倒换系统•复位单板确认故障排查•通过查询设备状态、查看单板指示灯和告警等方法确认系统已正常运行,并进行相关测试,确保故障已经排除,业务恢复正常联系华为支持•局点的详细名称(全称)•联系人姓名、电话号码•故障发生的具体时间•故障现象的详细描述•设备的主机软件版本•故障后已采取的措施和结果•问题的级别及希望解决的时间•一键式日志Page8HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体故障分析思路常用故障分析思路勘查现场,寻根溯源传统的问题分析方法,利用现场留下的蛛丝马迹,推理出可能出现的异常情景。现场勘查对eNodeB而言,需要分析运行过程中记录的关键信息。包括:话统、告警、操作日志、运行日志等信息。逆向推理从某个关键的日志线索中找出非正常的表现,需要对系统有深入的了解。通常在定位深层次疑难问题时使用。如单板异常复位,KPI波动等。深层挖掘模拟现场,情景重现对现场所有记录分析无收获时,或分析难以过大时,通常采用这种重现的方式。现场复原重现问题时,为了充分模拟现网,需要对网络的配置、运维状态、操作过程有所了解。场景组合模拟各种可能的异常场景,尝试找出问题的规律,并予以解决。摸索规律对比互换,原形毕现在对系统深层次技术细节不了解的情况下,该手段有可能收到意想不到的功效。低要求高回报对比是指对比各种可看到的可疑点,如信令流程、话统KPI、监控跟踪等。快速锁定范围互换是指对比后确认的过程。包括单板、光纤等。快速回复业务倒换复位,快速恢复故障定位的目的是解决故障恢复业务,该思路却是跳过定位,直接尝试恢复业务,在商用网络中这些手段通常需优先执行。倒换复位代表了一类快速恢复的手段,我们通常称为X板斧。简洁期间我们通常给出3板斧。针对不同的场景有不同的三板斧,如倒换、复位、拔插等,在具体的场景有详细定义。Page9HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体目录LTE故障排查流程和故障处理方法中国电信LTE问题汇总分析业务类故障处理---CL互操作类设备类故障处理---传输类设备类故障处理---射频类业务类故障处理---吞吐量类业务类故障处理---接入/切换类附-ANR与X2自建链Page10HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体传输类故障传输类故障处理类别常见问题现象传输类典型问题信令终端/吞吐量异常上层应用链路不通(SCTP、IPPATH、OMCH)IP冲突、路由错误等导致业务异常VLAN错误、ARP异常导致链路不通光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通Page11HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体传输类故障传输故障处理思路总体思路:分层/逐段排查定位分层法:根据协议层,逐层定位,定位出实际故障点;逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位;具体排查项:物理层故障排查ARP/IP层故障排查IPPATH异常处理SCTP异常处理问题定界指导:Page12HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体传输类故障传输故障逐层排查方法简介协议层常见问题现象L5信令终端/吞吐量异常L4上层应用链路不通(SCTP、IPPATH、OMCH)L3IP冲突、路由错误等导致业务异常L2VLAN错误、ARP异常导致链路不通L1光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通排查方法应用场景PING通断检测+MTU检测TRACERT传输路径排查、MTU探测UDP环回检测S1/X2链路质量IPROUTE路由排查排查方法应用场景DSPARPARP表项查询DSCP/VLANDSCP与VLAN优先级映射抓包Page13HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体维护通道类故障维护通道类故障处理eNodeBDHCP站点2、自动发现M2000ConfigConfigConfigS/WCME中心机房Support网站1.1、提取版本包1.2、组织配置数据1.4、打开开站工具、上传数据、启动开站上报ESN4、调测License下发1、安装上电3、自动配置ConfigS/W限制和约束:在开站之前,必须:硬件安装完毕,M2000调测完毕,eNodeB与M2000之间的传输正常;eNodeB的软件版本必须从Support网站上取得,并且已经上传到M2000Server。1.3、导出开站列表DHCP自发现失败典型故障Page14HUAWEITECHNOLOGIESCO.,LTD.35pt:R153G0B0:LTMedium:Arial32pt:R153G0B0黑体22pt):18pt黑色:LTRegular:Arial20pt):18pt黑色细黑体维护通道类故障VLAN自学习失败故障处理【eNodeB】上电主动发起DHCP,无VLAN,网关上设置VLAN,报文被传输丢弃。【eNodeB】上电主动发起DHCP,无VLAN,被网关丢弃。ARP广播ARP广播eNodeB被动学习VLAN学到VLANVLAN学习原理VLAN自学习失败案例【问题现象】从Switch(A设备)侧检测不到基站和ATN间交互的数据流量;【问题原因】A设备端口设置为1000M/FULL,与eNodeB协商失败,AR