过程规定动作切换KPI恶化/变化时间分析Release notes分析参数核查故障&告警&操作日志排查TOP小区分析切换KPI监控及问题确认问题范围确定问题现象和范围确认关联指标分析问题分析切换流程问题细化分析代码走读典型场景问题分析个别站点异常TOP小区分析镜像环境重现问题分析分析动作说明1、话统分析,参照局点日常监控KPI指标进行切换KPI指标监控。1、切换问题有如下几种1)、升级或其它不明原因导致切换指标突然恶化;2)、切换指标逐渐恶化,可能是业务量逐渐增加、或新用户/新终端类型等不断加入;3)、切换指标一直就比较差,需要优化性能; 1、确定是整网问题、还是TOP站点问题,还是特定载频问题;MOCN场景下是否特定运营商、特定核心网;1、确定问题范围可以用于提炼问题发生的场景,也可以用于评估问题的影响。2、如果是TOP站点问题,进一步确定是否TOP小区问题,以及确定是单向切换问题还是双向切换问题;2、通过问题范围细化还可以初步判断是切换源侧问题还是切换目标侧问题。3、如果是TOP小区问题,进一步确定是否TOP两两小区问题;4、如果是TOP小区问题,进一步确定是否TOP用户;分析切换KPI恶化/变化的时间点和趋势,如果是突然恶化,分析恶化点网络是否有什么动作;如果是逐渐恶化,分析是否业务量在逐渐增加,或有新用户/新终端在不断加入。突然恶化的问题,分析网络的动作除了排查RAN侧的动作(如版本升级、参数修改、RF调整、告警)外,还要分析核心网的动作,对于配置了异系统互操作的网络,还要分析3G2G网络的动作。1、切换问题除了分析成功率,还要分析总次数和失败次数的变化。2、同时分析随机接入、接入、掉话、重建等相关指标是否有数量及成功率的异动1、采一批TOP站点的故障/告警/操作日志;2、分析故障/告警/操作的时间点和KPI恶化的时间点的对应关系如果是R版本或补丁版本升级导致的问题,对Release notes中合入的问题逐个进行排查,确认是否存在切换指标修改的相关问题(如果是V版本升级,因为版本间差异太多,该动作可以跳过)1、列出影响切换指标的问题修改,并确认是否版本间指标定义存在变化按照“参数核查通用指南”进行分析如果是TOP小区/基站问题,把TOP站点和正常站点的参数进行对比找出TOP小区,分析问题的日志从这些TOP小区中采集;关联指标分析主要尝试揭开问题的全貌,并找到一些线索和可疑点。因为TOP小区的问题现象会更明显,那么触发这些问题的因素或场景也会更明显。2、切换KPI不仅要关注全网指标还要关注TOP小区指标。镜像重现也要使用这些TOP小区的配置文件。参照“LTE切换问题定位专家指南”,确认切换流程是在哪一个步骤失败的,缩小问题定位范围。1、搭建镜像环境进行问题重现,通过问题分析中提炼出来的关键特征一定要镜像到。1、关键特征一定要模拟到,可以通过代码打桩等方式。2、网络KPI问题要包括接入、(站内、站间S1、站间X2)切换、重建;2、多用户场景要考虑近、中、远点。3、根据代码走读发现的疑点,构造场景进行复现。3、镜像环境要使用出问题站点的配置1、通过问题分析提炼出问题触发场景后,针对性进行代码走读。敢于怀疑一切。代码走读出来没有异常,不一定没有异常。1、如果是软件类问题,尝试复位基站后问题通常能够解决;2、在常规套路定位不能解决后,尝试复位、下电、换单板这三板斧因为TOP小区的问题现象会更明显,那么触发这些问题的因素或场景也会更明显。