LTE核心网关键性能指标提升陕西公司2014.10性能管理体系目录4G健康度体系及指标分析流程优化工作成效*智慧运维智慧管理提高客户网络满意度目标网络品质成本效益核心KPI+健康度+客户感知三个手段一个体系四个步骤123华为PSToolkits4G健康度LTE信令监测集中故障监控问题发现问题定界问题定位解决与验证以塑造LTE“精品”网络为目标,以客户感知为核心,以“智慧管理、智慧运维”为突破口,通过”一个体系,三个手段,四个步骤”的方法,系统推进LTE性能指标提升工作落地,完成全省4G网络指标达到挑战值。陕西公司LTE性能管理体系.4G健康度定义指标门限4G健康度为集中故障监控提供性能指标告警门限。PStoolkits日志分析通过PStoolkits工具分析设备CHR日志,进行精确定位。LTE信令监测通过信令监测系统多维度分析,进行失败原因定界。集中故障监控指标异常实时监控指标,低于门限即生成集中化故障工单,通过EOMS下发。问题发现问题定界问题定位性能管理运作流程通过集中故障监控发现指标异常,生成工单下发维护人员,借助LTE信令监测系统多维度统计,进行失败原因定界,CHR分析设备错误日志定位根因,解决后回复工单归档。性能管理体系4G健康度体系及指标分析流程优化工作成效*4G健康度-优化考核体系性能指标分地市集中故障监控指标门限定义建立4G健康度指标体系,借助LTE信令监测系统,实现指标分地市呈现,从接入性、移动性、保持性三方面综合评比地市指标优劣,并作为集中故障监控系统性能指标告警派单标准。集中故障监控平台主动监控问题发现问题定界问题定位解决与验证1、集中故障监控平台设立LTE场景,实时监控全省设备指标情况2、当LTE关键性能指标低于门限值,会生成Eoms告警工单。3、EOMS故障工单T1处理角色经过指标预处理后,将工单派发T2处理。4、T2接到工单通知,随后对指标问题进行定位、解决及归档处理。集中故障监控-问题发现自动派单指标异常短信通知主动监控告警呈现自动派单问题处理归档借助集中故障监控平台实现实时性能管理工作的落地,4G实时性能告警监控实现基于4G实时性能指标的集中监控、集中预处理和集中派单,并跟踪反馈结果,实现闭环管理。LTE信令监测-问题定界问题发现问题定界问题定位解决与验证MMES-GWeNodebP-GWS11S1-U数据采集器(Detector)枢纽楼/锦业路机房HSSS6aS1-C陕西公司全网集中部署LTE信令监测系统,通过LTE信令监测对相应指标异常网元进行基于TAC、enb、小区用户等多维度分析,结合失败原因值定位出大致原因,实现异常指标失败原因的快速定界。系统部署拓扑情况原因值钻取全程关联信令统计统计问题网元异常指标失败次数,失败原因值占比,聚类TOP失败原因值统计附着、请求、释放等信令关联分析S1-c、S6a、S10/11接口信令,定界问题网元网络指标问题定界S1-MMESGSS6aS10/11事件合成全程关联成功率异常次数时延分析分级告警信令交互图多维度钻取时间端口事件类型业务TOP排行设备问题发现问题定界问题定位解决与验证多维度统计异常指标分析失败原因钻取问题定界34%27%18%9%6%1%占比(%)(#7EPSservicesnotallowed)(#111Protocolerr,unspec)(#7Servnotallowed)(#15NosuitablecellsinTA)(#19ESMfailure)(#15NoSuitCellsInTA)LTE信令监测-问题定界1、集中故障监控派单后,通过LTE信令监测对相应指标异常网元进行多维度分析。2、统计结果显示宝鸡TAC37238跟踪区下指标明显很低下,拉低整体指标3、对于该TAC下EPS附着失败次数进一步钻取统计失败原因值。4、TOP3失败原因为#15、#111、#19,#111失败占比最大,问题定界为:MME1指标异常主要由TAC37238下#111过多导致。问题定界流程中兴系统进行问题定界问题发现问题定界问题定位解决与验证CHR分析工具-问题定位目前,从LTE信令监测系统统计到的称为协议失败原因值,对于不同厂家的设备,每个协议失败原因值,都是由一个或多个外部/内部失败原因映射而成,后者才是导致指标异常的根因。PStoolkits有助于快速分析CHR设备错误日志,找到协议失败原因与外部/内部失败原因的映射关系。1、LTE信令监测的协议失败原因统计2、通过PSTOOLKITS提取MME错误日志,细分协议失败原因值对应的内部失败原因3、通过内部原因,可以将问题进一步细化至设备具体问题,如ERAB建立超时、Enodeb传输资源不足、SAEGW资源不足、DNS解析失败、取鉴权集失败、签约信息错误等,并针对性的解决问题。USN_MM_S1AP_CAUSE_RADIO_NW_FAIL_IN_RADIO_ITF_PROCUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_CTRL_CREAT_DFT_BR_RSP_FAIL63%23%10%3%2%0%Attach协议失败原因分析#7EPSservicesnotallowed#111Protocolerr,unspec#15NoSuitCellsInTA#16MSCtemporarilynotreachable#19ESMfailureUSN_MM_S1AP_CAUSE_TRANSP_RSRC_UNAVAILABLEUSN_MM_UDM_CAUSE_USER_UNKNOWNUSN_MM_CSFB_TAILAI_RECORD_NOT_FIND无线核心网用户协议原因值外部原因值内部原因值ATTACH失败原因分析-映射关系表问题发现问题定界问题定位解决与验证协议失败原因外部原因值内部原因值#7EPSservicesnotallowedMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTIONMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_GPRS_DATAMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_NO_GPRS_DATA#15NoSuitableCellsIntrackingareaMM_HSS_AUTHORIZATION_REJECTEDUSN_MM_UDM_CAUSE_AUTHORIZATION_REJECTEDMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTIONMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_GPRS_DATAMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_NO_GPRS_DATAMM_HSS_USER_UNKNOWNUSN_MM_UDM_CAUSE_USER_UNKNOWN#19ESMfailureMM_SM_FAILUSN_MM_CTRL_CREAT_DFT_BR_RSP_FAIL#16MSCtemporarilynotreachableUSN_MM_CSFB_TAILAI_RECORD_NOT_FINDUSN_MM_CSFB_TAILAI_RECORD_NOT_FIND#17NetworkfailureMM_HSS_EQUIPMENT_UNKNOWNUSN_MM_UDM_CAUSE_FAILUREMM_HSS_MESSAGE_WRONGUSN_MM_UDM_CAUSE_MESSAGE_WRONG#111Protocolerror,unspecifiedMM_S1_ENB_RSP_FAILUSN_MM_S1AP_CAUSE_RADIO_NW_FAIL_IN_RADIO_ITF_PROCMM_S1_ENB_RSP_FAILUSN_MM_S1_RELEASE_ATTACH_WAIT_AUTH_RSPMM_S1_ENB_RSP_FAILUSN_MM_S1AP_CAUSE_TRANSP_RSRC_UNAVAILABLEMM_S1_ENB_RSP_FAILUSN_MM_S1_RELEASE_ATTACH_WAIT_SMC_CMPMM_S1_ENB_RSP_FAILUSN_MM_S1_RELEASE_ATTACH_WAIT_ATTACH_CMPMM_S1_ENB_RSP_FAILUSN_MM_S1AP_CAUSE_RADIO_NW_RADIO_RSRC_NOT_AVAILMM_SM_NO_RSPUSN_MM_CTRL_CRT_DEFAULT_BR_TIMEOUTATTACH失败大致可分为三类:用户原因,签约问题和鉴权失败等;核心网原因,核心设备参数配置问题、路由问题、硬件问题等;无线原因,ENODEB参数配置和设备异常等问题。用户原因核心网原因无线原因•USN_MM_S1AP_CAUSE_RADIO_NW_FAIL_IN_RADIO_ITF_PROC无线侧建立eRAB超时或者失败,检查ENB。•USN_MM_S1_RELEASE_ATTACH_WAIT_AUTH_RSP等待鉴权回应超时,S1释放,检查ENB。•USN_MM_S1_RELEASE_ATTACH_WAIT_ATTACH_CMP等待ATTACHcomplete超时,S1释放,检查ENB。•USN_MM_S1_RELEASE_ATTACH_WAIT_SMC_CMP安全算法响应超时,检查终端。•USN_MM_S1AP_CAUSE_TRANSP_RSRC_UNAVAILABLE传输资源不可用,检查EnodeB是否有射频告警,eRAB建立成功率较低。ATTACH失败处理建议-解决与验证问题发现问题定界问题定位解决与验证•USN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION取鉴权集失败,检查用户是否为废卡或签约错误。•USN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_GPRS_DATA没有签约4G业务。•USN_MM_UDM_CAUSE_USER_UNKNOWN用户没有签约数据造成取签约时失败。•USN_MM_UDM_CAUSE_AUTHORIZATION_REJECTEDHSS返回安全失败。检查HSS中是否有该用户的安全四元组信息。•USN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_NO_GPRS_DATA没有签约PS业务。•USN_MM_CTRL_CREAT_DFT_BR_RSP_FAIL创建默认承载失败,检查是否由异常APN引起,或SAEGW异常。•USN_MM_CTRL_CRT_DEFAULT_BR_TIMEOUT创建默认承载时超时,检查SAEGW负荷及链路状态。•USN_MM_CSFB_TAILAI_RECORD_NOT_FIND联合附着的位置区对应关系找不到,核查TAILAI配置。USN_MM_UDM_CAUSE_FAILURE(HSS)USN和HSS之间链路问题,检查USN到HSS间链路,检查HSS的运行情况,以及检查用户的签约数据是否存在问题。用户原因核心网原因无线原因TAU失败原因分析-映射关系表问题发现问题定界问题定位解决与验证协议失败原因外部原因值内部原因值#7EPSservicesnotallowedMM_HSS_UNKNOWN_EPS_SUBSCRIPTIONUSN_MM_UDM_CAUSE_UNKNOWN_EPS_SUBSCRIPTION_GPRS_DATA#15NoSuitableCe