文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第1页,共22页东莞TAC割接后掉话恶化分析1问题描述5.15日凌晨将TAC10250和TAC9822割接到新建的MMEPool后,无线掉话率恶化,不能恢复;5月26日对TAC9982和TAC9243进行割接,无线掉话率也恶化,不能恢复,MME为华为设备。2前期初步分析第一批割接的10250和9822前期分析,TOP小区均是在POOL边界;掉话主因是UELOST。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第2页,共22页文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第3页,共22页3深入详细分析由于第一批割接伴核心网DNS数据映射错误的切换问题,本报告重点以第二批割接TAC9982/9243掉话抬升为例进行分析。3.1掉话原因第二批于5月26日凌晨割接,即5月29日核心网整改DNS(解决MME间TAU更新成功率问题)后进一步恶化。主因是UELOST增加。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第4页,共22页3.2掉话TOP站分布经过分析,掉话增多并非整个TAC所有站均有所增多,掉话TOP站分布有一定关系,目前来看属于POOL边界:3.3挑选新增掉话TOP站挑选条件:割接前每天掉话次数少于100次;割接后新增掉话次数排序,挑选TOP,确保目前跟到的掉话信令基本都是属于新增的掉文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第5页,共22页话。3.4掉话信令经过跟踪典型TOP站分析发现,新增的掉话信令具有明显的共性特征:均是S1切换到目标侧后在几百毫秒内掉话。典型信令如下:行标签2015-05-122015-05-132015-05-192015-05-202015-05-262015-05-27temp东莞国龙工业区F-HLH-2839510270754500539.5东莞长安新农村F-HLH-346403435240229195.75东莞谨头过坡村D-HLH-337263238157146118.25东莞金裕酒店D-HLH-1278278391296818962579.25东莞谨头过坡村D-HLH-180638855213166118东莞白沙墩D-HLH-1491181239199文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第6页,共22页统计切换入的eNodeBID发现均是其他POOL的TAC切换入本TAC。信令深入分析:用户首先从东莞大新围站点Attach接入。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第7页,共22页通过wireshark解析分析发现给该用户分配的M-TMSI为:D71A1421切换到目标侧手机立马掉话,eNodeB10秒不活动定时器超时释放UELOST。其实该UE切换到国龙工业区后立马掉话后,又立马重新在大新围站点Attach接入。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第8页,共22页从其携带的M-TMSI信息可以确认是同一个用户。但是UE切换到目标侧国龙工业区后,又立马掉话,原因为UELOST。POOL边界:整个流程如下:文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第9页,共22页3.5该问题与已知问题相同掉话率恶化点出现TAC边界区,目前怀疑掉话是因为个别终端被核心网用#15nosuitablecellsintrackingarea拒绝,终端将该TAC记录在forbiddentrackingareasforroaming列表中,导致终端后续连接态切换到forbiddenTAC区域内的小区后UE自动掉话。针对该怀疑点的理论分析及协议原理摘录如下:(1)终端在发起InitialNAS流程(TAU/Attach/Servicerequest)时,MME可能因为网络侧异常(如:宜昌出现的DRA改造异常,导致MME与HSS间diameter消息交互异常;或者核心网改造恢复过程中时序配合问题等),而发送携带#15原因值的TAUreject/Attachreject/Servicereject,此时UE会将当前TAI记入forbiddenTA列表:24.301:文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第10页,共22页(2)TAforbidden列表会在UE关机/USIM卡移除/UE内部维护的周期定时器(12~24小时间)超时后,才会清除掉24.301:(3)而后处于该forbiddenTA边界区的UE可能接入到相邻的TAC小区中进行业务,但forbiddenTAC的邻区信号在满足条件后,UE会在连接态切换到forbiddenTAC的邻区,切换到目标邻区(UE在目标小区发送切换完成消息RRCConnectionReconfigurationComplete)后,搜索目标小区的SIB(含TAI信息)后,才发现该小区属于forbiddenTA小区,所以,UE自行掉网离开了目标小区,导致目标小区掉话。协议规定UE是在切换完成后,才发起SIB消息捕获:36.331:文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第11页,共22页5.3.5.4ReceptionofanRRCConnectionReconfigurationincludingthemobilityControlInfobytheUE(handover)TAI信息是在SIB1消息中发送的:3.6实验室验证被#15号原因值拒绝终端表现实验室构造模拟复现场景:源站:PCI=159,TAC=1目标站:PCI=158,TAC=5(TAC=5被构造成TAU失败以15号原因拒绝)成功复现出,终端被拒绝后的表现:1)只有158的信号时,被拒绝后终端被释放RRC连接后,无法入网,终端侧显示不停地在搜信号,最后显示无服务。2)从159切换入158时,网侧必现掉话,概率100%。3.7禁止TAI列表终端被网络以15号原因拒绝后将TAI加入FTAI。并启动类似定时器,ds1=MM=Start87,timeout43200:0(43200s?/3600=12h?)。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第12页,共22页3.8终端芯片公司对此的答复CreatedBy:OnkarUpadhyay(2/11/20154:52AM)DearCustomer,IwillanswerabouttheNASrelatedprints.Youunderstandingiscorrect.Thisistimer:EMM_FORBIDDEN_TAI_CLEAR_TIMER文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第13页,共22页Thisissetfor12hrinanditisinaccordancewithNAS3GPPspecification24.301==============================================5.3.2ListsofforbiddentrackingareasTheUEshallstorealistofforbiddentrackingareasforroaming,aswellasalistofforbiddentrackingareasforregionalprovisionofservice.TheselistsshallbeerasedwhentheUEisswitchedofforwhentheUICCcontainingtheUSIMisremoved,andperiodically(withaperiodintherange12to24hours).=================================Regards,Onkarnath3.9被拒绝后空闲态重新搜网的表现终端被网侧以15号原因拒绝,并释放RRC连接进入空闲态。终端将被拒绝的TAC加入到FTAI“禁止TAI列表”。终端重新搜网,PSS/SSS同步发现,又搜到该小区,还是这个TAC的PCI。读取SIB1后发现该PCI的TAC在FTAI“禁止TAI列表”里面,于是将该PCI加入黑名单。随后再次同步时,就不再主动搜索该PCI小区信息。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第14页,共22页3.10被拒绝后从其他TAC切换入的表现终端正常切换,切换的非竞争的随机接入过程正常,MSG1/2/3正常。随后开始读取系统消息,MSG3过了20ms后就读取到SIB1。读取SIB1后发现该小区的TAC在FTAI“禁止的TAI列表”里面,于是终端释放RRC连接。释放RRC连接后终端重新进入搜网ACQ流程,随后的流程同空闲态重新搜网过程一样。3.11FTAI“禁止TAI列表“的影响总结实验室验证,终端只要被核心网以12\13\15号原因拒绝过一次,终端就将该TAC加入FTAI,文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第15页,共22页时长为43200s即12个小时(其他的终端可能时长不一样,协议规定12小时~24小时)。此时终端12个小时内一直处于该TAC内,未做移动,那么终端将不再搜索4G网络,无法在4G网络空闲态驻留、以及建立连接,除非插拔USIM卡、或者重启手机才能恢复。此时终端从其他TAC正常接入,切换到被拒绝过的TAC小区时,能够正常完成切换流程,但随后几十或几百毫秒(取决于搜索SIB1的快慢)内,UE自行释放RRC连接,重新搜网,此时必然造成无线网侧链路异常;造成无线侧掉话,掉话原因为UELOST。3.12东莞核心网#15号原因值拒绝在割接后突增核对核心网的TAU拒绝指标,在割接后出现#15号原因值突增。区分MME来看104/304/305/306在26日(割接)TAU#15有突增,101/102/201/202在5月28日(DNS调整),6月5日有突增。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第16页,共22页整体来看,东莞所有MME#15号原因值在在割接后呈增加趋势,特别是在28日后突增近2w次。按时间点统计,104/304/305/306在5月26日凌晨突增,跟MME跟割接强相关。文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第17页,共22页按时间点统计,101/102/201/202在5月28日凌晨之后变多,跟MME的DNS调整强相关。3.13找异常TOP终端POOL边界只要存在这种被#15拒绝过的用户,就无法避免这个问题。一定会造成无线侧掉话。要把终端找出来,把拒绝的找出来,看是否正常,以及怎么规避。3.13.1无线核心网联合抓取信令CHR6月11日联合核心网一起抓取异常终端信息:核心网侧:开启时间:14:30-16:00核心网侧打开POO3,MMEGID:0369的MME的正常呼叫的CHR开关。无线侧跟踪:跟踪时间:14:40-15:40目标站:东莞国龙工业区F-HLH-2只跟踪S1,勾选去掉PAGE消息。源站:只跟踪S1和UU信令,勾选去掉PAGE消息文档名称文档密级2020-1-9华为保密信息,未经授权禁止扩散第18页,共22页3.13.2POOL3反复attach,反复切换入POOL5掉话昨天无线侧拼接了不到一分钟的信令,一个用户反复切换到国龙工业区POO5不到一分钟的时间里掉话6次,又反复重新attach到源站东莞李屋POOL3。已从核心网CHR找到该用户信息:核心网侧对应CHR:3.13.3POOL5历史CHR显示的确被TAC9243以#15拒绝该终端的确被POOL5的国龙工业区所在TAC:9243被#15TAU拒绝过:6月11日凌晨2:47被MME304以#15拒绝TAC9243的TAU:序号目标站切换入时间点目标站CALLID源接入时间点源站信息源站CALLID源站第一条S1行号上报GUTI重新分配GUTI114: