传输问题导致E-RAB建立失败案例2020-1-7机密,未经许可不得扩散第1页,共4页传输问题导致E-RAB建立失败案例沈星宇中国移动通信集团舟山分公司摘要:舟山从3月底开始出现大量因传输层问题导致E-RAB建立失败的情况。舟山区域所有基站均下挂在诺西SAE,E-RAB建立失败的信令中诺西MME给基站指配的却是华为SAE的IP地址,舟山基站与华为SAE传输未做通,导致E-RAB建立失败。而诺西MME给基站指配华为SAE的原因为诺西核心网不支持同时跨MME和SGW的切换,所以从华为MME切到诺西MME时,SGW不会变。这样后续建立E-RAB时,诺西MME就会下发之前的SGW的地址给eNodeB。关键字:传输问题E-RAB建立失败诺西MME一、背景3月29日开始,舟山定海区域部分基站不定时出现传输问题导致ERAB建立失败的情况,次数从几百次到上万次不定。时间全网完整度ERAB建立成功率(ALL)(%)传输层问题导致E-RAB建立失败次数03/27/2014全网99%98.8612703/28/2014全网99%99.3622803/29/2014全网98%99.1294338203/30/2014全网99%98.6764003/31/2014全网97%99.3125004/01/2014全网99%99.310789504/02/2014全网99%99.393944804/03/2014全网98%99.7946101404/04/2014全网99%98.848195004/05/2014全网99%98.9919465604/06/2014全网98%98.518411716二、问题分析传输问题导致ERAB建立失败占比较高的站点分布全部集中在从宁波到舟山城区的高速沿线。传输问题导致E-RAB建立失败案例2020-1-7机密,未经许可不得扩散第2页,共4页选取指标差的站点,查询基站是否有告警,发现这些基站均不定时出现用户面承载链路告警:与该站点ERAB建立指标对比,发现告警出现时间和传输问题导致ERAB建立失败的时间点吻合。例如上下2图中5月1日7点,9点出现告警,同时基站ERAB建立失败次数明显增加。重新分析告警,发现用户面承载链路失败均指向这些地址,且无法PING通:传输问题导致E-RAB建立失败案例2020-1-7机密,未经许可不得扩散第3页,共4页100.67.252.7100.67.252.8100.67.252.9100.67.252.10100.67.252.11100.67.252.12100.67.252.13100.67.252.14100.67.252.15100.67.254.21100.67.254.22100.67.254.23100.67.254.24100.67.254.25与核心网同事确认,这些地址为华为核心网SAE地址,舟山区域所有基站均下挂在诺西SAE,所以舟山的eNodeB与华为的核心网是不通的。4月30日,对舟山所有站点中包含上述对端地址的USERPLANEPEER和UP2EPGROUP信息进行删除操作。但5月1日查询这些基站,此前删除的链路又被自动建立:抓取异常基站的S1口信令分析,发现在S1AP_INITIAL_CONTEXT_SETUP_REQ信令中,MME会将华为的SAE地址(即上文中提到的IP地址)作为SGW的目标IP指配给基站。而在建立E-RAB过程中,基站与这些华为SGW是不通的,这就导致了因传输问题E-RAB建立失败。与诺西核心网专家确认,这个问题出自诺西核心网对MME和SGW同时改变的切换不支持有关。诺西MME有个参数MME_SGW_RELOCATION未开启,所以从华为MME切到诺西MME时,SGW不会变。这样后续建立E-RAB时,诺西MME就会下发之前的SGW的地址给eNodeB。非临界ENODEB也会出现此场景:ENB1(HWMME)-ENB2(NSNMME)-ENB3(NSNMME),ENB3同样也会因传输问题导致E-RAB建立失败。三、结论目前解决该问题有2个办法:1.打通基站到华为SGW的传输。(较推荐,可立即执行)2.待诺西SAE版本升级解决同时跨MME和SGW的切换。舟山通过办法1打通了基站汇聚PTN到这些网段的传输。全网E-RAB建立成功率明显提升。传输问题导致E-RAB建立失败案例2020-1-7机密,未经许可不得扩散第4页,共4页时间全网E-RAB建立成功率无线接通率(%)传输层问题导致E-RAB建立失败次数05/27/2014全网98.454297.71043999305/28/2014全网99.602299.4065246805/29/2014全网99.738599.6595106605/30/2014全网99.33399.30591930405/31/2014全网99.750999.72022106/01/2014全网99.746799.7258801该问题严重影响用户感知,未解决的情况,用户需重新附着后才可正常上网,对全网指标影响也非常显著,解决问题迫在眉睫。