EFLAG“EXPERIENCENETWORKQUALITY”VoLTE丢包弃包分析方法与应用概述无线问题导致丢包是影响VoLTE用户感知的关键因素之一,随着VoLTE业务的快速普及、VoLTE用户数和业务量进入了快速上涨期,为更加准确找到全网VOLTE语音感知差点,北京公司深入分析空口语音调度机制,发现“空口丢包”和“基站弃包”两大关键统计指标可有效表征VoLTE语音感知,减少“空口丢包”和“基站(终端)弃包”是VoLTE语音质量优化提升的重要方向。。VoLTE语音质量的关键特征VoLTE高清语音编码速率为23.85kbps,终端每20ms生成一个VoLTE语音包(使用RTP实时流媒体协议传输),再加上UDP包头、IP包头,在应用层最终打包成IP包进行传输。在无线空口,按照协议IP包进一步被转换成PDCP包,PDCP包就是空口传输的有效数据。PDCP包在终端和基站间传输异常会导致应用层RTP包的丢失,从而引起语音感知差。为实现VoLTE语音包(PDCP层)在终端与基站间的正常传输,则务必保证两个关键点:其一:基站(或终端)不能丢弃PDCP包。业务高负荷、质差引发重传都会大量消耗无线资源,若基站因为缺乏有效的无线资源无法完成对PDCP包的及时调度时,基站(或终端)会主动丢弃VoLTE语音包;其二:空口不能丢失PDCP包。弱覆盖,系统内干扰,系统外干扰都会引发无线网络质差,会直接导致VoLTE语音包在无线空口传输过程中出现丢失。无论空口丢包还是基站弃包,都会直接影响VoLTE用户的实际语音感知。VoLTE“感知丢包”统计为综合表征4G无线质量和VoLTE语音感知,网优中心定义了感知丢包=空口丢包+基站弃包,来表征小区级无线质差VoLTE语音质差小区定义感知丢包率公式上行感知丢包率=上行空口丢包率=上行PDCP丢包数/上行PDCP总包数下行感知丢包率=(下行PDCP丢包数+下行PDCP弃包数)/下行PDCP总包数在7*24小时内出现次数高于20次,且小时统计粒度满足条件:(上行PDCP包1000且上行感知丢包率5%)或(下行PDCP包1000且下行感知丢包率5%)。弃包的原理机制在基站(或终端)在空口发送PDCPSDU之前,由于容量或空口质量问题,PDCPdiscardtimer定时器(目前配置为100ms)超时后会发生主动弃包。例如基站调度了序列号为1/2/3/4/5共5个包,而4/5两个包因容量受限或空口质差在100ms内没有被调度出去,基站侧根据认为超过PDCP丢弃时长而主动丢弃,下行弃包率为2/5=40%。另外,现在海思芯片终端、高通Release10以前的芯片终端,在弃包后语音包序号不会重新排序,在基站侧会统计为上行丢包;而高通Release10以后版本的芯片终端,在弃包后PDCP序号会重新排序,在基站侧上行丢包统计中无法体现上行弃包的情况。目前基站语音包下行发送不出去的原因主要有4个:1)基站打开“异常UE停止调度算法开关”,在空口较差的情况下,一段时间内停止调度该UE,导致弃包;2)大话务或者远点用户较多的场景下,由于CCE不足导致下行调度延迟,最终导致PDCP层弃包;3)空口失步后重同步失败的场景下,下行调度停止,PDCP层数据包超时丢弃;4)切换时UE在目的小区接入出现延迟,数据包转移到目的小区后超时弃包。异常UE停止调度开关弃包原理:基站开启了“异常UE停止调度”算法开关,在空口出现异常UE时,基站会在一段时间内停止调度该UE,直至检测到UE恢复,在此过程中,会出现由于不调度导致PDCP层超时,基站弃包率升高的问题。案例解决方案:关闭该功能,弃包率从最高的0.0818%降为0.0161%。下行反馈出现大量连续的DTX,基站判断为UE异常基站判断该UE异常后,停止调度,CellDT跟踪显示出现0x990e的调度代码,表示该UE异常,在此之后100ms,PDCP即出现弃包。大话务场景CCE不足导致弃包大话务或者远点用户较多的场景下,由于CCE不足导致下行调度延迟,最终导致PDCP层弃包。优化措施:研究在类似场景下的CCE策略方案(基于容量的策略)和将discardtimer拉长的方法来缓解;真正的大话务站需要通过网络优化的方法来彻底解决。切换场景入网时延过长导致弃包原理案例:如下图所示,UE在目的侧第一次入网时间为710,但直至786后才入网成功,时延为760ms,在此期间会出现基站弃包。解决方案:目前基站是在MSG3收到后(UE完全入网)进行调度,12.1版本中基站在目标侧MSG2发送后即刻开始调度,来解决这种场景的弃包问题。如右图所示,在切换过程中,切换命令下发后,源侧基站PDCP层会把数据包转移到目的侧。如果UE在目的侧入网时延过大,会导致这些转移后的数据包超时而弃包。切换场景入网时延过长导致弃包原理示意图:案例:如下图所示,基站失步后ulAsyncFlag置为1,之后基站出现弃包。在36.321协议中,规定了timeAlignmentTimerexpires超时后的动作:1、清空HARQ缓存;2、释放PUCCH/SRS;3、清空上下行调度。这种场景下,基站会停止调度直至再次同步上,如果时间过长,也会导致弃包。解决方案:拉长TA时长后弃包率由0.1482%降为0.0293%,降低明显。丢包的原理机制终端或基站调度发出PDCP包后,由于空口质量问题导致在空口传输过程中丢失称为空口丢包。上行空口丢包基站侧根据终端上发的PDCPSN序列号是否连续判断丢包的数量。例如终端发送了PDCPSN为1/2/3/4/5共5个包,而基站收到PDCPSN为1/2/3/5共4个包,那么基站侧统计的丢包率为1/5=20%。下行空口丢包下行语音空口丢包率是根据MAC层反馈的ACK/NACK统计空口丢包。举例:一个TBSize初传反馈NACK,第一次重传反馈ACK,这个包不统计为丢包。一个TBSize初传反馈NACK,第一次、第二次,…直到最大重传次数都反馈NACK,这个包统计为1个丢包。感知丢包分析流程感知丢包主要表现在上行丢包、下行空口丢包以及下行弃包三个表象上,可以通过问题分析流程图定位相关问题,如故障、干扰、资源等方面。VoLTE容量受限指标表征VoLTE容量受限无外乎信令信道、业务信道受限。VoLTE相较数据业务在业务信道调度时有优先级,但在信令信道调度时确没有优先,所以如果小区内数据业务消耗过多的信令资源,会影响VoLTE用户的感知;如果VoLTE用户过多,业务信道会抢占数据业务,影响数据业务用户感知。在目前VoLTE用户数普遍偏少的情况下,需要重点关注信令信道资源受限的情况。PDCCH用来调度上下行业务信道的CCE资源受限,无法及时调度上下行PDCP包,导致出现丢包弃包。上行资源:上行CCE利用率,表征调度上行信令和业务信道的资源占用情况;上行SRB占用比例,表征上行调度资源中信令信道使用的比例;上行CCE分配失败次数,表征上行调度中失败的次数;上行QCI1PRB利用率,表征VoLTE业务占用上行业务信道资源情况。下行资源:下行CCE利用率,表征调度下行信令和业务信道的资源占用情况;下行SRB占用比例,表征下行调度资源中信令信道使用的比例;下行CCE分配失败次数,表征下行调度中失败的次数;下行QCI1PRB利用率,表征VoLTE业务占用下行业务信道资源情况。VoLTE感知弃包案例CCE容量受限导致弃包朝阳双井桥HL-1小区晚忙大量弃包,经分析该小区因上行CCE容量受限,导致基站无法收到终端确认消息而引起的弃包,经过扩容后,该小区弃包率由30%+下降至0.01%CCE功率受限导致弃包顺义现代汽车技术中心西北HLG-3小区丢弃包严重,经分析为CCE功率不足导致CCE分配失败,从而导致VoLTE上行数据调度不及时而弃包,调整PDCCH分配策略后弃包率从10+%降低到0.05%VoLTE感知丢包案例现象:“通州次渠南里HL-1”小区在近一周出现上行高感知丢包31小时次,严重影响用户感知。分析:通过分析该小区存在大量CCE分配失败,根据CCE分配失败次数情况严重,考虑应该为CCE功率不足导致,查看该小区CCE分配策略为基于覆盖的策略建议修改PDCCH聚合级别自适应策略为基于容量的策略,于8月8日中午13点修改,修改后指标行丢包率已经下降至5%以下。谢谢