全时通专题分析报告提纲一、全时通系统概述二、投诉产生的原因三、全时通业务优化全时通业务现状全时通系统于05年11月割接入网,目前系统规模可支持2000万用户。全时通业务发展非常迅速,用户规模不断扩大,截至07年2月1日,用户数已经达到1600余万。一年多来,针对全时通系统的一些问题进行了多次调整和优化,达到了比较理想的效果。目前华为平台已经超负荷运行,中兴全时通平台正在逐步割接过程中(负责东部5地市业务)。下发短信号码:10086011(华为),10086012(中兴)两个平台之间容灾措施全时通系统硬件组成全时通硬件系统主要包括4台业务处理器、2台CCS服务器(主备)、2台IVR服务器(负荷分担)、2台CTILINK服务器(主备)、2台数据库服务器以及1台开销户服务器。全时通系统组网结构全时通业务流程完整的全时通业务流程主要包括以下两部分:语音呼叫流程拨叫全时通用户时,如全时通用户关机、不在服务区或处于忙状态时,呼叫会转至全时通系统,主叫会听到全时通提示音。全时通平台不送计费信号通知短信生成和下发全时通系统根据呼叫信息生成通知短信,经短信网关提交至短信中心,最终由短信中心下发给全时通用户。探测短信和漏话短信根据作用不同,全时通的通知短信分为两种:1、探测短信:主要用来探测全时通用户手机的状态,判断用户是否能够接收短信。2、漏话短信:主要用来把一段时间内某一个号码拨打全时通用户的所有记录汇总起来。注:探测短信和漏话短信的内容相似,都是给用户提供漏话信息。通知短信下发机制有漏话产生时,全时通系统首先生成探测短信经网关提交至短信中心;探测短信成功下发给用户时,会向网关发送标志成功下发的状态报告,网关继而向全时通平台发送状态报告;全时通收到状态报告后,生成漏话短信经网关提交至短信中心,下发给用户。通知短信下发机制一、全时通系统概述二、投诉产生的原因三、全时通业务优化投诉类型及原因(1)全时通投诉主要分为以下几类:1、因alert_sc消息(用户开机消息)丢失,造成探测短信无法下发,同时导致后续漏话短信延迟下发。这类问题是投诉的重点,占据了全部投诉相当大的比例。2、短信中心因用户原因(如用户关机、内存满、MS端错误等)或网络原因重发造成短信下发有延迟,此类投诉与全时通系统无关。3、通知短信中有时没有提供主叫号码的归属地信息。这是由于全时通平台和号段信息服务器的同步还存在问题,此问题正在解决之中。投诉类型及原因(2)4、由于用户原因,如余额不足,欠费停机、主叫设置号码隐藏等,造成无法正常使用全时通业务。5、用户已在BOSS开户,但关机后被拨打时,主叫听不到全时通提示音。这是BOSS开户数据同步到HLR不成功所致。这种问题比较少,投诉也极少。6、开户数据正常,但拨打时听不到全时通提示音,这一般是由于排队机的呼损造成的,不过呼损概率极低。这种投诉最少,基本可以忽略。投诉原因分析第1类投诉的产生与全时通业务机制和短信中心都有关系。全时通业务机制方面:全时通只有在收到探测短信的状态报告后才会提交漏话短信至短信中心下发。短信中心方面:组网初期,所有通知短信都通过短3一个短信中心下发。为了缓解内存压力,短信中心启用了二级缓存。针对“用户关机”和“用户不在服务区”两种情况,设定下发3次后(间隔为1小时)把通知短信移入二级缓存,然后依靠alert_sc消息来触发。但alert_sc消息确实有丢失的情况,造成二级缓存中的探测短信无法下发给用户。所以,当因alert_sc消息没有送至短信中心造成探测短信无法按时下发时,全时通平台一直收不到状态报告,从而影响到后续漏话短信的提交。这是造成此类投诉的症结所在。一、全时通系统概述二、投诉产生的原因三、全时通业务优化调整和优化(1)由于第1类投诉比较突出,所以我们主要针对这类问题进行了一系列业务调整和优化。主要包括:短信分流:把通知短信的下发按号段分流至多个短信中心。分流后,137号段的通知短信通过短1下发,134和159号段的通知短信通过短4下发。短1和短4不启用二级缓存,依靠下图所示的重发策略下发短信,解决了因alert_sc消息丢失引发的消息下发延迟问题。调整和优化(2)135、136、138和139四个号段的通知短信仍通过短3下发,且仍然启用二级缓存。为了能使二级缓存中的探测消息能够多次被调度下发,我们设定了合适的回读速率(目前设为每2秒钟回读80条),不断把二级缓存中的探测短信回读到内存里来,通过重发策略来调度下发,如右图所示:调整和优化(3)在短信网关上建立了专门存放全时通等待状态报告实体的数据库。当网关中等待状态报告的实体超过门限值时,实体会被存入数据库。这样避免了因实体数超过门限被删除导致的状态报告无法送达全时通平台的情况。优化效果(1)通过对全时通业务的分流,使134、137和159三个号段的通知短信下发无需借助二级缓存,彻底抵消了alert_sc消息丢失造成的影响;通过在短3上开启回读功能和调整重发策略,大大增加了二级缓存中的探测短信被调度下发的机会,大大减小了因alert_sc消息丢失造成的下发时延。通过在短信网关上建立专门存放等待状态报告实体的数据库,使网关对状态报告的传递更加顺畅,网关对全时通业务的支撑力度明显增强。优化效果(2)优化工作改善了全时通业务机制,提高了用户感知,大大降低了用户投诉量。06年12月份,NSP全时通投诉有84件;07年1月份,NSP全时通投诉降至46件,减少约45%。而且自从1月23日调整短3参数后,每天的NSP平均投诉量不足1件。后续工作我们会针对alert_sc消息丢失问题继续优化业务机制,努力寻找更加有效的方法提升全时通业务。对于因短信重发造成的短信延迟,我们计划采取调整重发间隔的方法去改善。全时通号段信息同步的问题目前已经有突破性进展,还有一些细节问题需要进一步解决。BOSS开户数据同步和排队机呼损的问题虽然极少,但是我们正联合华为工程师分析定位原因。谢谢!