TD-LTE信令数据准确性核查方法
2017-02-28
(中国移动通信集团设计院有限公司,北京 100080)
TD-LTE信令数据准确性核查方法
李宝磊,沈亮,戴鹏程,任晓华
(中国移动通信集团设计院有限公司,北京 100080)
随着TD-LTE网络的建设和大数据技术的逐渐成熟,基于TD-LTE信令数据进行网络质量分析已然成为当前趋势。通过采集海量XDR话单进行用户感知和网络性能分析,正在成为一种越来越重要的分析手段。数据源的完整性和准确性是分析的基石,文章分析数据采集的关键字段,制定核查算法,应用于当前信令分析系统。
大数据;信令;TD-LTE
随着TD-LTE网络的大规模建设和逐渐成熟,以及大数据存储分析等技术的兴起,通过采集TD-LTE信令数据、对海量用户数据进行关联分析,从而掌握网络性能成为可能。TD-LTE信令数据具有覆盖全、容量大、话单清晰等特点,通过采集核心网各接口的XDR数据,即可进行用户质量和网络性能分析。其中XDR是由CDR演变而来的概念。CDR是传统通信网中对通话过程中网络关键信息的记录。XDR是CDR概念的扩展,在本文中泛指对移动网络、承载网络中数据流量的关键信息记录,即流量日志,以用户会话为单位,一个会话形成一条XDR记录。采集S1-MME、S1-U和MR的XDR数据,统计网络综合下载速率、主流热点业务、覆盖干扰等指标,能够及时发现用户感知及网络/业务层面的问题和短板,促进提升网络质量。
目前全国很多省份已建设信令监测平台,根据一定的DPI(Deep Packet Inspection,深度报文监测)规则,将原始码流合成信令记录。通过采集TD-LTE信令对室内外、高铁/地铁等特殊场景的挖掘分析层出不穷,颇多亮点。但数据源的完整性和准确性一直是困扰信令分析的一大难点,尤其在当今TD-LTE网络建设甫始、监测手段不完整的情况下,对于结果异常的数据,分析人员一般采取筛除异常指标、取平均的方法进行抹平,但如何追根溯源发现问题,目前尚无可靠的办法。准确全面的指标体系和关键算法只有建立在数据准确的基础上,才能使得结果准确可靠。本文首先分析TD-LTE信令采集XDR话单S1-MME、S1-U和MR的关键字段,其次对部分关键字段制定关联算法和核查算法,在当前TD-LTE信令采集评估和多场景分析的应用下不断修正,探索一套数据核查的方法和体系。
1 S1接口数据核查范围
1.1 S1-MME话单数据
S1-MME话单主要提供控制面信息,包括传送会话管理和移动性管理,完成S1接口的无线接入承载控制、接口专用的操作维护等功能。主要信息有上下文信息(IP地址、UE能力等)、用户身份信息(IMSI或TMSI、GUTI等)、切换位置信息(Cell ID、TAC等)、E-RAB承载管理信息、NAS信息(附着、鉴权、寻呼、TA更新等)、S1接口管理信息(MME标识、负载均衡等)。在TD-LTE信令监测分析系统中,MME话单的数据主要用来用户关联、统计切换指标等,因此需重点核查的字段如表1所示。
表1 S1-MME话单字段要求
1.2 S1-U话单数据
S1-U在MME和eNode B设备间建立隧道,传送用户面数据业务。包括通用话单、HTTP话单、VoIP话单、即时通信话单等,DPI统一规范中的18大类、675种小类业务均可在S1-U话单中进行分析统计,是进行业务维度分析的重要接口。因此需要核查的重点字段如表2所示。
1.3 MR数据
MR数据可以进行弱覆盖和干扰等分析,对于发生业务的用户来说,如何从S1口用户事件映射到MR数据上,是关联的重点所在,这样可以将小区级扩展到具体位置(依据定位算法不同而有一定误差)。MR数据和信令关联主要是利用时间窗口+MME Group ID +MME Code+ MME UE S1AP ID,这样可以唯一确定一个MME下的用户,或者利用时间+ECGI确定。其中,MME UE S1APID是MME在S1接口中UE的唯一标识,一般伴随 Attach、Detach、TAU、Service Request这些过程分配,过程结束后都会有一条“UE Context Release”消息来释放S1连接。MME Group ID标识了组Pool以后的MME组编号,MME Code标识了MME的设备 名 称。ECGI(E-UTRAN Cell Global Identifier)则为TD-LTE网络中小区标识符。这样通过一段时间内(如1 h)的用户标识即可将S1接口和MR数据进行关联,从而也就赋予信令数据的位置信息。
需要注意的是:数据源的时间同步是MR和信令关联准确率的关键,由于部分ID在一段时间内是可以复用的,MME和eNode B在一定资源池内随机分配,因此时间窗口大小的选择至关重要。现网一般不会将MR采集设备和信令采集设备做时间同步,会导致二者时间差的问题。MR标签需要核查的重点字段如表3所示。
2 S1接口数据核查方法
S1接口的数据核查既要检查话单字段的完整性和准确性,又要检查字段之间关联的准确性。前者的核查主要有字段填充率、字段填空率、超大异常率筛选等,后者需要设置关联算法,核查出异常值并予以剔除。
2.1 IMEI字段核查
终端IMEI库的维护主要来源有3种:一是各省公司根据自己的终端库提供的IMEI终端库表,需要实时更新维护;二是通过HTTP话单字段User-Agent:终端向访问网站提供的终端信息,包括IMEI、浏览器类型等进行学习更新;三是利用互联网提供的IMEI库进行学习并更新。因此IMEI字段的核查只需从IMEI库中进行对比,即可判断正确与否。
表2 S1-U话单字段要求
2.2 IMSI字段核查
IMSI的回填根据S11接口和S6a接口进行长期学习并回填的过程,当用户进行初始ATTACH、鉴权、寻呼等过程时,上报的信息必须包含IMSI,以此为基础进行后续TMSI和IMSI的关联回填。核查算法是通过时间窗口+Cell ID+MME UES1AP ID进行用户筛选,若出现多个IMSI则认为数据异常,因为同一时间同一小区下不可能出现重复用户,否则为IMSI上报错误。
2.3 小区Cell ID核查
MME话单小区Cell ID问题可能出在两方面:基础工参数据和用户XDR中上报的数据。核查方法如下。
首先根据基础工参计算各小区与邻区的平均距离,其次设定小区平均距离的M倍作为此小区的限定距离。
表3 MR标签字段要求
异常工参小区核查:根据用户上报的小区号,计算平均小区距离,若大于限定距离则计数,超过一定比例后,则认为该小区工参有误。如用户A和用户B均经过某小区,计算发现该小区到其它小区距离大于限定距离,则认为该小区上报错误。
异常上报小区核查:计算用户相邻XDR(业务连续的一段时间内)上报的小区号,根据筛除异常后的工参计算相邻小区距离,大于限定距离则认为小区上报错误;例如某用户业务发生时经历的小区顺序为a-bc-d,计算得到a到b距离正常值范围内,b到c大于限定距离,c到d大于限定距离,则认为c上报有错误,以此类推。
对于第一步计算平均距离,可以先将小区分类,然后分别计算不同场景下的限定距离,如密集城区、校园等进行统一设置距离值,减少计算复杂度。
图1 MME XDR话单
2.4 MME UES1AP ID、MME Code、MME GroupID核查
图2 跟踪Attch过程
MME UES1AP ID、MME Code和MME Group ID是由MME进行分配的,三者可以确定MME下的唯一用户。此3组ID的准确性影响最终用户关联率,因此采取现场测试和抓分组文件的方法进行验证,测试过程中通过开关手机飞行模式实现用户的Attach和Detach过程,后台跟踪该手机发生的业务和信令流程(以Trace文件和信令文件的形式提供),将Trace文件和信令流程进行对比,即可验证3组ID的分配是否准确。
2.4.1 MME话单和Trace的完整性和准确性
完整性核对以Trace文件中的MME UE S1AP ID为基准,在XDR话单中进行个数匹配,如图1所示,统计结果匹配率低于95%认为异常。另外,由于采集MME话单的丢失也是造成关联率较低的原因之一。准确性核对以一次Attach过程为例:Trace信令流程如图2所示。
可以看到:15:20:01的时候生成XDR话单中的3组ID是完全一致,包括时间也较为一致。
2.4.2 MR数据和Trace一致性
截取一次视频观看流程的Trace信令如图3所示。
图3 跟踪某次视频观看流程
可以看到:用户从16: 46:35秒开始请求Service,一直观看视频到17:04:26发起Release。将3组ID进行对应以后,得到的所有MR数据:观看视频期间测量报告MR以5 s为周期进行上报,且开始时间和结束时间和Trace文件一致,说明设备之间时间同步做的较好。数据的验证需要特别注意MME UE S1AP ID错填为eNode B UE S1AP ID的情况,该情况将对应不到用户的测量报告。因为后者由基站进行分配,并不能标识MME下的唯一用户。
2.5 上下行分组长UL/DL Data核查
S1-U话单最重要的指标是下载速率,需要计算分组长和时间。首先进行上下行分组长异常核查,如填充率、超大分组和异常值。之后需要根据原始Pcap抓分组文件,人工计算上下行分组长和相关时延,与合成XDR话单进行核对。其中HTTP关键字段算法如表4所示。
表4 关键字段算法
3 总结
本文探讨了TD-LTE信令数据进行完整性和准确性核查的相关算法和原理,针对不同数据源给出了一整套解决方案。由于TD-LTE的信令监测分析需要关联多个数据源,带来的复杂度较大,大部分算法可以通过自动化程序实现,简单易行。部分算法较为复杂,但涉及到的字段比较重要,因此需要重点关注。部分算法需要实际现场测试并验证,才可以得到最终结果。本文所述方法目前已应用于TD-LTE信令监测分析系统,后续会根据实际效果进行修正和调整,服务于中国移动TD-LTE信令分析。
News
《中国制造2025》“1+X”规划体系全部发布
为细化落实《中国制造2025》,着力突破制造业发展的瓶颈和短板,抢占未来竞争制高点,国家制造强国建设领导小组启动了“1+X”规划体系的编制工作。“1”是指《中国制造2025》,“X”是指11个配套的实施指南、行动指南和发展规划指南,包括国家制造业创新中心建设、工业强基、智能制造、绿色制造、高端装备创新等5大工程实施指南,发展服务型制造和装备制造业质量品牌2个专项行动指南,以及新材料、信息产业、医药工业和制造业人才4个发展规划指南。编制“1+X”规划体系的目的,是要通过加强政府引导,凝聚行业共识,汇集社会资源,围绕重点、破解难点,着力突破制造业发展的瓶颈短板,抢占未来竞争制高点。11个X由国家制造强国建设领导小组相关成员单位共同研究编制,目前均已发布实施。
X的编制过程中广泛征求了有关专家、企业和各方面意见,国家制造强国建设战略咨询委员会设立了专业小组,积极参加相关指南的调研、讨论、起草和论证评估;其中,新材料、信息产业、制造业人才等3个指南还经过了国务院审定。11个X的关系是各有侧重,互为支撑,既有前瞻布局,也有基础突围,既有面向关键共性问题的统筹引导,也有针对重点行业领域的系统谋划。
(来源:工业和信息化部官网)
Methods of TD-LTE signaling data accuracy verification
LI Bao-lei, SHEN Liang, DAI Peng-cheng, REN Xiao-hua
(China Mobile Group Design Institute Co., Ltd., Beijing 100080, China)
With the construction of TD-LTE networks and big data processing technology, network quality analysis based on TD-LTE signaling has become more and more important. The analysis of user perception and network performance by signaling collecting is becoming an increasingly important tool. Completeness and accuracy of the data sources is the cornerstone of the analysis. The article analyzes the key index of XDR, and study the veri fi cation algorithms applying to the current signaling analysis system.
big data; signaling; TD-LTE
TN929.5
A
1008-5599(2017)02-0022-06
2016-06-21