第四代海事卫星北京关口站 通信话单提取与解析技术的研究
2018-05-10张永超
徐 丹,张永超
(中国交通通信信息中心,北京 100094)
1 引言
1.1 研究背景
国际海事卫星(Inmarsat)是全球第一个具有全球覆盖能力的移动卫星通信系统,早期旨在为海上船舶提供卫星通信服务,现已发展成为提供全球卫星移动公众通信和遇险安全通信的卫星通信系统,是我国交通运输通信信息网络的主要组成部分之一。2008年8月Inmarsat成功发射第三颗第四代海事卫星,支持宽带业务的第四代海事卫星框架体系基本形成。第四代海事卫星其突出特点是卫星功率大幅提高,其终端链路等效全向辐射功率(EIRP)为67dbW,并且采用最新频率复用技术,支持1个全球波束、19个宽点波束、193个窄点波束,每个窄点波束可含6-8个信道,每个信道带宽200kHz,信道总数630个,并且窄点波束可调整、信道可组合使用。同时引入了公共网络的3G技术,采用3GPP标准,满足3G所定义的高达492kb/s的数据带宽,支持丰富的3G语音、数据和视频传输等功能。2013年12月我国新建第四代国际海事卫星北京关口站工程正式开通运行,这是第一个国家级第四代海事卫星关口站(以下简称“北京SAS站”),北京SAS也建设了基于3GPP标准的核心网。它实现了在中国境内的所有第四代海事卫星终端的语音、数据业务的全部自主接续,不再转接至国外关口站进行空间接续,这对我国境内通信安全和主权维护具有重要意义。
1.2 研究意义
自2013年开通以来,北京SAS站累计服务各类海事卫星用户近10万,语音业务主被叫年均共约4000万分钟,数据业务上下行年均总流量近2T。相对于地面站公众网络通信而言,海事卫星具有通信资费高、漫游用户多的特点,这意味着对通信话单需要更精确的计算统计和网间结算,而基于海事卫星网络全球用户的通信话单生成与计算均需由Inmarsat组织单方面提供,由于北京SAS站没有针对本站进行话单提取生成的技术,所以在与Innmarsat和电信运营商的网间结算中,均缺乏业务量比对核验的机制,这显然不符合通信网间结算的基本要求。此外,由于海事卫星网络与地面接续网络的复杂性和卫星自身的延时与速率限制,导致用户对通信话单的调取回溯需求量较大,同时技术人员对故障排查等作业也需要大量通信话单记录的调阅。因此研究北京SAS站的通信话单提取与解析技术、开发话单分析系统对我国海事卫星业务的管理价值巨大。
2 关键技术研究
2.1 北京SAS站核心网网元结构研究
由于第四代海事卫星无线网络子系统将覆盖区域的语音、数据业务经过调制解调,转变为3G协议送到核心网子系统。因此北京SAS站建设了符合3GPP标准的核心网(CN)。核心网包括电路域CS 和分组域PS两个部分组成,如图1所示。
图1 核心网网元结构
核心网电路(CS)域主要由MSC Server经媒体网关MGW,通过专线与中国国内运营商国际局和Inmarsat关口站连接,实现公众运营商网络的PSTN/PLMN语音业务与海事卫星内网话务互联互通。因此MSC Server网元可以输出全部语音业务的通信计费日志文件,为语音话单的采集与解析生成提供了必备数据源条件。分组域(PS)部分主要包括GGSN节点和SGSN节点,如图2所示。
图2 分组域网络结构
GGSN通过数据通信网DCN与Inmarsat网络实现网关接续。SGSN网元通过无线子系统RAN实现本地注册用户的数据服务,并与Inmarsat HLR鉴权提供服务。因此SGSN和GGSN网元都将记录数据业务会话日志文件。对于本地用户指话单GGSN 节点地址为本地节点的用户,漫游用户指GGSN节点为非本地节点的用户。因此本地用户PS话单从GGSN话单中提取,漫游用户的PS话单从SGSN话单中提取。通过对核心网网元结构的研究,我们认为MSC将提供电路(CS)域话单数据源,GGSN和SGSN将提供分组PS(域)话单数据源,这为下一步计费日志采集打下了基础。
2.2 网元计费日志采集
北京SAS站核心网网元将通过指令按一定时间间隔输出计费日志文件到Server本地。因此可以通过搭建FTP服务器与客户端,实现定时自动下载传输各网元输出的计费日志原始话单CDR文件,并进行话单文件提取和解析,经过话单模板格式形成结构化数据存储到数据库中管理,话单采集解析逻辑结构如图3所示。
图3 话单采集解析逻辑结构图
默认日志计费CDR文件以的二进制ASN.1格式输出,将网元作为FTP Server,并按权限设置FTP 远程用户可以访问CDR输出目录。同时部署一台CDR采集服务器作为FTP客户端,定时采集新产生的CDR文件。根据一定命名规则对话单文件进行存储,CDR采集客户端可以设置采集网元的路径、登录服务器的认证信息和采集时间间隔与频次等内容,并由程序调度实现。
2.3 话单解析与合并生成技术
北京SAS站核心网网元节点的计费日志文件以二进制ASN.1格式截取输出,要想完成话单的解析和格式化为ASCII码文本,首先需要进行日志文件的格式转化输出。我们采用核心网的话单格式化转换命令进行转换。转化命令包括指定ASN模板文件,转换源文件和输出文件等参数,在本次研究中我们以XML 标准对转化后的文件进行输出。所以定的模板文件作为所有日志要素的编码格式声明。模板定义文件其实是一个基于WCDMA R8.1/GSM R14.1(CS域)或3GPP(PS域)标准的结构体定义文件,它定义了所有计费参数要素的数据位,数据类型,取值范围等结构信息,以MSC的spe文件为例,定义文件描述了呼叫记录节点记录(UMTSGSMPLMNCallDataRecord)的结构,GGSN/SGSN定义文件描述了数据会话节点记录(GGSNPDPRecord/SGSNPDPRecord)的结构。包括相关话单业务字段,如主叫号、被叫号、时长、出入路由、IMSI和IMEI及错误代码,以及海事卫星网络扩展的卫星波束等信息。工具命令按模板定义文件对原始话单文件进行格式转,输出的文本文件可被软件程序读取并解析为结构化文件,至此就完成了话单采集和解析工作。
3 话单合并与数据管理
原始话单文件是基于网元为单位的记录输出,但对于通信业务来说,一次语音呼叫或数据会话往往是不同网元间多路由实现的通信,因此需要对不同路由的话单需要进行合并提取形成一次可计费业务话单。电路域(CS域)语音综合话单根据“下一条呼叫”字段将各个CS话单合并,合并的多条话单中,包含重复重要字段将取最新一跳路由的值作为总话单的值。对于分组域(PS)话单合并来说,每一次会话由多条话单记录组成,其中“计费ID”是一次会话多条话单记录的关联字段,将对应的原始话单ID写入合并话单主记录中,将话单中的IMSI号码提取,与用户身份属性中的IMSI号码关联,将数据会话开始时间作为主话单的会话开始时间,从而便于计算时长流量等数据。
为了对核心网话单进行存储和数据管理,我们构建关系型数据库用于将话单进行数据入库存储,建立了基于CS和PS两个话单的主表,为每个主表建关联子表用于存储原始话单,通过SQL语句存入数据库中。数据抽取与入库管理,采取ETL抽取工具制定数据抽取流程,如图4所示,数据抽取和入库流程可以按环节设计不同操作节点,节点包括触发时间,数据源和数据目标,数据处理脚本以及执行事件,抽取工具作为系统服务运行后,可以按各节点计划任务进行执行完成话单数据解析和入库等数据管理。
图4 话单数据采集管理流程图
4 结束语
随着第四代海事卫星北京关口站的开通,以及地面核心网络的建设,为海事卫星在中国区的通信业务接续和数据解析提取提供了可能。通过本次研究,我们突破了海事卫星通信网的核心数据采集解析技术瓶颈,解决了海事卫星通信网核心话单数据的自主采集与解析问题,打破了长期以来仅能依赖Inmarsat获取数据的局面,为自主实现了海事卫星通信业务统计、话单计费、网间结算核准及话务分析等系统的建设奠定了技术基础。
[1] 北京电信规划设计研究院.第四代国际海事卫星北京关口站工程卫星系统部分初步设计[M].内部,2011:204-220.
[2] 黎东敏.关于爱立信APG43的研究[J].知识经济,2013,12(8).
[3] 吴志鹏.大数据时代的电信与互联网管理[M].北京:北京邮电大学出版社,2014:32-56.