APP下载

垃圾短信治理方案及技术实现

2015-07-02王研

科技资讯 2015年4期

王研

摘 要:近年来,垃圾短信愈发泛滥,这种行为不但极大危害了用户的切身利益,而且对于联通的品牌打造也制造了很大的障碍。因此,对运营商的监管提出了更高的要求。该文综合比对了主流的垃圾短信拦截方案,最后明确了所采用的基于发端短信中心实时控制的垃圾短信拦截方案。通过采用系统自动处理和人工审核相结合的方式,垃圾短信治理工作取得了显著的成果。最后,该文结合目前垃圾短信治理的形势,对最新的基于可疑度的垃圾短信拦截机制进行了介绍,对后期的治理工作提出了展望。

关键词:发端短信中心实时控制 垃圾短信被举报率 关键字拦截机制

中图分类号:TN929 文献标识码:A 文章编号:1672-3791(2015)02(a)-0024-02

2012年以来,垃圾短信又有重新抬头之势,并有了新的变种,主要包括伪基站垃圾短信、iMessage垃圾信息及智能手机中毒后成为“肉机”发送的垃圾短信,其内容大多涉及反动、诈骗、买卖非法物品等违法信息。这种行为不但极大危害了用户的切身利益,而且对于联通的品牌打造也制造了很大的障碍,因此对垃圾短信进行治理刻不容缓。

针对此种情况,集团公司于2012年起将垃圾短信的治理纳入KPI考核,按月对未达到考核指标的省份进行通报及收入扣减;于2013年优化考核标准,开展“净网”活动,对全网和地方端口短信进行清理,对不符合条件的端口进行关停处理;于2014年执行行业端口省间结算,完成国际垃圾短信拦截系统扩容,组织开展打击伪基站专项行动,启动建设集中拦截系统。

1 垃圾短信治理方案分析

垃圾短信监控,按照拦截位置的不同可以分为发端控制、收端控制和其他控制三种模式。其中又根据短信数据处理网元的不同分为短信中心控制模式和信令控制模式,下面分别加以介绍。

1.1 发端短信中心实时控制模式

垃圾短信信息安全监管系统与短信中心(SMSC)连接,SMSC将MO/AO短信暂存并实时传递副本给垃圾短信信息安全监管系统,由垃圾短信管理系统根据设定的判别规则对MO/AO短信实时进行垃圾短信甄别,并将判别结果通知SMSC进行拦截或下发处理。

垃圾短信管理系统对SMSC上报的短信数据进行甄别分析,对符合垃圾短信判别规则的短信通知SMSC进行拦截处理;对不符合垃圾短信判别规则的短信通知SMSC进行下发处理。

发端实时短信中心控制模式网络结构与准实时短信中心控制模式网络结构类似,其中接口机可以采用与现有信息安全汇聚网关复用。

1.2 发端信令实时控制模式

垃圾短信管理系统与信令处理机连接,信令处理机串接在LSTP与SMSC之间的信令链路中;如果建设的是HSTP,信令处理机串接在HSTP与SMSC之间的信令链路中,由信令处理机根据设定的判别规则,对提交给SMSC的MO短信和SMSC发出的MT短信数据进行比对,对符合判别条件的MO/MT短信进行实时拦截,同时将MO/MT短信记录副本上报至垃圾短信管理系统做进一步分析处理以及数据存储。

垃圾短信管理系统对各个信令处理机上报的短信数据进行汇总分析,根据分析结果更新垃圾短信判别规则并同步至各信令处理机执行。

1.3 收端信令实时控制模式

垃圾短信管理系统与信令处理机连接,信令处理机串接在LSTP与MSC之间的信令链路中;如果建设的是HSTP,信令处理机串接在HSTP与MSC之间的信令链路中,由信令处理机根据设定的判别规则,对下发至MSC的MT短信数据进行比对,对符合判别条件的MT短信进行实时拦截,同时将MT短信记录副本上报至垃圾短信管理系统做进一步分析处理以及数据存储。注:MT短信记录应包括发送方号码、接收方号码、消息内容、发送时间等信息。

垃圾短信管理系统对各个信令处理机上报的短信数据进行汇总分析,根据分析结果更新垃圾短信判别规则并同步至各信令处理机执行。

1.4 治理方案比较

对于垃圾短信治理的发端方案和收端方案,从监控范围,拦截策略,维护要求进行比对可以发现:全网发端方案和收端方案的监控范围和拦截策略基本相同,但发端方案可以采用短信中心方案和信令方案,监控的设备投入较小,相比收端,发端的性价比更高,因此天津联通垃圾短信平台采用的是发端短信中心实时方式的方案。

2 天津联通垃圾短信治理成果

通过新建垃圾短信信息安全监管系统,采用发端短信中心实时控制方式,实现天津本地发端垃圾短信治理功能,较之之前通过短信中心自带模块离线分析短信中心话单后生成黑名单的拦截方式,拦截短信数量和范围有了很大幅度的提高。

另一方面,针对通过大量号码池低频发送垃圾短信的行为,如果单纯依靠垃圾短信监控系统的话,采用严格单一的拦截策略,容易造成正常短信的误拦,遗漏垃圾短信。因此,采用关键字+流量控制、系统自动处理+人工审核相结合的方式,重点启用组合关键字和连续低频次规则精确拦截。具体包括以下几方面。

(1)降低可疑短信的门限值,尽可能多的收集可疑短信,对内容雷同的可疑短信进行内容分析提纯,通过“与或”逻辑组合及时添加拦截策略,对垃圾短信进行精准拦截。

(2)增加了临时关键字、关键句功能,通过人工审核将确认为垃圾短信的联系电话、网址、QQ号、银行账号等加入临时关键字,发送3条即加入黑名单,有效提高拦截率。

(3)人工审核团队坚持对可疑信息进行100%人工审核,发现一例封堵一例,进行100%封堵;及时制作、更新监控拦截关键字,坚持人工和智能化系统相结合,确保不良信息7×24h审核处理的及时有效。

在多种治理举措的共同实施下,天津地区的垃圾短信发送量大幅度降低,垃圾短信被举报量也明显减少。通过12321和10010垃圾短信举报处理平台数据显示,2012年天津地区点对点垃圾短信被投诉量显著下降(其中垃圾短信被举报率=来自于10010和12321平台的垃圾短信举报数/本地短信用户数(千万数量级)该文中本地短信用户数以2012年在网用户数均值430万来进行计算),如图1所示。

3 技术发展与展望

虽然天津联通已经建设了基于短信中心发端控制的垃圾短信监控系统,并通过系统自动处理与人工审核相结合的方式取得了较好的成果,但是单纯依靠“关键字+频次”实现垃圾短信一次过滤的方式仍有不足,并且人工审核工作无法做到垃圾短信的事前处理。随着垃圾短信治理工作的深入,垃圾短信也呈现出新的发送特征。

(1)发送者采用同音、形近、近义等方式,规避关键字方式的拦截,同时在其中混淆一些无意义的字符,用来欺骗拦截算法。例如:“fa-瞟”、“货(贷)款”等拼音词汇变形,嵌入特殊字符等使得目前的关键字和关键字组合失效。需要针对此类进行语义特征提取,自动过滤关键字。

(2)发送者采用频繁换号的方式,每个号码都是低频发送,模拟正常用户的发送行为进行发送,以躲开针对发送者的异常行为进行流量探测的方法。

针对此类问题,集团公司总部在部分省市进行试点,开展基于可疑度计算的垃圾短信过滤方案的运行测试工作,在垃圾短信的过滤过程中首次引入了可疑度的概念,使用多种特征过滤及内容过滤算法对一条短信的可疑度进行估算,命中一个算法,给当前短信累加一个分值,并且赋予每种算法不同的权值,当短信的可疑度累积增加到一定阀值时,可疑短信被视为垃圾短信。

下一步,集团公司计划于2014年内启动的基于收端控制的垃圾短信集中拦截系统的建设,该平台实现关键字和拦截策略的统一部署,从而能大幅度减少垃圾短信在省际间的流动泛滥问题,同时结合天津本地现有垃圾短信平台的优化扩容,为用户打造了绿色诚信的网络文化环境,实现了经济效益和社会效益的双丰收。

参考文献

[1] 张永忠,王江.垃圾短信监管系统方案分析与实现[J].硅谷,2012(7):128-129.

[2] 张燕,傅建明.垃圾短信的识别与追踪研究[J].计算机应用研究,2006,23(3):245-247.

[3] 李恺明.广东移动通信垃圾信息分析与治理方案设计[D].北京:北京邮电大学,2011.