APP下载

面向android手机的涉密短信监控与分析系统的设计与实现

2015-01-20石子言赵国林刘剑豪

电脑知识与技术 2014年36期

石子言 赵国林 刘剑豪

摘要:当今手机短信不仅给人们带来了方便,同时也带来了安全隐患,主要安全问题体现在手机使用者安全防范意识不强,短信内容涉及一些安全敏感信息,如企业内部资料信息,政府保密资料等。该文主要介绍了一个面向android手机的涉密短信监控与分析系统的设计与实现,该系统采用了一种积极主动的防御思想,构建了由手机客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统构成的短信监控和分析平台,如何对手机短信的发送情况进行有效的监控和管理,实现高效访问是本文的研究重点。

关键词:Android;手机短息;保密安全

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)36-8664-02

随着移动通信技术的发展,各种智能移动终端越来越融入人们的生活,尤其是手机终端。然而,在许多手机使用用户中,部分从事涉密岗位的人员很可能因为种种原因会将一些含有涉密敏感信息的内容,如企业内部资料信息,政府保密资料等非法泄露。针对这些问题,设计了面向Android手机的涉密短信监控与分析系统,实现服务端电脑对客户端手机短信的实时监控和管理,大大提高了监控管理人员的工作效率。

1 系统结构设计

1.1 系统工作流程

本系统具体工作处理步骤如下:用户从手机发送短信,由手机客户端系统程序对短信内容进行检测是否涉密。若不涉密,短信直接发送出去;若涉密,询问用户是否继续发送;若用户取消对涉密短信的发送,则返回;若用户选择继续发送,则将短信正常发送出去,同时,手机客户端程序会将涉密短信及短信相关内容传送到服务器端;监控管理人员可对涉密短信的发送情况进行监控和分析,并由系统自动对所监控的涉密岗位人员的短信发送情况进行评分。具体如图1所示。

1.2 系统结构设计

本系统主要由客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统两部分构成。具体结构设计如图2所示。

2 系统功能设计

本系统包括客户端的短信安全监测和服务端的涉密短信监控与分析子系统。功能模块介绍如下:

2.1 短信安全监测子系统功能模块设计

1) 短信发送内容检测模块:在用户编辑短信,点击短信“发送”按钮的同时,根据敏感词库,判断出短信敏感内容风险等级。

2) 用户评分信息接收和查看模块:每一周,客户端手机可接收服务端发送来的用户评分信息。

3) 安全教育信息接收和查看模块:服务端更新安全教育内容时,客户端会相应同步保密教育内容。

2.2 涉密短信监控与分析子系统功能模块设计

1) 登录管理模块:在打开系统时,应输入用户名和密码,只有验证成功后方能进入并使用本系统。

2) 敏感词库管理模块:该模块可根据具体环境、时事政治信息及时更新敏感词库,对敏感词库进行增删改查操作,更新结果会实时推送给客户端手机。

3) 安全教育信息管理模块:用户可通过本系统对安全教育信息进行添加和查询。

4) 敏感短信发送情况监控模块:服务器端对接收到的数据做如下整理和统计:敏感关键词热点统计、风险短信分等级数量统计、个体用户活动规律时间统计、、个体用户联络关系的统计、群体活跃情况统计、用户活跃度统计。

5) 涉密短信发送情况分析模块:从数据库中统计的数据情况评定出各用户本周内的保密意识分数。

3 系统关键技术

3.1 基于BM算法的短信发送内容检测

在手机客户端程序可自动用户短信发送内容的监测和评估,本系统采用的是BM匹配算法。BM 算法的基本思想是从左向右在文本中移动模式,而每一趟模式匹配的字符比较顺序从右向左进行。

BM的具体算法如下:

首先,作如下定义:

字符集:C={c|c 在正文中出现};正文串P:P[1..m];模式 T:T[1..n],n

BM 算法的关键是定义一个从字符到正整数的映射函数 dist,也称滑动距离函数,dist 函数给出了正文中可能出现的任意字符 c 在模式 T 中的位置。dist 函数的具体定义:

distc=n c?T||c=Tm&且c≠Pi,1≤i≤m-1 n-i i=max{i|P[i]=c,1≤i≤m-1}

BM 算法dist 函数的java实现如图3所示:

图3 BM 算法dist 函数的java实现

3.2 热点敏感关键词发现模型

系统最终采用中科院计算所汉语词法分析系统ICTCLAS提供的的一套完整的API接口和相应的概率词典,实现文本的分词,生成短信文本D的向量空间Di=ti1,wi1,ti2,wi2,……,tin,win,其中tij为特征词条,wij为特征项的权重,wij的取值区间是0,1,表示该词在文本中的重要程度,权重越大,反应了该词表示Di的能力越好,越具有代表性,反之,权重越小反应该词表示Di的能力越差。其中词条tij的特征项权重wij的计算,我们采用了一种基于敏感词级别判定的TF-IDF算法。该算法可以用如下公式(1) 来描述:

wij=0.5Twij+0.5TFijTFmax×IDF (1)

其中wij代表Di短信文本中tij的特征权重,TFij代表的是术语词tij在该文本中出现的次数,而TFmax代表的是在一批文本集合D=D1,D2,……,Dn中术语tij在单篇文本中出现的最大次数;Twij是对于术语词tij进行的敏感等级判别后的权重,取值范围为0,1,如果tij是动词、形容词等非实体词,将该权重置为0,若tij是不属于敏感词集合的实体词,则该Twij置为0.2,若tij的敏感词风险等级为低,则将Twij置为0.4,若tij的敏感词风险等级为一般,则将Twij置为0.6,若tij的敏感词风险等级为高,则将Twij置为0.8,若tij的敏感词风险等级为极高,则将Twij置为1。IDF代表倒文档频率,它的计算公式(2) 为:

IDF=logNDFij (2)

其中N代表D集合中的文本总数,DFij则代表了这批文本集合中出现过术语tij的总数。

由此,计算出tij在文本集合D中的权重值Wj,计算公式为(3) :

Wj=i=0NwijN (3)

根据不同词在文本集合D中的权重值Wj排名,可以统计出当前最热的几个敏感短信关键词。

4 结论

现阶段,我们已经基本完成软件的设计工作,并进行了初步测试,达到了设计初期的各项功能任务.但是,我们开发的这款软件只是单一的对短信中可能出现的保密安全信息进行了监控拦截.功能相对比较单一,下一阶段,我们将重点对Android系统进行研究分析,力争将更多的软件功能在系统中实现。

参考文献:

[1] 张健,陈松乔.基于特征值的多模式匹配算法[J].信息安全与通信保密,2005(9):96-98.

[2] 田淼.用Android开发手机应用[J].程序员,2008(1):25-27.

[3] Enck W,Ongtang M,McDaniel P.Understanding Android security[J].IEEE Security&Privacy Magazine,2009,7(1):10-17.

摘要:当今手机短信不仅给人们带来了方便,同时也带来了安全隐患,主要安全问题体现在手机使用者安全防范意识不强,短信内容涉及一些安全敏感信息,如企业内部资料信息,政府保密资料等。该文主要介绍了一个面向android手机的涉密短信监控与分析系统的设计与实现,该系统采用了一种积极主动的防御思想,构建了由手机客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统构成的短信监控和分析平台,如何对手机短信的发送情况进行有效的监控和管理,实现高效访问是本文的研究重点。

关键词:Android;手机短息;保密安全

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)36-8664-02

随着移动通信技术的发展,各种智能移动终端越来越融入人们的生活,尤其是手机终端。然而,在许多手机使用用户中,部分从事涉密岗位的人员很可能因为种种原因会将一些含有涉密敏感信息的内容,如企业内部资料信息,政府保密资料等非法泄露。针对这些问题,设计了面向Android手机的涉密短信监控与分析系统,实现服务端电脑对客户端手机短信的实时监控和管理,大大提高了监控管理人员的工作效率。

1 系统结构设计

1.1 系统工作流程

本系统具体工作处理步骤如下:用户从手机发送短信,由手机客户端系统程序对短信内容进行检测是否涉密。若不涉密,短信直接发送出去;若涉密,询问用户是否继续发送;若用户取消对涉密短信的发送,则返回;若用户选择继续发送,则将短信正常发送出去,同时,手机客户端程序会将涉密短信及短信相关内容传送到服务器端;监控管理人员可对涉密短信的发送情况进行监控和分析,并由系统自动对所监控的涉密岗位人员的短信发送情况进行评分。具体如图1所示。

1.2 系统结构设计

本系统主要由客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统两部分构成。具体结构设计如图2所示。

2 系统功能设计

本系统包括客户端的短信安全监测和服务端的涉密短信监控与分析子系统。功能模块介绍如下:

2.1 短信安全监测子系统功能模块设计

1) 短信发送内容检测模块:在用户编辑短信,点击短信“发送”按钮的同时,根据敏感词库,判断出短信敏感内容风险等级。

2) 用户评分信息接收和查看模块:每一周,客户端手机可接收服务端发送来的用户评分信息。

3) 安全教育信息接收和查看模块:服务端更新安全教育内容时,客户端会相应同步保密教育内容。

2.2 涉密短信监控与分析子系统功能模块设计

1) 登录管理模块:在打开系统时,应输入用户名和密码,只有验证成功后方能进入并使用本系统。

2) 敏感词库管理模块:该模块可根据具体环境、时事政治信息及时更新敏感词库,对敏感词库进行增删改查操作,更新结果会实时推送给客户端手机。

3) 安全教育信息管理模块:用户可通过本系统对安全教育信息进行添加和查询。

4) 敏感短信发送情况监控模块:服务器端对接收到的数据做如下整理和统计:敏感关键词热点统计、风险短信分等级数量统计、个体用户活动规律时间统计、、个体用户联络关系的统计、群体活跃情况统计、用户活跃度统计。

5) 涉密短信发送情况分析模块:从数据库中统计的数据情况评定出各用户本周内的保密意识分数。

3 系统关键技术

3.1 基于BM算法的短信发送内容检测

在手机客户端程序可自动用户短信发送内容的监测和评估,本系统采用的是BM匹配算法。BM 算法的基本思想是从左向右在文本中移动模式,而每一趟模式匹配的字符比较顺序从右向左进行。

BM的具体算法如下:

首先,作如下定义:

字符集:C={c|c 在正文中出现};正文串P:P[1..m];模式 T:T[1..n],n

BM 算法的关键是定义一个从字符到正整数的映射函数 dist,也称滑动距离函数,dist 函数给出了正文中可能出现的任意字符 c 在模式 T 中的位置。dist 函数的具体定义:

distc=n c?T||c=Tm&且c≠Pi,1≤i≤m-1 n-i i=max{i|P[i]=c,1≤i≤m-1}

BM 算法dist 函数的java实现如图3所示:

图3 BM 算法dist 函数的java实现

3.2 热点敏感关键词发现模型

系统最终采用中科院计算所汉语词法分析系统ICTCLAS提供的的一套完整的API接口和相应的概率词典,实现文本的分词,生成短信文本D的向量空间Di=ti1,wi1,ti2,wi2,……,tin,win,其中tij为特征词条,wij为特征项的权重,wij的取值区间是0,1,表示该词在文本中的重要程度,权重越大,反应了该词表示Di的能力越好,越具有代表性,反之,权重越小反应该词表示Di的能力越差。其中词条tij的特征项权重wij的计算,我们采用了一种基于敏感词级别判定的TF-IDF算法。该算法可以用如下公式(1) 来描述:

wij=0.5Twij+0.5TFijTFmax×IDF (1)

其中wij代表Di短信文本中tij的特征权重,TFij代表的是术语词tij在该文本中出现的次数,而TFmax代表的是在一批文本集合D=D1,D2,……,Dn中术语tij在单篇文本中出现的最大次数;Twij是对于术语词tij进行的敏感等级判别后的权重,取值范围为0,1,如果tij是动词、形容词等非实体词,将该权重置为0,若tij是不属于敏感词集合的实体词,则该Twij置为0.2,若tij的敏感词风险等级为低,则将Twij置为0.4,若tij的敏感词风险等级为一般,则将Twij置为0.6,若tij的敏感词风险等级为高,则将Twij置为0.8,若tij的敏感词风险等级为极高,则将Twij置为1。IDF代表倒文档频率,它的计算公式(2) 为:

IDF=logNDFij (2)

其中N代表D集合中的文本总数,DFij则代表了这批文本集合中出现过术语tij的总数。

由此,计算出tij在文本集合D中的权重值Wj,计算公式为(3) :

Wj=i=0NwijN (3)

根据不同词在文本集合D中的权重值Wj排名,可以统计出当前最热的几个敏感短信关键词。

4 结论

现阶段,我们已经基本完成软件的设计工作,并进行了初步测试,达到了设计初期的各项功能任务.但是,我们开发的这款软件只是单一的对短信中可能出现的保密安全信息进行了监控拦截.功能相对比较单一,下一阶段,我们将重点对Android系统进行研究分析,力争将更多的软件功能在系统中实现。

参考文献:

[1] 张健,陈松乔.基于特征值的多模式匹配算法[J].信息安全与通信保密,2005(9):96-98.

[2] 田淼.用Android开发手机应用[J].程序员,2008(1):25-27.

[3] Enck W,Ongtang M,McDaniel P.Understanding Android security[J].IEEE Security&Privacy Magazine,2009,7(1):10-17.

摘要:当今手机短信不仅给人们带来了方便,同时也带来了安全隐患,主要安全问题体现在手机使用者安全防范意识不强,短信内容涉及一些安全敏感信息,如企业内部资料信息,政府保密资料等。该文主要介绍了一个面向android手机的涉密短信监控与分析系统的设计与实现,该系统采用了一种积极主动的防御思想,构建了由手机客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统构成的短信监控和分析平台,如何对手机短信的发送情况进行有效的监控和管理,实现高效访问是本文的研究重点。

关键词:Android;手机短息;保密安全

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)36-8664-02

随着移动通信技术的发展,各种智能移动终端越来越融入人们的生活,尤其是手机终端。然而,在许多手机使用用户中,部分从事涉密岗位的人员很可能因为种种原因会将一些含有涉密敏感信息的内容,如企业内部资料信息,政府保密资料等非法泄露。针对这些问题,设计了面向Android手机的涉密短信监控与分析系统,实现服务端电脑对客户端手机短信的实时监控和管理,大大提高了监控管理人员的工作效率。

1 系统结构设计

1.1 系统工作流程

本系统具体工作处理步骤如下:用户从手机发送短信,由手机客户端系统程序对短信内容进行检测是否涉密。若不涉密,短信直接发送出去;若涉密,询问用户是否继续发送;若用户取消对涉密短信的发送,则返回;若用户选择继续发送,则将短信正常发送出去,同时,手机客户端程序会将涉密短信及短信相关内容传送到服务器端;监控管理人员可对涉密短信的发送情况进行监控和分析,并由系统自动对所监控的涉密岗位人员的短信发送情况进行评分。具体如图1所示。

1.2 系统结构设计

本系统主要由客户端的短信安全监测子系统和服务端的涉密短信监控与分析子系统两部分构成。具体结构设计如图2所示。

2 系统功能设计

本系统包括客户端的短信安全监测和服务端的涉密短信监控与分析子系统。功能模块介绍如下:

2.1 短信安全监测子系统功能模块设计

1) 短信发送内容检测模块:在用户编辑短信,点击短信“发送”按钮的同时,根据敏感词库,判断出短信敏感内容风险等级。

2) 用户评分信息接收和查看模块:每一周,客户端手机可接收服务端发送来的用户评分信息。

3) 安全教育信息接收和查看模块:服务端更新安全教育内容时,客户端会相应同步保密教育内容。

2.2 涉密短信监控与分析子系统功能模块设计

1) 登录管理模块:在打开系统时,应输入用户名和密码,只有验证成功后方能进入并使用本系统。

2) 敏感词库管理模块:该模块可根据具体环境、时事政治信息及时更新敏感词库,对敏感词库进行增删改查操作,更新结果会实时推送给客户端手机。

3) 安全教育信息管理模块:用户可通过本系统对安全教育信息进行添加和查询。

4) 敏感短信发送情况监控模块:服务器端对接收到的数据做如下整理和统计:敏感关键词热点统计、风险短信分等级数量统计、个体用户活动规律时间统计、、个体用户联络关系的统计、群体活跃情况统计、用户活跃度统计。

5) 涉密短信发送情况分析模块:从数据库中统计的数据情况评定出各用户本周内的保密意识分数。

3 系统关键技术

3.1 基于BM算法的短信发送内容检测

在手机客户端程序可自动用户短信发送内容的监测和评估,本系统采用的是BM匹配算法。BM 算法的基本思想是从左向右在文本中移动模式,而每一趟模式匹配的字符比较顺序从右向左进行。

BM的具体算法如下:

首先,作如下定义:

字符集:C={c|c 在正文中出现};正文串P:P[1..m];模式 T:T[1..n],n

BM 算法的关键是定义一个从字符到正整数的映射函数 dist,也称滑动距离函数,dist 函数给出了正文中可能出现的任意字符 c 在模式 T 中的位置。dist 函数的具体定义:

distc=n c?T||c=Tm&且c≠Pi,1≤i≤m-1 n-i i=max{i|P[i]=c,1≤i≤m-1}

BM 算法dist 函数的java实现如图3所示:

图3 BM 算法dist 函数的java实现

3.2 热点敏感关键词发现模型

系统最终采用中科院计算所汉语词法分析系统ICTCLAS提供的的一套完整的API接口和相应的概率词典,实现文本的分词,生成短信文本D的向量空间Di=ti1,wi1,ti2,wi2,……,tin,win,其中tij为特征词条,wij为特征项的权重,wij的取值区间是0,1,表示该词在文本中的重要程度,权重越大,反应了该词表示Di的能力越好,越具有代表性,反之,权重越小反应该词表示Di的能力越差。其中词条tij的特征项权重wij的计算,我们采用了一种基于敏感词级别判定的TF-IDF算法。该算法可以用如下公式(1) 来描述:

wij=0.5Twij+0.5TFijTFmax×IDF (1)

其中wij代表Di短信文本中tij的特征权重,TFij代表的是术语词tij在该文本中出现的次数,而TFmax代表的是在一批文本集合D=D1,D2,……,Dn中术语tij在单篇文本中出现的最大次数;Twij是对于术语词tij进行的敏感等级判别后的权重,取值范围为0,1,如果tij是动词、形容词等非实体词,将该权重置为0,若tij是不属于敏感词集合的实体词,则该Twij置为0.2,若tij的敏感词风险等级为低,则将Twij置为0.4,若tij的敏感词风险等级为一般,则将Twij置为0.6,若tij的敏感词风险等级为高,则将Twij置为0.8,若tij的敏感词风险等级为极高,则将Twij置为1。IDF代表倒文档频率,它的计算公式(2) 为:

IDF=logNDFij (2)

其中N代表D集合中的文本总数,DFij则代表了这批文本集合中出现过术语tij的总数。

由此,计算出tij在文本集合D中的权重值Wj,计算公式为(3) :

Wj=i=0NwijN (3)

根据不同词在文本集合D中的权重值Wj排名,可以统计出当前最热的几个敏感短信关键词。

4 结论

现阶段,我们已经基本完成软件的设计工作,并进行了初步测试,达到了设计初期的各项功能任务.但是,我们开发的这款软件只是单一的对短信中可能出现的保密安全信息进行了监控拦截.功能相对比较单一,下一阶段,我们将重点对Android系统进行研究分析,力争将更多的软件功能在系统中实现。

参考文献:

[1] 张健,陈松乔.基于特征值的多模式匹配算法[J].信息安全与通信保密,2005(9):96-98.

[2] 田淼.用Android开发手机应用[J].程序员,2008(1):25-27.

[3] Enck W,Ongtang M,McDaniel P.Understanding Android security[J].IEEE Security&Privacy Magazine,2009,7(1):10-17.