APP下载

邮件发送中的知识流失管控模型初探

2015-03-16北京航天长征飞行器研究所王锦程杨宁谢蕾张弛刘铭

航天工业管理 2015年5期
关键词:字符串附件级别

◎北京航天长征飞行器研究所 王锦程 杨宁 谢蕾 张弛 刘铭

邮件发送中的知识流失管控模型初探

◎北京航天长征飞行器研究所 王锦程 杨宁 谢蕾 张弛 刘铭

电子文件传输以其便捷性与高效性逐渐成为工作中最为主要的文件流转方式,但在享受这种便捷与高效的同时,也存在着关键知识流失的风险。因此,航天企业在邮件系统基本功能的基础上,增加了统一用户身份认证及信息传输管控环节。

统一用户身份认证是指通过读取用户CA-KEY信息来实现身份鉴别,用户只能在授权的计算机上使用本人的邮箱,保证了邮箱与用户的一一对应,在发送邮件的时候能够清楚地知道知识的传播对象。信息传输管控是指在用户写新邮件时需要标明邮件的级别,若有附件上传则需要标明每个附件的级别,且附件的级别不能高于邮件的级别。信息传输管控环节能在用户发送邮件的时候提醒用户邮件级别与附件级别的匹配,防止重要知识的流失。此外,针对向外域发送的邮件,还要通过外发审核来防止核心知识的外流。

通过对北京航天长征飞行器研究所2014年上半年的邮件收发记录分析后得出,信息传输管控功能在信息系统知识传播管理中发挥了较大的作用。图1为2014年上半年疑似知识流失邮件的数量分布图,可以看出,知识流失的情况已经变得越来越严重。邮件系统中的知识流失主要反应在邮件的“高密低传”上,即附件名中标注的级别高于邮件级别。

图2为2014年上半年研究所的邮件收发数量统计,针对如此庞大的邮件收发记录,通过人工的方法进行知识流失现象识别是一件难以完成的工作。此外,在用户频繁使用邮件进行沟通的过程中,不可避免地会出现因误操作而产生知识流失的现象。为此,笔者提出基于规则的邮件级别匹配模型,一方面根据邮件收发记录自动生成知识流失集合,对用户加以提醒;另一方面将此模型应用于邮件系统中,在用户上传附件时对附件名进行检查,避免知识流失现象的发生。

图1 2014年上半年知识流失邮件数量分布图

图2 2014年上半年邮件收发趋势图

一、规则模型的构建

邮件级别匹配主要是检查邮件的附件名级别、附件级别以及邮件级别之间的匹配性。其中邮件级别是指发送邮件的级别,只有选定了邮件级别才能够上传附件和发送邮件。附件级别是指每个附件上传后用户为其选择的级别,附件级别通过系统界面中的菜单选择,因此附件级别不高于邮件级别。附件名级别是指附件名称中标注的级别,由用户在计算机上对文件名进行标注而产生,附件名级别不受邮件系统控制,因此可以通过附件名级别识别出系统中存在的知识流失现象。

1.附件名与邮件的级别匹配关系

邮件系统能发送“一般”、“重要”与“关键”3个级别的信息,而附件名级别由用户自行标注产生。因此,邮件级别集合取值如下:

为了级别之间具备可比性,对(1)进行量化后产生;Sn={1,2,3}为了更方便地描述邮件级别之间的匹配问题,定义附件名级别为附件级别为邮件级别为

因此,附件名级别与附件级别之间的匹配关系为:

附件名级别与邮件级别之间的匹配关系为:

即,如果一封邮件中的每个附件满足ana=0,且同时满足ama≥0,则说明该封邮件符合知识传播要求,不存在知识流失现象。

2.规则的定义

由于邮件级别可从日志记录中直接获取,此处定义的规则主要为识别附件级别和附件名级别。邮件级别的匹配是在附件名均有级别标注的前提下开展的,当附件名未标注级别时,计算机无法自动判断该附件的级别,在此笔者假定所有邮件的附件名均为已标注级别的合规文件。

通过对日志文件中的附件名字符串分析,对附件名字符串按“;”进行分割可以得到每个附件的附件名及其级别的子字符串;对每个子字符串按“:”进行分割可以得到附件级别与附件名;对附件名进行匹配与判别,可以获取附件名级别。

因此,可以得出如下规则:

(1)获取单个附件。若获取的附件名字符串中不存在“;”,则附件名为单个附件,否则按“;”分割字符串,得到若干个独立的单个附件。

(2)获取附件级别与附件名。若单个附件字符串中不存在“:”,则附件字符串不合法,无法获取附件级别。否则按“:”分割字符串,得到第一个字符串为附件级别,第二个字符串为附件名。

(3)获取附件名级别。对附件名匹配级别识别正则表达式,获取附件名级别。

根据以上3条规则,可以得出邮件级别匹配的框架。

3.级别集合的构建

级别集合的构建是指根据邮件日志集,形成附件级别三元组的过程。第一,对每封邮件建立邮件的存储对象,包括邮件级别、邮件标题、发送时间、附件字符串等属性。第二,建立附件存储对象,包括附件级别、附件名、附件名级别等属性。根据规则(1)获取邮件的附件存储对象集合,并根据规则(2)识别出每封附件的附件级别。第三,根据规则(3)获得每封附件的附件名级别,并完善附件存储对象的属性值。第四,产生每封邮件的附件级别三元组集合。

4.匹配关系集合的构建

匹配关系集合是指一封邮件的附件名级别与邮件级别的匹配关系以及附件名与附件级别的匹配关系的集合。通过构建邮件的匹配关系集合能够判断出该邮件是否是按保密要求进行发送。第一,根据每封邮件的附件级别三元组集合分别计算附件三元组的匹配关系取值;第二,根据匹配关系取值分别计算附件的两种匹配关系;第三,计算邮件中每个附件的匹配关系,产生邮件的匹配关系集合。

二、模型的应用

模型构建完善后,以研究所目前使用的邮件系统为试点,依照级别匹配模型开发关键知识检索模块,并在实际工作中检验模型的实际效果。

1.文件传输行为审计

每月的邮件收发数量数以万计,依靠人工准确高效识别其中的知识流失是一件非常困难的事情。依据级别匹配模型,将日志信息作为输入条件,制定判别条件与输出内容,可以将繁杂的行为审计工作交由计算机来完成。这不仅避免了人工判别带来的误差,也极大地提高了效率、降低了人力成本,为优化工作模式、提升工作效率带来极大的帮助。

2.异常传输行为阻断

在用户发送邮件之前,对邮件的内容、附件名、邮件名称以及邮件的级别进行识别与匹配,当出现不符合规则的结果时,对用户进行提醒。提醒的策略有2种,第一种是提醒用户邮件中有关键信息,如果用户认为该信息符合邮件的级别,则可以继续发送;第二种是发现与级别不相符的关键信息后直接阻断该邮件发送。

经过3个月的测试发现,采取第一种策略时,系统中仍然有用户会因为误操作而导致关键知识的流失。而采取第二种策略时,系统中不再出现关键知识流失情况,且并未对用户的使用造成影响。目前,研究所实际采用的是第二种策略,有效地防止了信息系统中关键知识的流失。

网络传输的开放性和高效性为信息系统中的知识成果保护工作带来了新的挑战,如何做到既发挥网络的便利性又保护知识成果不会肆意流失,是当前涉密信息系统中知识管理的热点问题。邮件系统是涉密信息系统中主要的信息传输平台,防止涉密信息通过邮件系统进行“高密低传”能够极大地减少知识的流失。因此,北京航天长征飞行器研究所考虑从邮件系统的附件名级别出发,对信息传播中的知识成果保护起到借鉴作用,也为信息系统中知识保护提供思路。后续将对本模型的思路进一步深化,实现基于内容的检查与判别模型,为在更多系统中的使用打下基础。

猜你喜欢

字符串附件级别
大型外浮顶储罐安全附件常见问题
附件三:拟制定的标准汇总表
基于文本挖掘的语词典研究
一年增加700多万销量!看竣程生物如何做到千万级别
级别分明
迈向UHD HDR的“水晶” 十万元级别的SIM2 CRYSTAL4 UHD
新年导购手册之两万元以下级别好物推荐
新型武器及附件展呈
德国军队使用的手枪套及其附件
SQL server 2008中的常见的字符串处理函数