APP下载

公安内网敏感信息安全监管的实现方法

2018-02-26◆吴

网络安全技术与应用 2018年2期
关键词:关键字文档信息安全

◆吴 威

公安内网敏感信息安全监管的实现方法

◆吴 威

(长兴县公安局通信科 浙江 313000)

随着我国信息化建设的快速推进,越来越多的政府部门、企事业单位、研究机构等开始了电子化办公,电子文档也随之在各个领域都有了广泛应用。这给人们的工作生活带来了极大的便捷。但是在便捷的同时,也出现了众多信息安全问题,各种敏感信息泄露事件时有发生,本文分析了现有敏感信息检测办法存在的问题和缺陷,提出了以管理为核心技术为支撑的完善的敏感信息监管解决方案。

内网;电子文档;敏感信息

1 背景研究

随着我国信息化建设的快速推进,越来越多的政府部门、企事业单位、研究机构等开始了电子化办公,电子文档也随之在各个领域都有了广泛应用,这给人们的工作生活带来了极大的便捷。但是在便捷的同时,也出现了众多信息安全问题,各种敏感信息泄露事件时有发生。

目前大部分涉密单位普遍采取两种预防措施:一是加强相关涉密工作人员的保密制度培训;二是靠保密工作人员经常性地对所有可能涉密的计算机进行现场清查。从以上这两种预防措施来看,存在着不同程度的缺陷:对于第一方式,即使对涉密工作人员的保密制度培训工作做得非常好,也不能保证所有涉密人员都能按照保密制度的要求进行操作;对于第二种方式,用人工去检查非涉密内联网内所有的计算机是否存有带密级的文件时,其工作量不仅非常大,同时工作效率也是十分的低下, 因此提出了一种自动化的敏感信息文件搜索管理系统,根据一定的策略自动搜索出内联网内所有计算机上的文件,并对搜索出的文件进行密级性的检测与处理和管理。

2 存在的问题

针对上述存在的信息泄露隐患,大部分单位普遍采用两种预防方式:一是加强人员保密意识培训;二是依靠保密主管部门以抽检的方式对内网上的计算机或下属单位进行保密检查。这些方式虽然一定程度上解决了一些问题,但仍旧存在许多不足,主要问题有以下几个方面:

2.1搜索结果准确性不高

由于抽检模式下往往使用单机版检查工具检查计算机上是否存在涉密文件,其搜索设定基本以关键字检查为主,关键字既可能会在含敏感信息的文档中存在,也可能在其他许多文档存在,因此搜索的结果中必然会包含大量的不相关文档,需投入大量人力进行甄别。

2.2搜索结果完整性不强

涉含敏感信息的文档类型各种各样,无法采用统一关键字的方式涵盖所有文档,导致搜索结果中漏掉相当多的敏感文档。

2.3检查覆盖面受限

其中最为突出的弊端是不能进行大规模、实时、全面的对文档进行检查,保密主管人员工作效率较为低下。

2.4缺乏跟踪管理

被查处的计算机或下属单位后期整改情况不得而知,无法实现对敏感文档、违规计算机、违规单位进行跟踪管理。

3 解决方案

要解决以上敏感信息监管问题,首先,在管理上必须遵守国家保密安全管理规定和组织内部的保密安全管理制度,形成对敏感信息安全事件管理、监测、响应、防护的工作要求。其次,在技术上要具备对敏感信息的网络化、自动化发现能力,包括对存放的各种类型和格式的敏感信息文件;信息传输过程当中的敏感信息内容等。有效解决传统敏感信息发现技术不准确、不全面的技术缺陷,同时结合安全管理业务流程给管理者提供全面的敏感信息安全管理解决方案和落地系统,有效解决敏感信息的安全管理问题。

4 系统设计方案

计算机敏感信息检测系统采用B/S、C/S结合的架构模式,系统主要由终端代理软件、管理服务(包含管理控制服务、分析服务、数据库和Web服务)组成。管理服务通过WEB统一管理检查策略和展示检查结果,终端代理软件执行策略要求的检查任务并上报结果数据。

系统核心功能结构主要由数据采集模块、信息抽取模块、数据分析与特征对比模块、人机交互模块四部分组成,如图1所示。

图1 核心功能整体结构图

计算机敏感信息检测系统核心功能结构实现了对主流文件类型的敏感信息智能识别功能。其识别流程是先将被检查文本内容格式标准化,为特征内容提取提供抽取源数据;然后由数据分析和特征比对单元根据已有的特征模型和分析技术对提取的特征元数据进行建模分析,确定是否是敏感信息文件。

数据采集模块。信息采集模块对指定的扫描区域进行文件遍历扫描,对文件进行初步过滤和字符转换。由于文件内容信息数据的复杂性,为了方便进一步特征信息提取和分类,在特征提取之前,对被检查文本进行结构和内容标准化处理,形成标准化文本。当系统稳定运行后,信息采集将根据逐渐调整的采集策略,调整采集频度,加快采集周期。

信息抽取模块。信息抽取模块对采集的文本通过分词搜索技术按照模型设定特征内容进行分类,在分类基础上完成文本数据域的划分和包含的重要文本数据抽取。其目的是把复杂的文档内容中所涉及的有用文本信息结构化入库。为之后根据文本内容的特征的敏感信息模型分析以及相似度分类计算提供分析源数据。

数据分析、特征比对模块。由数据分析和特征比对模块对提取的文件特征信息和格式信息数据进行进一步分析处理。该模块会根据文件格式特征模型和内容特征模型对获取的特征数据进行比对建模,同时为提高其分析结果的准确性,模块还实现了对文件相似度分值计算,对结果进行相似、可疑、准确级别归类。为进一步进行敏感信息安全业务管理提供数据支撑。

人机交互模块。采用跨平台的J2EE技术构建Web UI人机交互页面,具备实时、高效、灵活的监控结果和分析结果展示、统计分析报表展示功能、告警响应功能、数据查询功能等。人机交互页面是系统功能效果的最直接体现。

5 系统核心功能

5.1敏感信息检查

(1)敏感信息智能检查

系统对被检查文件进行格式和内容特征识别,结合智能分析模型判断其是否是敏感信息文件。同时对被识别的敏感信息文件进行相似度计算和密级(绝密、机密、秘密)自动分类,提高系统对敏感文件识别的精确度,也方便管理员对识别的敏感文件进行进一步审核。

(2)敏感信息关键字检查

系统采用字符匹配技术对指定敏感信息关键字进行全文匹配,上报已匹配的关键字信息和部分上下文信息。并且提供对多个敏感信息关键字全与、全或等组合匹配检查模式。能灵活支持用户关键字检查需求。

(3)敏感信息知识库检查

系统提供对指定敏感文件进行知识库学习功能,同时利用不断积累的敏感信息知识库对那些自定义和无规范格式的敏感文件进行智能发现,同时对被识别的敏感信息文件进行相似度计算,提高系统对不规则敏感文件识别的精确度。

(4)移动存储介质敏感信息检查

系统提供对介质接入时移动存储区域内文件的敏感信息检查和利用移动存储介质进行文件拷贝时对拷贝对象敏感信息检查功能。

5.2敏感信息管理

(1)敏感文件审查

对发现的敏感信息文件,进行人工判断,可根据其上报的上下文信息、相似度、密级标识以及提取全文内容来进一步确定其是否是敏感文件,并且对其进行审查通过标识,来提高敏感文件的识别准确度。

(2)敏感文件提取

系统在服务端提供敏感文件专用提取工具,对已识别的敏感文件进行远程提取,供安全管理员对文件进一步审核。

(3)敏感文件知识库学习

对已经确认的不规则敏感文件和指定要求的敏感文件进行特征和格式内容提取,作为敏感信息系统特征知识库,解决了敏感文件特别是涉密文件被人认为篡改格式、故意逃避监管,导致我们系统无法发现的问题。

5.3敏感信息防护

(1)敏感文件告警、通知功能

系统能根据设定的告警提醒条件对发现的敏感信息事件进行告警和提醒。

(2)告警提醒方式

告警、提醒方式可通过网页面提醒、客户端方式及时地通知相关人员。

6 实际效能

计算机敏感信息检测系统建设完成后,能够实现敏感信息的智能监控与管理,为加强内部信息网络敏感信息管理提供高效的管理工具。

一是满足敏感信息管理需要。能够形成日常化监测机制,实现对内部信息网敏感信息监测与检查,形成敏感信息管理的常态化、日常化工作机制。

二是满足敏感文件自动管控需要。能够自动、准确、全面发现敏感信息文件,及时处置敏感信息安全事件,防止信息泄密风险。

7 结束语

本文给出了公安内网敏感信息监管方案以实现敏感信息泄露的风险防范与安全管理策略,针对当前敏感信息检测手段存在的搜索结果准确性不高、搜索结果完整性不强的问题,提出了以管理为核心,技术为支撑的系统化敏感信息监管解决方案。在管理上提高了终端用户对敏感信息安全保密意识,在技术上引入了格式检查以及知识库检查手段,解决了关键字检查不准、不全的问题。同时,该系统的建设形成敏感信息日常化监测机制,能够自动、准确、全面发现敏感信息文件,及时处置敏感信息安全事件,防止信息泄密风险。

[1]蒋凯,武港山.基于Web的信息检索技术综述.计算机工程,2005.

[2]高凯,郭立炜等.网络信息检索技术及搜索引擎系统开发.北京:科学出版社,2010.

[3]胡学钢.文本内容的信息过滤技术研究.计算机应用, 2008.

[4]徐宝文,张卫丰,搜索引擎与信息获取技术.北京:清华大学出版社,2003.

[5]刘挺,秦兵,张宇等.信息检索系统导论.北京:机械工业出版社,2008.

猜你喜欢

关键字文档信息安全
浅谈Matlab与Word文档的应用接口
履职尽责求实效 真抓实干勇作为——十个关键字,盘点江苏统战的2021
有人一声不吭向你扔了个文档
成功避开“关键字”
信息安全专业人才培养探索与实践
保护信息安全要滴水不漏
高校信息安全防护
基于RI码计算的Word复制文档鉴别
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
《工业控制系统信息安全》——ICSISIA联盟专刊