政务大数据安全体系设计
2021-10-30张家勇
◆张家勇
政务大数据安全体系设计
◆张家勇
(大连市大数据中心 辽宁 116000)
大数据是数字经济发展的核心动力,政务大数据更是提升政务实施效能重要手段,党中央、国务院高度重视。经过多年的深耕,政务大数据得到了长足的发展,取得了很大的成绩,但也面临一些风险。本文从管理、制度、技术三个方面分析了目前我国政务大数据所面临的安全风险及遇到的问题并设计了一套安全体系,对我国政务大数据安全体系建设和政务大数据的发展有现实指导意义。
政务大数据;安全体系;安全风险;数据生命周期
1 引言
随着我国社会经济的发展和信息技术的成熟,政务信息化已经取得了长足的进步。目前,我国网民数量非常庞大,数据资源丰富且市场广阔。国务院在2015年印发了《促进大数据发展行动纲要》,明确要求加快政府数据开放共享,推动资源整合,提升治理能力,通过将大数据技术引入政务领域,实现智能办公、监管、服务以及决策等。
经过多年的深耕,政务部门积累了海量数据,这为政务大数据的发展提供了坚实的数据支撑。但另一方面,这些数据来源于各政务部门,数据覆盖面广,结构关系复杂多样,且部分数据为敏感或隐私数据。如何保障这些数据的安全是政务大数据面临的挑战,因此应尽快建立和完善政务大数据的安全体系,保障政务大数据健康、安全、有序发展[1]。
2 政务大数据面临安全风险及问题
2.1 管理方面
政务大数据涉及的数据保护管理主体较多,部分地区和部门数据采集、应用、归属相关规范不够全面,管理边界和责任区分都相对模糊,管理体系更有待完善[2]。部分地区和部门没有专门的机构和人员从事安全工作,数据应用、存储、审计等工作不能专责管理和管办分离,当数据泄露时更无法追溯和明确责任。部分地区和部门存在第三方开发和运维人员进入大数据生产环境的流程不明确,使用的设备和操作命令管理不严等问题。这些都是政务大数据面临的风险和暴露的问题,这些问题都阻碍了政务大数据的应用和发展。
2.2 制度方面
目前,我国尚无数据安全及个人信息安全法律法规,针对大数据安全相关术语、架构、隐私保护等标准规范也尚需完善[3]。目前用户对政务大数据相关知识理解程度参差不齐加之无相关标准规范,造成无法规范描述政务大数据的相关角色、架构、方案等内容。另一方面,政务大数据平台建设、管理、技术架构及应用等安全标准和政务数据收集、传输、存储等生命周期全过程管理标准也尚需完善,这些问题都在一定程度上阻滞了政务大数据的发展[4]。
2.3 技术方面
近几年,随着大数据、云计算、人工智能及物联网等技术快速发展,相关系统、中间件和技术架构也不断更新迭代,给政务大数据提出了新的安全问题。如基于人工智能的新型攻击,使传统安全防护措施很难应对[5]。传统政务信息化系统之间数据零散、孤立且异构,但大数据技术打破数据边界促进数据流动共享,使传统的基于边界的安全防护措施无法应对[6]。新的基于大数据技术的开源中间件和支撑软件不断涌现并且形成了一定的开发生态圈,在一定程度上降低了大数据应用的成本和门槛,如基于Hadoop的各种大数据平台就被经常使用,但如果没有完善的安全技术标准规范,系统的安全漏洞就会被利用和放大,使用的越频繁安全隐患就越大。
3 政务大数据安全体系总体设计
2019年,国家发布了以主动防御为主的网络安全等级保护2.0标准。本文按照其提出了“一个中心、三重防护”的原则,从组织管理、标准规范、技术体系三方面出发设计了一套政务大数据安全体系,其整体架构如图1所示。
图1 政务大数据安全体系总体架构示意图
(1)管理组织。成立政务大数据安全管理组织机构,明确部门的工作职责、流程以及相互配合机制,统筹协调政务大数据相关工作,提高工作效率,监管数据安全相关政策标准规范安全措施的贯彻落实。
(2)标准体系。基于国内政务信息化安全相关标准规范现状结合政务大数据安全制度实际情况,遵照“上下一致、融会贯通”、“全面覆盖、不留死角”、“因地制宜、切实可行”原则,从平台技术、数据安全、服务安全、基础概念等多个维度切入制定政务大数据安全制度、标准、规范并形成体系,并在工作的开展过程中在此基础上不断迭代更新和完善,保障政务大数据相关工作开展“有据可依”。
(3)技术体系。使用漏洞管理、分级管理、资产管理、身份认证等技术从数据全生命周期安全、安全运营管理、基础安全三方面建设完善政务大数据安全技术体系[7]。
4 政务大数据安全组织体系设计
以市级政务大数据安全组织体系建设为例,成立政务大数据安全工作领导小组(或政务大数据工作领导小组),由市委、市政府主要领导任组长,各相关部门一把手任组员,工作小组负责对数据安全工作进行统筹管理,负责总体方针、技术路线、资源投入的决策。市大数据管理局联合市网信办、市密码管理局、市政府办公室、市公安局、市信息中心等相关部门负责数据安全工作,制定工作计划,编制数据安全相关制度和规范,可行性评估、制度审核、实施方案审核、组织第三方安全检测机构负责上线前检测(包括风险评估、渗透测试、代码审计,编写报告、发现风险并告警等)等工作。市信息中心组织政务大数据平台的承建单位负责数据库、表、字段的管理,按照数据安全相关工作规范要求审批数据使用申请、分配权限。各单位业务接口人参与数据安全工作计划的制定,提出数据安全相关需求,贯彻落实数据安全相关工作。
5 政务大数据安全标准体系设计
参考目前已经发布的大数据相关标准规范从基础、数据、技术、平台工具、治理与管理、安全和隐私以及大数据应用等角度对政务大数据安全标准体系进行规划设计[8]。制定基础类标准规范,规范政务大数据的基本术语、定义、范围及参考框架等内容,用以指导其他政务大数据安全标准的制定[9]。从数据资源、共享交换两方面切入制定数据类标准对底层数据资源进行规范。从大数据开放、大数据全生存周期处理、大数据集描述等方面制定大数据通用技术规范[10]。制定大数据平台工具类标准,明确大数据平台、数据库等产品的功能、性能、测试等要求。制定数据管理、数据治理标准规范并在此基础上制定评估标准。从应用、服务、平台技术以及数据安全等方面切入制定安全隐私类标准。政务大数据安全标准体系架构如图2所示。
图2 政务大数据安全标准体系架构示意图
6 政务大数据安全技术体系设计
6.1 总体设计
从数据全生命周期安全、安全运营管理、基础安全三方面建设完善政务大数据安全技术体系[11],其整体框架如图3所示。
6.2 基础安全
采用入侵防御、访问控制、漏洞扫描、系统加固等技术手段保障政务大数据基础平台安全。
(1)入侵防护。在大数据平台区域边界部署入侵防御系统,通过对访问流量的深度分析及时发现并阻断非法入侵和攻击。
(2)访问控制。合理划分安全区域,实现区域隔离。对业务操作、运维管理等访问进行分类,严格识别访问者身份,控制审查区域间互访,把可能出现的风险控制在预定区域处理。
(3)应用安全。通过在政务大数据边界区域部署网关杀毒、应用层高性能防火墙、WEB应用防护、沙箱虚拟系统等技术手段,严格对经过区域边界的网络流量进行检测防护,加强政务大数据应用安全。
(4)基线加固。按照政务信息系统等级保护标准设置政务大数据平台使用的操作系统、中间件、数据库及其他开源组件的安全基线,有针对性地实施政务大数据平台的基线核查。重点发现大数据平台常用组件(如Hadoop及其相关组件)在身份认证、默认权限、日志审计等方面的问题并针对漏洞进行修补加固。
(5)漏洞扫描。采用漏洞扫描系统对政务大数据平台及其使用的组件进行周期性漏洞扫描,深度探测端口和遍历目录结构并配合源代码分析发现漏洞、并根据报告制定漏洞修补方案。
(6)数据备份。实现数据本地/异地备份,采用NAS、磁带库、NBU等备份软件将数据备份到外部系统,通过Hlog实时复制、BackupAdmin异步复制等方式实现数据跨数据中心灾备。
图3 政务数据安全技术体系框架示意图
6.3 数据全生命周期安全
数据的收集,传输,存储,共享,应用和销毁是数据生命周期的不同环节,政务大数据平台的安全稳定运行要保障上述各个环节安全,确保整体环节安全可靠,不能让任何一个环节出现安全短板,单纯加强其中一个或几个环节,都达不到整体加固的效果。
(1)数据采集环节安全。从数据采集终端和采集数据识别两方面加强数据采集环节的安全防护。对数据采集系统的账号和权限实施统一管理,集中制定用户账号访问策略。加强网络访问策略的控制管理,实施用户访问强制认证,识别非法访问并及时阻断。加强敏感数据的发现、识别、分类及定级管理,对敏感数据进行脱敏或加密处理。
(2)数据传输环节安全。数据传输环节同样要注意传输双方身份验证,严格验证和控制访问权限,避免未授权用户或者非法用户访问。同时应部署数据防泄漏系统,通过机器学习、数据指纹等技术识别发现敏感数据。采用AES、SM4、RC4等算法对传输数据进行加密的方式避免敏感数据在传输过程中被窃取。采用签名验证技术防止数据被恶意篡改。
(3)数据存储环节安全。在政务大数据平台的基础设施层采用Raid/OS写缓存保护、Raid等技术保证数据可靠性,结合存储产品技术支撑能力快速发现故障硬盘,降低MTTR,提高数据可靠性。同时采用数据加密、权限管理等手段保障政务大数据平台和数据库存储数据的安全。部署密钥管理系统实现Hadoop分布式文件系统和Oracle、MySQL等关系型数据库等加密,保障数据存储环节安全。
(4)数据应用环节安全。针对实际业务访问需求开发专门的应用系统、API或Web Service并做好相关安全防护,要求用户终端通过合法应用访问数据,同时部署数据库防火墙,识别非法应用并阻断访问,防止数据泄露,同时做好敏感数据的识别并做加密或脱敏处理。
(5)数据共享环节安全。数据共享环节也应针对共享交换的业务需求开发业务系统或者交换接口,通过专门的系统或接口完成共享工作,并在交换过程中做好身份权限验证与接口的监控和审计工作。敏感数据的共享时应该按照相关标准规范要求结合实际情况做好数据脱敏工作,数据脱敏应支持协议解析、网络流量审计监听、SQL重写、数据识别等方面功能。使用数字水印技术对共享交换的结构化数据和非结构化数据植入水印,一旦交换的数据泄露,可以通过数字水印进行溯源,提升溯源能力。
(6)数据销毁环节安全。为保障政务大数据平台数据的安全,应注意数据销毁环节的安全保护,如为用户分配共享内存或者数据卷的时候,应销毁所分配的共享内存或数据卷中原有数据,避免用户或恶意程序通过内存恢复、数据恢复等技术手段窃取原存储数据。如需删除加密数据时应注意一并销毁加密密钥,同时按照相关规定处理好承载的存储设备。对存储数据的物理介质应该实施统一管理,当需销毁数据的物理存储介质时应按照相关要求履行申请、审批、登记的手续,并采用消磁等多种手段进行处理。
6.4 运营管理
运维管理安全主要做好数据的运维管理和数据安全态势分析两方面[12]。一方面在运维管理过程中要严格管理外部系统的接入,认证访问者身份,验证其访问授权,规范运维安全审计系统。另一方面,通过收集数据所处网络的流量及访问日志,对用户行为进行分析和挖掘,识别阻断数据泄露、篡改等异常行为等方式做好安全态势分析。
7 总结
本文从组织管理、制度标准以及安全技术三个方面分析了目前我国政务大数据所面临的安全风险和问题,有针对性地成立政务大数据安全组织机构,在现有标准规范基础上补充完善标准制度体系以及建设完善的安全技术体系的方法设计了一套集安全组织、安全标准、安全技术于一体的政务大数据安全体系,以上工作对我国政务大数据安全体系建设和政务大数据的发展有现实指导意义。
[1]万淼.数据防泄漏技术模型的发展方向分析[J].信息技术与网络安全,2019,38(8):22-27.
[2]朱岩,刘国伟,王静.政务大数据安全架构研究[J].信息安全研究,2019,5(5):370-376.
[3]冯文华.《大数据安全标准化白皮书》(节选)汉译英实践报告[D].山东:山东科技大学,2018.
[4]尤慧.加快江苏政务大数据共享管理的对策研究[J],区域治理,2018(37):87-88.
[5]李子臣,杨义先.如何保护数据安全和个人隐私[J].金融经济(市场版),2018(6):17-19.
[6]李凌煜.大数据技术在企业会计数据分析中的应用[J].经济研究导刊,2018(8):176-177.
[7]李静,单既桢.大数据时代下区域健康医疗数据资源共享及安全防护机制研究[J].信息技术与信息化,2019(4):132-134.
[8]叶润国,胡影,韩晓露,王惠莅.大数据安全标准化研究进展[J].信息安全研究,2016,2(5):404-411.
[9]闫桂勋,刘蓓,程浩,许涛,王啸天,文博.数据共享安全框架研究[J].信息安全研究,2019(4):309-317.
[10]大数据安全标准化白皮书[2018版].全国信息安全标准化技术委员会大数据安全标准特别工作组.http://www.cesi.cn/201804/3789.html.2018.
[11]李雯瑞.大数据环境下计算机网络信息安全防护措施研究[J].信阳农林学院学报,2020,30(03):109-112.
[12]范浩.大数据在企事业单位中运营安全的研究[J].江苏通信,2017(3):59-61.