大数据在检察工作中的应用研究
2017-09-27张浩
张浩
摘 要:随着互联网的快速发展,大数据、云计算和物联网等技术共同推动当今社会迈入大数据时代。检察工作利用大数据体量大、类别多、生成速度快、价值总量巨大等特征,深度挖掘和充分融合各类检察数据,以丰富检察手段,满足检察工作的数据需求,提高检察效率。大数据的广泛应用为检察工作带来巨大机遇,同时,其应用规模和复杂度给现有的硬件支持架构、大量数据处理和安全带来了极大挑战。文中依据我国大数据的发展趋势、研究现状,以及检察大数据的应用态势,从数据层面分析大数据在检察工作中的应用方向,并通过大数据应用特性分析目前检察大数据存在的风险及应对策略。
关键词:大数据;数据安全;数据挖掘;检察信息化
中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2017)09-00-03
0 引 言
大数据是检察机关信息化发展的重大机遇,也是提升检察生产力的又一次契机。2015年11月,全国检察机关电子检务工程会议在北京召开,最高检党组书记、检察长曹建明同志强调,全国检察机关要以党的十八大和十八届三中、四中、五中全会精神为指导,深入贯彻党中央关于加强网络安全和信息化、建设网络强国的重大决策部署,主动适应大数据时代的要求,全面扎实推进电子检务工程建设,以信息化助推检察工作规范化、现代化。
(1)大数据应用已经提升至国家战略
我国高度重视大数据技术的发展,“十三五”规划建议提出:“实施国家大数据战略,推进数据资源开放共享。”2015年9月,国务院通过《关于促进大数据发展的行动纲要》,标志着国家对大数据发展出台第一份正式文件,对大数据发展的规范化起到重要作用。
(2)大数据应用是电子检务工程的必然要求
2015年7月曹建明检察长在“互联网+检察工作”座谈会上强调打造“智慧检务工程”,高度重视大数据在行政执法和职务犯罪侦查、刑事司法衔接、强化诉讼监督中的作用,开发“检察机关电子证据云平台和智慧侦查平台”,建设“两法”衔接平台,推动侦查指挥、远程取证、智能鉴定等检察业务流程再造,不断增强发现、惩治犯罪和法律监督的能力水平。
(3)检察业务需求发展的必然趋势
检察工作目前普遍存在的难题包括领导赖以决策的依据比较粗糙、法律监督没有建立数值化标准体系、自侦案件在初查、侦查中缺乏相对全面的情报数据、没有具体的案件风险防控体系等。针对这些难题,大数据分析可通过案件数据库和情报数据库提炼出查办案件的规律,以此来服务决策;将作为“依据”的“事实”和作为“准绳”的“法律”以数据标准的形式显现出来,解决自侦案件查询分析问题和法律监督标准问题,提升侦查与协同办案、法律监督水平和社会公信力是检察业务需求发展的必然要求。
1 国内外研究现状
2008年9月《Science》发表了一篇文章“BigData: Science in the Petabyte Era”,从此“大数据”一词开始广泛传播。美国针对大数据的研究应用较早,虽然规范化发展还在进行中,但已有很多大数据企业或上市公司涉及大数据业务;欧盟把大数据作为未来经济发展的重要支撑之一;亚洲的日本、新加坡、印度等国对大数据产业重视较早,着手建设和发展也比较早,已具备一定规模。大数据的需求和应用非常广泛,各国政府大力推进,涉及政府管理、互联网、智慧电力、医疗健康、交通运输、智慧城市等诸多行业[1-3]。
我国高度重视大数据的发展与应用,在“十三五”规划建议提出:“实施国家大数据战略,推进数据资源开放共享。”在2015年5月,李克强曾提出:“大数据产业是中国推动‘互联网+战略的重要支撑。”2015年6月,习近平考察贵阳时强调:“发展大数据确实有道理。”在政策层面,2015年9月,国务院通过《关于促进大数据发展的行动纲要》,标志着支持大数据发展的第一部正式国家层面的文件出台,对规范大数据技术的发展起到了关键作用。此外,国内知名企业也早已积极进行大数据布局,国内三大互联网巨头阿里巴巴、腾讯、百度分别建有独自的大数据平台,对客户消费大数据进行分析,对行业发展大数据进行分析等。其它一些企业通过业务延伸和转型以及收购等方式进入大数据领域,我国涉及大数据相关业务的企业已经超过200家[4]。
2 大数据在检察工作中的应用
解决大数据发展问题的关键在于大数据技术[5],指借助云计算、大数据、物联网等各类型海量数据,快速挖掘、获取、分析具有价值信息的技术。“大数据”指数据本身的规模,同时也包括数据采集的工具、平台和分析系统等,大数据的目的在于将其通过存储、关联、比较、运算等方式进行分析,将分析结果应用到相关领域,从低价值密度的海量数据中“挖掘”出有价值的数据,并通过这些数据进行分析研判得出结论[6],从而促进行业领域的突破性发展,如图1所示。
(1)为决策提供高质量研判数据
大数据运用数据分析来服务决策。通过分析采集数据建立决策系统,以决策需求为依据,自动生成相关数据统计报表;把案件情况、社会评价情况、单位风险情况通过数据图文等形式直观辅助检察决策。
(2)提高刑检部门办案效率
大数据可以把检察工作中的卷宗转换成数据,把提审、接访等过程也转换成数据。相对于卷宗就是把纸质文件变为电子版,然后通过检察专网实现数据共享,根据检察官办案需求的关键字,智能分析出对应的目标卷宗,并实时对比展示;接访、提审、案件讨论等均可通过远程数字方式集中管理,按需分配视频流资源,提高工作效率,降低時间成本。
(3)转变自侦部门办案模式
大数据实现海量数据的分析研判,为侦查部门提供高密度价值的情报信息服务和支持。作为反贪污腐败的重要力量,检察机关将调查了解情况、相关证据上传到大数据中心,进行数据处理、分析,在发现职务犯罪线索、获取侦查情报、分析职务犯罪形势以及制定刑事政策方面提供高效率、高价值的参考信息。同时,在检察系统体系外,工商、税务、公安、房管等行政部门、招投标机构、金融机构、通信企业等单位建立起来的海量数据库也可为获取目标人员信息、获取并查处犯罪等提供帮助。endprint
(4)准确感知群众需求
大数据对互联网数据挖掘、司法行政机关接待群众需求的数据进行分析,自动感知、预测出群众所需的服务,分析出人民群众的需求。此外,窗口部门可通过大数据技术更好地服务来访群众,拉近与人民群众的距离,切实解决群众困难。
3 大数据在检察工作中的应用风险及解决对策
3.1 应用风险
伴随着数据挖掘、数据仓库、分布式计算等技术的高速发展[7],大数据分析、趋势研判的能力快速增强[8]。大数据的数字化进程不断深入,其安全问题日益显现。
3.1.1 数据安全
目前大数据应用所面临的最大风险是数据安全与网络安全。将海量数据集中存储,虽然方便数据分析与处理,但在安全使用、安全存储和安全管理环节存在大数据损坏和丢失风险,数据一旦损坏或丢失,将引发毁灭性的数据灾难。大数据的持续快速增加,对数据存储的物理安全性要求越来越高,从而对数据的多副本与容灾机制也提出更高的要求。此外,在线数据越来越多,黑客犯罪的动机比以往都强烈,当前存在的安全证书泄露、系统漏洞等导致敏感信息数据泄露/数据被盗的风险越来越高。
3.1.2 数据管理技术架构
数据管理技术架构风险主要包含以下四个方面:
(1)目前有很多采用传统数据库技术的应用系统,在设计之初没有考虑对结构化数据、半结构化和非结构化数据类别多样性的兼容问题。
(2)传统的数据库对处理响应时间要求不高,数据统计结果可能滞后很长时间才能输出,缺乏实时数据处理能力。
(3)传统的数据库没有构建分布式数据仓库,扩展能力受限,无法处理TB级别的数据,传统数据库的管理能力被快速增长的数据量远远超越。
(4)海量数据传输需要高性能的网络架构与强大的数据中心,以支持高并发访问,保证数据稳定、低负载,海量数据的运维工作也将成为一项挑战。
3.1.3 数据开放与隐私的权衡
由于政府、企业和行业信息化建设时间跨度大,未全部参与统一规划,未进行统一标准制定,形成了众多信息“孤岛”,且受相关政策限制,数据开放程度较低,为数据共享造成了极大障碍。因此,建立良性发展的数据共享系统,是检察大数据发展必须突破的难关。同时,开放与隐私如何平衡,也是检察大数据开放过程中面临的难题。
3.2 防范对策
3.2.1 准确定位业务部门的大数据需求
业务部门没有清晰的大数据需求。很多业务部门难以提出大数据的准确需求,使得大数据建设受限,同时也阻碍了自身数据资产的积累和挖掘,甚至由于数据没有应用场景而删除了很多有价值的历史数据,导致数据资产流失。检察业务部门需要利用数据分析来支撑决策,从认识“大数据”出发,到“大数据能产生价值”,到“从大数据中找到价值”,再到“有效使用大数据产生的价值”是大数据需求认知的必经之路,如何收集有效数据、使用数据、开放数据、管理数据和利用数据是大数据需求准确定位的基础。
3.2.2 破解数据孤岛现象
目前数据孤岛情况严重,如何整合碎片化的检察数据是启动大数据所面临的第一道难关。数据常常散落在不同的业务部门,甚至是不同单位,而且这些数据存在于不同的数据仓库中,导致数据价值难以被挖掘。大数据需要不同数据的关联和整合才能更好地发挥、理解业务的优势,通过建设与相关单位的数据专线、互联网数据挖掘、检察专网数据共享的方式破解数据孤岛现象。
3.2.3 规范建设标准,加强安全防护
没有标准就没有系统。在建立、完善大数据系统时,可建设面向不同主题、覆盖各个领域、动态更新的大数据标准,为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。建立安全良好的运行机制,综合建设过程中的各个环节,建设一套有序的、动态的、可持续发展的系统工程。此外,以我国等级保护制度为标准,利用分级保护技术、設备接入控制、数据安全防护等手段来提高大数据网络的安全防护能力。
4 结 语
在检察工作中大数据技术发展迅速、应用广泛,以检察机关业务需求为出发点,以检察司法办案信息平台建设现状为基础,依托统一业务应用系统数据、执法司法信息资源,结合大数据技术的特点和优势,分析、挖掘大数据技术在检察工作中的应用领域,并且通过大数据应用所产生的数据安全、网络安全等问题,从数据层面分析大数据应用过程中面临的风险并制定相应的防范对策。
参考文献
[1]李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015,45(1):1-44.
[2] Agrawal D,Bernstein P,Bertino E,et al.Challenges and Opportunities with Big Data-A community white paper developed by leading researchers across the United States[R/OL].2012.
[3]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):5-15.
[4]张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013,50(S2):216-233.
[5]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-149.
[6] David N Reshef,Yakir A Reshef,Hilary K Finucane,et al. Detecting Novel Associations in Large Datasets[J].Science,2011:1518.
[7]李建中,刘显敏.大数据的一个重要方面:数据可用性[J].计算机研究与发展,2013,50(6):1147-1162.
[8] R Bryant,R H Katz,E D Lazowska.Big-data computing: Creating revolutionary breakthroughs in commerce, science and society[N/OL].2012.endprint