大数据时代互联网信息数据治理现状与对策
2021-12-02李雅娜孙宁高玉珍
李雅娜 孙宁 高玉珍
摘 要:目前,如何从大数据中提取有用的数据信息、提升数据的价值,即做好数据治理,成为全球关注的问题。该文就是在此背景上,首先从大数据、数据治理定义出发,梳理相关文献,阐述国内外数据治理的沿革;其次从我国政府管理、医疗、教育、金融等方面大数据治理的现状出发,找出数据治理中现存的问题和不足;最后,提出针对我国数据治理的总体对策,以期给新时期的数据治理提供参考。
关键词:大数据时代 互联网信息 数据治理 现状与对策
中图分类号:F424;F49 文献标识码:A文章编号:1672-3791(2021)08(c)-0001-03
Current Situation and Countermeasures of Internet Information and Data Governance in the Era
of Big Data
LI Yana1 SUN Ning2 GAO Yuzhen2
(1.Internet Security and Information Technology Center of Shandong Province; 2.Shangdong Agriculture and Engineering University, Jinan, Shandong Province, 250100 China)
Abstract: At present, how to extract useful data information from big data and improve the value of data, that is, do a good job in data governance, has become a global concern. Based on this background, this paper firstly starts from the definition of big data and data governance, combs the relevant literature, and expounds the evolution of data governance at home and abroad; Then, starting from the current situation of big data governance in China's government management, medical treatment, education and finance, find out the existing problems and deficiencies in data governance; Finally, i t puts forward the overall countermeasures for China's data governance, in order to provide reference for data governance in the new period.
Key Words: Big data era; Internet information; Data governance; Current situation and countermeasures
大数据时代,无论是在国家、政府公共管理方面,还是在关乎民生的医疗、教育、金融、交通等重要领域,大数据均发挥着巨大的作用。谁拥 有了数据资源,谁就拥有了核心价值和资源。美国前任总统奥巴马称大数据为“未来的石油”。因此,大数据在新时代已成为国家政府治理、公共生活领域引领、商业企业经营、个人生活服务中必不可少的内容。如何从大数据中提取有用的数据信息、提升数据的价值,即做好数据治理成为全球关注的问题。目前在全球若干国家掀起数据治理的浪潮,该文在此背景下,首先从大数据、数据治理定义出发,梳理相关文献,阐述国内外数据治理的沿革;其次从我国政府管理、医疗、教育、金融等方面的大数据治理的现状出发,找出数据治理中现存的问题和不足;最后提出针对我国数据治理的总体对策,以期给新时期的数据治理提供参考。
1 大数据和数据治理相关概念及现状梳理
随着互联网和信息技术的发展,大数据成为近几年的一个潮流词出现在社会、工作和生活的每个角落。百科上是这样定义的:“大数据”是一种信息量十分巨大,无法在一定时间范围内用常规软件工具捕捉、管理和处理的数据集合。2004年,国外学者就开始关于“数据治理”的研究,之后学者们围绕企业、政府、医院和高校的数据治理展开了大量的理论研究和实践探索。我国关于数据治理的研究始于2010年,张宁等人研究者从数据治理的概念、體系、内容等方面进行了探讨[1]。其他学者从医疗、教育、交通等不同应用领域进行了探讨。目前数字治理有两种含义,一种是对数据的治理(manage of data),另外一种是基于数据的治理(manage based on data)[2]。前者把数据作为一种资产,采用合理的方式方法对其进行合理的管理和组织;后者则是利用数据,对其进行分析、优化、提炼实现巨大的经济社会价值。该文是在第二种含义的基础上进行论述的。
2 数据治理现状
数据治理是国家政府在新时代做好各项公共事务的前提。数据治理不仅可以使政府在管理社会事务的过程中有预见性,也能够帮助政府在处理具体事务时更加精准有效。有研究表明,目前政府掌握的数据占到总数据的70%~80%[3],若将这些数据合理利用,将会给带来更多创新应用,给领导层提供过程性的数据而不是静态结果,便于更多知民意、顺民心的英明决策的制定,将会为国家创造更多价值,提高整个国家在大数据时代的竞争力。接下来将从我国政府管理、医疗、教育、金融、交通和传统商业企业大数据治理的现状为出发点,分析梳理成效和不足之处。
2.1 政府部门“数据孤岛”现象较为严重
政府不同职能部门在处理相关业务时所采集和产生的数据属于该部门,从而导致即使是同一类数据,按照不同方式采集后分散在不同职能部门,数据完整性、精准性被客观分割,部门之间的数据无法共享共用,形成了数据孤岛[4]。以乡村振兴精准扶贫为例,因自然环境、社会资源、经济发展等各种因素的影响,对各地采取的政策不尽相同,在调研当地原始数据时,存在着各村在民政、公安、财政数据信息不统一,大部分信息重复存在,但因缺乏统一标准,数据信息不统一,调用信息繁琐、复杂,给扶贫工作带来了滞后性。
2.2 医疗大数据共享困难
医疗大数据除了具备普通大数据5V(体积大、样式多、时效性、准确性、价值性)特征外,还具备阶段性、冗余性[5]。我国医疗行业体系异常庞大,各个大型意愿基本都建立了自己的App、微信客户端,比起以前的“看病三分钟、排队三小时”有了很大的改观,但是仍存在着诸多不足,现阶段,我国医疗行业数据治理主要存在以下问题:一是应用数据质量低,医疗大数据多半是非结构与半结构数据,各医疗应用平台不统一导致大量的异构数据存在,有时存在采集原始数据时质量较差,诸多原因導致应用数据质量差。二是共享数据较为困难,目前医疗数据开放程度较低,不同地方政府、不同医院、不同组织结构所建立的医疗数据资源平台存在着较大的差异性,数据格式、数据标准等不统一,没有形成一个完整的医疗体系。
2.3 教育数据平台重复建设,数据冗余度高
《国家教育事业发展“十三五”规划》指出,要“利用大数据技术开展对教育教学活动和学生行为数据的收集、分析和反馈,为推动个性化学习和针对性教学提供支持”,各级教育行政部门和各类教育机构日益重视数据的巨大作用,在高校尤为重视。如浙江大学建立的“学在浙大”2.0、西北农林大学的数据驱动学校内涵发展。高校数据治理主要经历了数据库治理、数据仓治理、数据湖治理这3个发展阶段[6]。各类学校根据自身情况纷纷建设了各类系统[7],比如:学生管理系统、教学管理系统、收费系统、智慧教学系统等,但存在着数据资源信息(如学工系统、教务系统与收费系统人数)不对称,数据存在着重复采集,系统数据无法实现共享共用,冗余度较高。多系统的冗余建设对高校信息化硬件的存储、数据存储的安全性都提出了更多的要求,但实际情况与期望值要求还存在着较大的差距。
2.4 金融大数据缺乏自上而下的统一规划
国务院2015年7月颁布《关于积极推进“互联网”行动的指导意见》中指出,鼓励各金融机构利用云计算、移动互联网、大数据等高新技术手段,加快金融和服务的创新,为实体经济发展提供有效支撑。习近平总书记在十九大报告中也曾给出指示,国家层面高度重视数据时代的金融数据治理问题,为此,人民银行、及各银行业金融机构纷纷出台数据发展战略,组建大数据平台进行数据治理。面对海量金融数据、繁杂数据环境、潜在的质量缺陷问题,现有的金融机构数据治理没有形成统一的规划和指导,金融监管机构又缺少相关人才的支撑和保障,虽然当前已引起金融监管部分重视,但是由于金融清算系统数据存放较为分散、治理能力有限,期待从上到下建立大数据治理平台[8],为未来金融数据分析工作奠定基础。
3 应对策略
通过对政府部门、医疗体系、教育部门、金融机构四大体系的数据治理现状进行分析,对存在的问题和不足之处,从以下几点给出对策建议。
3.1 政策支持:建立和完善国家数据治理体系
不论从政府部门、医疗体系,还是教育和金融机构,在笔者看来,由于缺乏全国层面的政府、医疗、教育、金融数据互联、缺乏领域间的数据互通、缺乏基层机构的广泛应用及其上级行政部门的数据交换,使得各业界数据的准确性提升困难,内在价值挖掘难度加大,这些无一不要求国家层面推出政策和措施。建议政府部门从全国不同行业为出发点,建立和完善各行业的数据结构标准、数据治理标准,加大力度推出不同行业数据国家标准,建立全国层面的数据治理统一标准。特殊场景,可适当因地制宜进行差异化管理[9]。
3.2 完善法律:建立数据安全标准体系和评估体系
各行各业的数据关乎人民的生命、财产安全,关乎社会的长治久安。做好数据治理工作,国家要从法律层面上严格标准,对通过任何方式获取、窃取、篡改公民、企业、商业等隐私数据信息的行为进行严惩。建立多级别、分层次的多级数据安全保护制度必不可少。采取技术、管理等多种手段加强数据主权维护和个人、企业、国家隐私保护,进而提高数据资产价值实现的安全性。
3.3 培训体系:建立多层次、全方位的数据素养培训体系
数据安全现在已经上升到国家安全的层面,国家之间的竞争说到底是人才的竞争,尤其在新时期大数据时代。采取多种方式从国家层面完善内部人才培养机制,而政府部门应指定专人负责数据治理各方面业务培训工作,同时吸纳社会力量,形成开放式跨界数据治理协同机制,引导科研机构、高校、大型企业积极参与到数据治理工作中,形成共 建、共享、共赢的数据治理格局。另外,与高校合作培养大数据人才队伍,在政府、国有企业、科研院所探索建立“3O体系”,分别是首席信息官(CIO)、首席数据官(CDO)和首席技术官(CTO)管理体系[10],加强对等复合型专业人才的培养。通过多层次、全方位的数据素养培训体系,提升整个社会的数据治理使用能力。真正实现“数据产生来源在人民,数据服务为人民”。
参考文献
[1] 张宁,袁勤俭.数据治理研究述评[J].情报杂志,2017,36(5):129-134,163.
[2] 何哲.国家数字治理的宏观架构[J].电子政务,2019(1):33-38.
[3] 范灵俊,洪学海,黄炅,等.政府大数据治理的挑战及对策[J].大数据,2016(2):27-38.
[4] 丛楷力.从碎片化到整体性地方政府数据开放治理研究[D].济南:山东师范大学,2019.
[5] 常朝娣,陈敏.大数据时代医疗健康数据治理方法研究[J].中国数字医学,2016,11(9):2-5.
[6] 赵健.应用型本科院校大数据治理现状及对策研究[J].电子技术与软件工程,2021(10):156-157.
[7] 徐峰,吴旻瑜,徐萱,等.教育数据治理:问题、思考与对策[J].开放教育研究,2018,24(2):107-112.
[8] 张立书.支付清算系统数据治理现状、问题及对策[J].吉林金融研究,2020(1):73-75,52.
[9] 梁正,吴培熠.数据治理的研究现状及未来展望[J].陕西师范大学学报:哲学社会科学版,2021,50(2):65-71.
[10] 洪伟达.黑龙江省加强数据治理的对策研究[J].学理论,2020(3):36-38.
基金项目:2020年山东农业工程学院院级重点课题(项目编号:20XJND05)。
作者简介:李雅娜(1982—),女,本科,工程师,研究方向为网络安全与信息化管理。
孙宁(1982—),女,本科,馆员,研究方向为校园信息化建设。
高玉珍(1984—),女,硕士,讲师,研究方向为校园信息化。