APP下载

大数据治理

2017-10-21凌博威

电脑知识与技术 2017年18期
关键词:数据治理扶贫大数据

凌博威

摘要:自党的十八大明确提出“科技创新是提高社会生产力和综合国力的战略支撑,必须摆在国家发展全局的核心位置”以来,技术驱动发展的方式在过去几年取得巨大成就。如今,数据驱动科学发现成為一种新的进步路线。数据的指数性增长、数据处理技术的快速发展,使得人们可以通过数据、数据分析思想来解决人们共同关心的问题。随着2020年全面建成小康社会的节点不断迫近,我国仍有约7017万人生活于贫困水平线以下,现行的扶贫政策仍存在很多问题尤待解决,使精准扶贫工作难以展开。基于海量的贫困数据基础,积极探索数据获取、数据决策、数据考核、数据共享的精准扶贫方式,突出扶贫工作的精准性、有效性。

关键词:扶贫;大数据;数据治理;发展

中图分类号:G203 文献标识码:A 文章编号:1009-3044(2017)18-0005-02

1概述

大数据时代的到来,“数据驱动科学发现”成为新的全球化大趋势。小到商品的生产、流通、分配、消费活动,大至一个国家、社会的经济运行机制、社会生活方式和国家治理活动,大数据在其中都起了重要的影响。国家之间的竞争战略正从传统的对土地、能源等有形资源的争夺转向对大数据等的无形财产争夺。大数据在经济、文化、军事方面的应用,引发了巨大的技术变革,成为各国争相发展的技术学科。近些年来,全球各国政府及国际组织纷纷将数据发展纳入自身发展战略。截至2014年4月,全世界已经有63个国家制定并实施了开放政府数据计划,有效推动政府从以往的“权威治理”执政模式过渡向“数据治理”。其中,美国政府最早对“大数据变革”做出战略决策。2009年1月,奥巴马总统上任即发布《信息自由法案备忘录》,同年5月联邦首席信息官委员会(Chief InformationOffi-eer Councill启动了Data.gov项目,作为开放政府的一部分。2016年5月,美国政府又发布了《联邦大数据研究与开发战略计划》,对联邦机构与大数据相关的投资和项目进行指导。欧盟也于2010年发布了《开放数据:创新、增长与透明治理的引擎》,指导开展“数据价值链战略计划”,并资助“大数据”和“开放数据”领域内的研究和项目。

大数据对于中国具有重要的战略意义。刚结束的党的十八届五中全会通过的“十三五”规划《建议》,明确提出实施网络强国战略以及与之密切相关的“互联网+”行动计划,这无疑为大数据的发展提供了政策支持。截至2016年,中国互联网用户数高达6.68亿,虽然拥有如此庞大的数据生产和数据消费主体,但对于数据的开发与利用仍处于初级阶段,要想成为数据大国仍有很多的困难要克服。我国政府作为政务信息的采集者、管理者和使用者,掌握着国家80%以上的数据,具有绝对的信息优势。但由于信息技术、管理制度等限制,各级政府部门之间的信息网络往往自成体系,难以实现数据资源互通互享,导致目前政府掌握的数据大都利用率较低。我国自2011年起便开始了政府开放数据相关的可行性调研和平台建设,北京、上海、武汉等地相继退出了开放数据平台网站,便于政府部门和其他机构查找问题、看清趋势,推进开放政府数据工作的良性发展。

当前我国形势下最严峻、最亟待解决的就是扶贫攻坚的难题。随着2020年全面建成小康社会的节点不断迫近,我国仍有约7017万人处于贫困水平线以下,现行的扶贫政策仍存在很多问题尤待解决,使精准扶贫工作难以展开。基于海量的贫困数据基础,积极探索数据获取、数据决策、数据考核、数据共享的精准扶贫方式,大数据的兴起为精准识贫提供了新的视角,既是机遇,也是挑战。一方面,海量的贫困人口数据增加了问题的复杂性,给问题的解决增加了难度;另一方面,对这些含有意义的数据进行专业化处理,通过专业的分析处理实现其经济、社会效益,并提升我国的数据治理能力。

2数据获取治理

良好的数据获取方法能使数据的利用事半功倍。数据获取治理的目的在于提高数据的可获取性与可利用性。通常,数据的获取需要依靠国家的行政命令、资助机构的政策和大学的管理办法等来形成一套健全的科研数据获取政策体系。政策的影响作用对于数据的获取过程中发挥着关键作用。2014年4月,国务院扶贫办印发关于《扶贫开发建档立卡工作方案》的通知。建档立卡就是要对贫困户和贫困村进行精准摸查,对贫困县和连片特困地区进行监测和评估,了解贫困状况,分析致贫原因,明确帮扶主体,落实帮扶措施;分析掌握扶贫开发工作情况,开展考核问效,实施动态管理,检查帮扶责任人履职情况和贫困对象脱贫情况,为扶贫政策的制定和绩效考核提供依据。建档立卡方案的实施为扶贫数据的获取提供了政策上的保障。

政策虽然具有重要的指导作用,但政策的实施更为关键,需要采取综合办法。不仅需要考虑数据获取和长期保存的协同、动态更新与促进研究应用的平衡,而且要权衡与数据有关人员的利益相关性,才能保证最终获取的数据客观、有效。

3数据决策治理

数据能够驱动决策的制定。获取数据之后,分析人员借助专用数据分析平台,基于密集型大数据资源进行数据挖掘和综合研析,能够深入挖掘事物发展规律,产生智能化决策建议与方案。数据驱动决策的优点在于人们做出决策取决于对数据的积累、获取与挖掘,而非基于直觉和经验的主导,避免了决策制定的主观性、盲目性。这种条件下,获取的数据被充分挖掘,信息之间的关系被梳理得清晰明了,决策结果的可信度也越高。美国一直以来的理念就是数据为科技决策提供强有力的支持,自1968年开始,国会每年强制国家科学与工程统计中心开展“联邦科学与工程支持高校和非营利机构调查”的项目,相关数据成为每年提交总统和国会年度报告的基础。

运用“大数据”思维,基于大量贫困户的数据事实,通过对数据的分析与整合,在深入挖掘当前我国的贫困现状与特征的前提下,提出切实可行的政策建议,能有效地提高决策效率和效能。数据分析结果为新政策的制定提供了事实基础。

4数据考核治理

数据考核治理是检验数据利用的一个重要过程。一个科学的考核方案不仅能够发现数据获取、分析过程中发现的问题,而且能够为数据的利用提供依据。

数据收集是数据考核的首要环节。数据来源的真实性、准确性不仅直接影响考核结果,也会影响后续考核工作的开展。需要制定严格的数据收集准则,以保证考核数据的真实准确。对于与分析结果相悖的数据,由于其也是事实的本来反映,也应当真实呈现,不能随意捏造。真实的、客观的贫困户数据能够反映当地贫困问题的特征,有利于各级有关部门及时发现问题,从而“对症下药”。

考核人员的素质也决定了考核的效果。在考核方案执行的过程中,首先应该明确各个部门和人员的任务与职责,共同确立各项考核指标。其次,在讨论、确定考核方案的过程中,数据人员应当了解数据考核的详细过程;在考核方案确定后,还应组织对数据收集人员的培训,详细地解释确立方案中的各个实现细节,确保考核方案的正确实施。此外,数据考核工作是一项十分繁琐而细致的工作,原始数据、统计数据、评价标准、计分方法等都需要考核人员有较好的耐心和数字敏感度。

5数据共享治理

数据共享,能够最大限度地使更多的人利用现有的数据资源,减少重复的数据收集、数据处理等活动,共享劳动成果的利益最大化。数据共享在不同学科领域内的共享的程度与方式有着不同规范。随着计算机技术的发展与应用需求的改变,数据共享已经成为跨学科、跨机构、跨越国家社会界限的重要措施。数据的收集和管理过程需要耗费大量人力、物力、财力以及时间成本。在提倡构建“资源节约型社会”的今天,数据的共享对国家、研究机构和研究者个人而言具有重要的意义,不仅符合当代资源节约的时代主旋律,而且能最大化利用现存的社会科学数据产生新的研究成果。

数据共享具备了基础设施:云技术的出现,使我们能从十亿数量级的数据中发现其隐藏的价值。云可作为大数据分析的使能器,收集并过虑大量的数据,关联并存儲其有用性,将数据转化为可用的形式,有利于数据用户之间相互协作、共享。通过扶贫云平台的建立,不但能帮助政府提升部门治理能力和办事效率,也有利于全社会广泛高效地利用数据资源创造新的经济社会价值。

6数据治理工作展望

数据治理作为信息化过程中的必经之路,需要长期稳定、持续不懈的推进。国家与政府部门的政策支持和持续的资源投入是获得数据治理成效的重要保障,科研及数据开发人员的不懈努力是数据治理发展的重要动力。

目前,国内依然偏重于技术型的数据治理工作,主要工作还停留在现有业务环节的数据问题等方面,包括现有数据的清理、查重、映射、标准化等内容;而对更深层次的数据治理体系,还未有更多进展。我们应在发展技术的同时,兼顾发展数据治理体系与优秀治理构架策略,不断探索建立数据治理机制的有效方式,切实提升信息化的应用水平,获得持续的核心竞争实力。

猜你喜欢

数据治理扶贫大数据
证监会“扶贫”
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理