大数据时代下“一带一路”决策系统的构建
2015-09-10陆钢
陆钢
“一带一路”始于大数据时代
我们生活在一个伟大的时代:一方面是以信息技术为核心的科技革命为人类提供了无限发展的可能,使得我们在新技术的装备下可以超越当下的局限而达到更远的目标;另一方面,中国三十多年的和平发展积蓄了巨大的能量,以至于需要带动周边共同发展才能保持中国经济结构的发展平衡,“一带一路”倡议的提出,为亚洲地区共享中国的发展繁荣提供了具体路径。因此,如何在大数据时代下构建完善的“一带一路”决策系统,成为当下急需思考的重大问题。
大数据时代是信息社会发展的高级阶段,它是指人类处理数据的能力已经突破常规数量级,达到了前所未有的巨额数量级,大数据时代计算机处理的数据单位普遍在拍字节甚或艾字节。[1]尤其是那些超级网络企业如谷歌、IBM、微软、淘宝、百度和腾讯等,它们的服务器与网络每天所处理的数据就可能达到模拟时代全球数据的总和。[2]大数据时代是人类技术进步的一次重要飞跃,它对人类社会的思维、工作和学习的变化是空前的。主要发达国家充分认识到大数据时代所带来的重要机遇,纷纷制定大数据战略运用于国家安全保障和国民经济发展,目的在于提高本国在国际社会中的竞争力。是否适应于大数据时代人类思维模式及其工作方法的变革,是衡量中国共产党执政能力的重要指标。
“一带一路”愿景和行动文件是新中国成立以来我国所提出的经济规模最大、地理空间范围最广和涉及领域最多的和平建设倡议。伴随着大量基础设施建设项目,在“一带一路”推进过程中,必然会产生大量的数据。如何面对如此庞大的经济与外交活动数据,如何高效处理和有效利用这些大数据,是摆在中国决策高层面前的一个世纪性课题。毫不夸张地说,“一带一路”倡议最终是否得以落实,主要取决于决策高层及其智库在大数据处理上所表现出来的强大竞争力。通过大数据决策,决策层可以对“一带一路”地区的各种政治经济风险洞若观火,预知沿线国家可能发生的事态变化以及其他突发事件,以便及时地、有针对性地调整具体策略,可以深入地了解“一带一路”沿线国家内部的微观变化,掌握其精英人士、利益集团、宗教部落以及极端主义分子的整体状况与发展动态,从而可以有效化解域内域外各个方面对“一带一路”建设的负面影响与人为干扰。
“一带一路”大数据决策系统的构建
“一带一路”大数据决策系统的表现形态是什么?如何进行构建呢?本文根据目前的技术条件与现实情况,分别从大数据决策调研、决策模拟、决策协调以及决策预警等四个方面进行分析,为建立一个有效运行的“一带一路”大数据决策系统提供基本思路。
一、大数据决策调研
在非数字化时代,数据主要依赖社会调查以及其他传统的数据采集方法。中共的历史传统是非常重视社会调查研究的,毛泽东提出了“没有调查研究就没有发言权”的著名论断。我驻外各使馆设立了调研机构,肩负着调研任务,从而保证中央高层在决策的时候能够获得国外的第一手数据。
但由于条件限制,我驻外使馆及其他驻外机构的调研方法一般采用人工收集文字材料和访谈等传统方法,这种方式在小数据时代和外事体量小的情况下是适用的。然而,在知识爆炸时代,信息呈几何级指数增长,每天都会产生海量数据。再者,作为一个大国,中国几乎与所有的国家和国际组织交往,因而会产生大量的外交数据。如果继续采取传统的人工方法进行调查研究和数据处理,是无法适应当前这个变化迅捷的世界,也难以获得全面的知识与正确的判断,因而可能会造成外交决策的失误,给国家造成不必要的损失。
大数据时代的决策调研在数据采集的规模、广度以及速度方面,都是前所未有的。“一带一路”建设中,大数据调研可以成为决策的基础和前提。例如,工程项目以及金融投资是“一带一路”规划中的基础内容,决策高层对这方面的直接数据需求非常迫切,此外还需要间接数据。因为当高铁、高速公路、港口和信息基础设施投入修建时,会涉及沿线国家的宏观环境和微观环境,中央有关部门在做出有关决策之前需要知道大量的间接数据,包括相关国家的经济发展和政治稳定的状况、相关国家的客货流量以及市场容量。他们还需要掌握沿线地区的治安情况、生活习俗和民族风情。有了大数据这个利器,我们可以更好地在“一带一路”开展公共外交,促进地区的人文交流。
二、大数据决策模拟
决策模拟是决策科学中经常使用的一种技术,就是通过模拟博弈各方的决策环境、博弈各方可能采取的策略以及己方的应手,进而展示整个事件可能产生的各种变化,及时发现自己决策方案中存在的漏洞并予以弥补,从而最大限度地降低风险和成本。
然而在工业社会阶段,决策模拟的技术手段极为有限,主要依靠地图、文字和沙盘。进入计算机时代后,人们开始使用计算机进行各类模拟,计算机仿真技术得到广泛应用。[3]在大数据时代,全世界三年产生的数据已经超过人类有史以来的数据总和。更妙的是,这些数据已经数字化了,可以用于计算机处理。数据形式包括数字、文字、表格、图片和视频。同时计算机的处理能力也是空前增长。因此,大数据决策模拟在技术上完全突破了以前的瓶颈。毫不夸张地说,“一带一路”的大数据决策模拟现在有了可靠的技术保证。
“一带一路”是使用大数据决策模拟的理想领域。一是沿线国家众多,每个国家的经济发展状况各不相同;二是“一带一路”沿线地区的地理状况千姿百态,由此衍生出极为复杂的地缘政治经济格局;三是中国卷入“一带一路”的深度和广度也是前所未有。国内几乎所有的省市、行业和大型国企都跃跃欲试,试图参与到“一带一路”的建设上去。另外,“一带一路”已经成为国际关注的焦点。域外国家尤其是西方发达国家的媒体、智库、企业以及政府或非政府组织高度重视“一带一路”的进展。它们撰写各种新闻报道和研究报告,出台各种针对性的政策和措施。凡此种种,构成了巨大的数据链条,为大数据决策模拟提供了强大的政策需求和丰富的数据资源。
三、大数据决策协调
大数据决策协调是指决策高层通过技术机构的辅助,利用大数据对决策相关的部门、事务和政策进行协调,从而避免由于官僚机构职能叠加和决策对象边界模糊而引起的相互踩脚、决策效能抵消和恶性竞争的现象。
当前国内呈现“一带一路”热,是好事,但需要决策高层通过大数据加以引导和协调。在数据缺乏的年代,决策协调是比较困难的,因为高层无法掌握第一手的数据,其决策判断主要依靠自己的知识储备包括经验和常识以及来自一线的情况报告,而这些信息有可能是片面的和滞后的。在大数据时代,资讯高度发达,数据随处可见。但是,问题仍然没有解决。如果缺乏系统整合,这些数据是碎片化的,无意义化的。决策高层既无时间也无可能接触这些数据进行决策判断。
所以,我们应该对数据进行整合,建立“一带一路”的大数据决策系统,将碎片化的数据镶嵌到系统中去,使之变得有意义和有价值。决策高层就能借助于这个系统统揽全局,对“一带一路”的事务进行全面协调。大数据决策系统在计算机技术的支持下,根据决策需要对数据进行任意组合,既可以叠加构成一个总系统,也可以分离形成各种专题系统;既可以宏观透视预判未来大趋势,知晓沿线国家的政经动态,也可以微观细查洞悉沿线国家某个部落家族的利益纠纷。具体来说,我们可以通过建设“一带一路”云和“一带一路”的地理空间信息系统来实现大数据决策协调。计算机运算速度、存储能力、大数据以及云计算,可为“一带一路”的大数据汇合提供完美的技术配合。而在大数据时代,日趋成熟的地理信息系统将“一带一路”天文般的数据以可视化的形式展示给决策高层和各领域专家,在“一带一路”的虚拟空间里,决策层与专家团队共同推盘,真正实现了大数据的决策协调。正因为通过大数据能够预知“一带一路”的未来风险,能够掌握沿线国家的社会变化以及中国项目进展的细节,决策高层就能协调各方有条不紊地推进“一带一路”建设。
四、大数据决策预警
决策预警是指决策者能预知未来的事态变化尤其是危机事态的来临而做出的一种警告,旨在告知相关机构及个人采取防范措施以免损失。“一带一路”正处于亨廷顿所说的文明冲突地带、文明破碎地带和动荡国家扎堆地带。这里的宗教文明、种族部落和民族国家之间存在较大的差异,发展极为不平衡,因此其矛盾和冲突最为激烈。当前,“一带一路”之箭已在弦上,那么我们就要勇敢面对现实,寻求解决之道。建立“一带一路”的大数据预警系统,可以辅助决策层预先获知“一带一路”地区可能出现的各种风险和变故,使其有充裕的时间应对潜在危机,不至于危机来临之际浑然不知,或者惊慌失措。“一带一路”需要预警的地方很多。例如,国家政权的更替、工程项目合同的变卦、国家性金融危机、自然灾害等。大数据决策预警系统在专家的协助下,结合历史数据和国家正常形态的数据,以建立可以参照的国家健康形态的指标体系。该体系的指标项目根据获取的数据量而定,越详尽越好。下一步则把“一带一路”沿线国家的相关数据输入,与指标体系进行比对,当超过正常阈值,决策预警系统就会发出警报,提醒决策者和专家关注出现的各种问题,以便采取正确的对策。
“一带一路”大数据决策系统的相关问题
“一带一路”大数据决策系统涉及几个关键问题,如果处理不好,就无法正常运行。主要有以下三个问题:数据安全、数据获取和数据处理。
一、数据安全
安全问题始终伴随着计算机信息技术。“棱镜门”事件让人们对信息安全产生了畏惧感。一方面担心信息安全,一方面又不得不使用信息技术。这是摆在政府决策部门面前的一个困境。很多政府决策部门对信息安全采取了非常严格的措施,少数部门索性拒绝使用互联网,通过物理隔离确保信息安全。“一带一路”的决策正好涉及这些敏感的决策部门。大数据决策系统恰好与这些部门的传统工作特点相背离,这正是推行“一带一路”大数据决策系统的一个难题。
笔者的思路是,“一带一路”的大数据决策系统是一个多层级、多板块、可分割和可拆卸的信息系统。首先,它的底层由基础性数据构成。这些数据是公开的、原生态的,又非常庞杂,任何人都可以从网上或线下免费获得,有些数据可以付费获得。就“一带一路”而言,并非所有的数据都需要加密。凡是通过公开渠道获得的数据都不存在信息安全问题。这些数据包括沿线国家社会经济发展的基本统计、主流媒体和社交媒体的公共话题、沿线国家政府企业和机构官方网站的信息以及合法购买的信息资料。大量与“一带一路”相关的资料被聚集在特定的云层里,研究者在这个云端里进行“一带一路”的数据搜索,显然要比普通搜索引擎更有效率,数据的价值密度更高。
其次,该系统的中层则存储着经过一定程度的加工、具有一定价值密度的数据,其中包括研究者之间的沟通和交流,这些数据记录着研究者对“一带一路”问题的探讨过程。另外,系统也存储着智库对“一带一路”的研究成果以及国内外关于“一带一路”的研究资料。与原生态的底层数据相比,经过加工的中层数据体现了研究者以及研究对象之间差异的个性特征。它不再是沿线国家的笼统性数据,而是包含了沿线国家某个地区、某个项目、某个利益集团的相关数据。对于研究人员来说,这些数据专业性更强,对研究帮助更大。可以通过设置登录口令,以授权的形式予以开放。
最后,该系统的上层会涉及某些保密数据,但仍然属于低度安全数据,更多的是涉及个人机构的隐私而不是国家机密。这些数据包括个人和机构的信用等级、通话记录、地理位置信息、网络商店消费记录等。当然可以提高阅读这类数据人员的资格,只有经过严格程序的审批才可以进入系统。对于以上大数据系统的安全维护,目前的安全技术足以承受。另外,可以在“一带一路”大数据决策系统基础上打造另一个小数据系统。这个小系统与互联网物理隔离,只供相关研究者和决策者使用。
二、数据获取
如何低成本、高效率地获取和更新巨量数据,是建设“一带一路”大数据决策系统的一个关键问题。在国内,地方政府和企业实行电子政务和电子商务,因此可以轻易获得大量数据。但“一带一路”数据源基本上在境外,难以获得。因此,“一带一路”的数据基本上要另起炉灶。解决的方案是,一是采用普遍的数据采集方式,通过机器采集方法,从互联网上抓取,或者合法购买各类相关数据库。二是通过市场运作,主动获取数据,即利用“一带一路”项目开发的机会,有意识地建立和经营一批“数据驿站”。这些“数据驿站”设立在沿线国家境内,通过计算机后台将每天生成的数据自动传输到国内,汇入“一带一路”的大数据决策系统。“数据驿站”的形式多种多样,可以是电商、孔子学院、电信、客运,也可以是连锁酒店、金融支付机构和物流机构等。起初,这些原生态数据的价值密度较低,但经过数据专家和“一带一路”专家的处理,在外交决策和企业决策中将发挥重要的作用。
三、数据处理
当数据获取问题解决后,面对汹涌的海量数据如何提取所需的数据,也是令人苦恼的事情。尽管新技术可以提供数据处理的速度,但低质的“垃圾数据”仍然充斥于大数据的海洋中。决策者不仅无法及时获得有用的数据,反而要为维持庞大的数据流支付高昂的云端空间成本和宽带成本。因此,“一带一路”大数据决策系统的数据处理也必须要有快速提炼高质数据的解决方案。首先要有具体分析目标,然后根据目标要求,选择相关性最大的数据,剔除那些相关性低的数据。那些“垃圾数据”其实并未消失,只不过回流大数据库,需要的时候还可以循环利用。其次,数据预处理。分析目标提供了数据处理的边界。我们不需要漫无边际地盲目收集处理大数据,而是围绕分析目标进行数据分析和归类。经过数据预处理,分析的有效性可大为提高。第三,充分发挥小数据的功能。虽然大数据时代强调全体数据、数据混杂性和相关性,但是在“一带一路”大数据决策系统这个特殊平台上,小数据时代那种随机样本、精确性以及追求因果关系的数据处理特性仍需充分考虑。举例来说,虽然起初我们主要收集“一带一路”沿线国家的基本数据,但以后应将这些数据作为分析背景,而重点应该放在个别重要项目和人物上。对这些项目和人物建立数据档案,尽可能收集其完整的数据。[4]
最后还是聚焦于决策小环境。无论大数据决策系统如何神奇,必须要考虑到决策者与大数据决策系统之间的关系。决策者往往肩负重任,工作繁重,不可能在大数据处理上花费很多时间,但他们必须理解关键的数据并能运用。只有被他们所理解的数据,才会在决策中发挥作用。因此需要辅助机构即智库协助决策者筛选有用的决策数据。智库的大数据处理功能一是核实和考证基本数据;二是理清数据的基本逻辑关系;三是排除“黑天鹅”等小概率可能。简言之,“一带一路”的建设工作将逐步数据化和信息化,尽力避免各种低级的人为错误。决策高层将精力集中于机器无法处理的战略性判断和人际关系洞察。在大数据决策系统的辅助下,他们在“一带一路”建设过程中所做的判断和决定将更为全面、到位和精致,从而将各种风险降到最低,实现决策的效益最大化。
(作者系华东师范大学国际问题研究所所长)
(责任编辑:苏童)
————————
[1] 大数据计算单位,依次为吉字节(G)、太字节(T)、拍字节(P)、艾字节(E)、泽字节(Z)等;后一个单位是前一个单位的1024倍。
[2] 2007年,全球所有模拟数据大约有21艾字节。2011年全球数据总量1.8ZB ,每天产生2.8艾字节数据,也就是说8天时间的数据量可以超过人类有史以来模拟数据的总和。参见[英]维克托·迈尔-舍恩伯格肯尼思·库克耶大数据时代,浙江人民出版社,2013年1月,第11-12页;参见张芳曼:“当‘大数据’来敲门”,载《人民日报》,2012年12月24日。
[3] 计算机仿真技术是指利用计算机技术,通过对客观对象的整体或局部属性的建模及动态模仿,逼真地再现事物变化的未来状态。该技术在工业和民用设计中得到广泛应用,如交通安全仿真、汽车设计仿真和教育实验仿真等。
[4] 对特定人物的心理行为方式的模拟研究,正是大数据发挥作用的地方。当特定人物的所有数据汇集并展现在各科专家面前会诊之后,此人的行为及性格特征变得一目了然。