APP下载

大数据时代智库的结构化变局

2016-02-11党西民

中共四川省委党校学报 2016年4期
关键词:结构化智库数据库

党西民

(中共中山市委党校,广东中山 528403)

大数据时代智库的结构化变局

党西民

(中共中山市委党校,广东中山 528403)

大数据;智库;数据意识;非结构化数据

在大数据时代传统智库正面临着一场巨大的冲击,新型智库结构正在形成。文献库的传统地位有所动摇,数据库将成为时代新宠。新兴的智库呈现出结构化、半结构化和非结构化相并存的态势。智库之间也将面临着横向、纵向互联互通,打破数据孤岛,传统专家的职业敏感性逐渐让位于数据意识,而民间智库也将在数据的推动下强势崛起,一些新兴数据公司的智库将走向历史前沿。但无论如何,在很长一段时间,大数据和人工结合将成为智库发展的主要方式。

党的十八届三中全会提出加强中国特色新型智库建设,这是中共中央文件首次提出“智库”概念。习近平总书记指出,智库是国家软实力的重要组成部分,要高度重视、积极探索中国特色新型智库的组织形式和管理方式等。2015年1月,中办、国办出台《关于加强中国特色新型智库建设的意见》明确提出:“形成定位明晰、特色鲜明、规模适度、布局合理的中国特色新型智库体系,重点建设一批具有较大影响力和国际知名度的高端智库”。随着改革的深化,经济社会全方位的精细化管理成为刚需,智库在推进国家治理体系和治理能力现代化的过程中将扮演越来越重要的角色。大数据对智库建设提出了挑战,推动着智库的发展,也迎来了智库发展的新格局。

一、智库正在面临着结构性变化

1.智库自身内部信息库更加受到重视

传统的智库拥自身的文献库和信息库。这些信息库是自身研究成果和知识的积累,并且已经以数字化的形式存储下来。这些信息库能够根据当前的研究和决策需要,进行查重等多方面检测,为未来的发展提供准备。这些信息库不仅积累了大量的成功经验,而且积累了大量的教训;不仅汇聚了大量的结果,而且汇聚了决策的制定和执行过程;不仅积累了与自身相关性的内容,而且积累了政策的组织形式和模式……这些信息库对自身的相关性高,适用性强,能够记录组织决策、管理和操作的点点滴滴。通过这些信息库,智库本身能够降低学习成本,提高学习效率,缩短学习曲线,大大提升智库的效率。因为它是以信息内容为主,其管理以文档存储和检索为主。这些信息相对有限,但是这些信息库的实用性更强,价值密度更高。

2.文献库成为决策的重要参考

目前大多数智库对中国知网等一些论文数据库的依赖程度较高,通过文献库搜集资料已经成为常态。由于这类数据库其平台具有强大聚合性,在文献的数量和独家性等方面具有市场支配地位,其数据库的数据的具有丰富、准确、海量的内容,导致了资源的垄断性。文献的垄断性增强了智库对数据库的依赖,常常出现一个问题“在没有知网的情况下,还能不能做研究了?”文献库已经成为资料搜集的有效手段,并成为专家学者必须的研究积累,研究者对其有一种路径依赖。这些文献库具有内容庞大、种类繁多,涵盖领域广的特点,能够提供研究者所需要的各类资讯和观点。这些库主要是以文字的形式记录某一阶段的研究成果,人们在阅读该文献库的时候能够了解目前的研究、实践和应用现状,节约研究时间、提高效率、少走弯路,迅速到达研究前沿。

3.数据库在智库建设中的地位凸显

数据库拥有远远大于信息库的数据,它在智库建设中的地位逐步升高。相比文献库,数据库所拥有的内容具有更大的价值,其内容更加丰富。但是它不再像文献库一样以文字的方式展现思想和观点,而是以文字、图表、图片等方式将思想和智慧展示出来。数据库能够涵盖这个行业或领域中的重要信息和数据,数据库中出现了海量的内容,但都以结构化数据为主,这些内容是可通过机器检索、提取和分析的。“大数据智库掌握的数据资源不能仅局限于传统的文献库,还应涉及政务数据库、商务数据库、民调数据库、舆情数据库、监测数据库等。这些大数据可能源自互联网,也可能源自局域网或相关信息化系统。”[1]这些数据库属于结构性数据库,由于其结构性强,其价值的提取难度不高,能迅速产生较高的价值。有些数据库是垂直性的行业数据,有些是综合性的数据。虽然数字库的价值密度不及文献库,但是在大数据时代,由于数据库拥有海量的结构化数据,其在智库建设中的作用会逐渐凸显。

4.非结构化数据库的兴起

随着大数据的兴起,非结构化数据逐渐走上了历史舞台。在小数据时代,由于挖掘、搜集、存储和分析技术的限制,拥有非结构化数据并产生价值根本不可想象。但当数据技术的能力增强之后,非结构化数据逐渐产生重要的价值,其价值呈现出溢出效应,即数据的正外部性呈现出海量的增长。成为智库所需要的内容。传统智库内部的信息库,甚至其外部的数据库远远不能满足需要。现代智库需要面临的是海量的半结构化和非结构化的数据,常见的作法是转换为结构化数据后再进行挖掘和分析。但是这种方法对于没有强大的技术支持的智库来讲是天方夜谭。这些非结构化数据是价值密度更低,但是价值更大的内容。

所以,当代智库所需要的信息结构呈现出文献库、数据库和大数据并存的现象。其内容呈现出结构化、半结构化和非结构化相并存的态势。

二、搭建互联互通的智库结构成为必然

1.智库之间的互联互通

目前,各种智库虽然拥有大量的内容,但是存在着内容庞杂难以提纯,智库投入过多产出过少,相互复制和低端重复模仿严重而创新不够等问题。主要原因体现在以下几个方面:

其一,各种智库之间的内容无法互联互通,无法共享。在纵向上,从国家、省、市、县的智库的信息没有实现充分的对接;横向上,不同地域的智库缺乏相应的沟通和对接;相关领域上,不同领域都有自己的智库,而这些智库之间缺乏常态化的对接。导致有些失败的经验难以被汲取,成功的经验宣传不足,一个地方搞了一次,另外一个地方也要重新论证和重新研究,导致资源产生极大浪费。其二,党政部门和智库之间缺乏必要的联通,导致大量的智库资源闲置。党委政府每年都有大量而繁重的改革任务,但是其需求没有得到有效释放,民间智库等体制外智库缺乏对党委政府工作重点的把握,难以被党委和政府的焦点所激活,造成资源的浪费。“当前不少智库缺乏对社情民意的了解,缺乏对政策的掌握,研究成果与实践有脱节,与党委政府工作衔接不够,这就削弱了智库对决策的影响力与作用力!”[2]其三,由于没有充分的沟通,智库一方面会产生大量不相关的决策信息,另一方面出现了决策信息堰塞湖。智库的生产与需求产生鸿沟,同时却浪费大量的人力物力,智库的供给和党委政府的需求呈现出结构性供不应求的态势。智库的信息建设首先需要形成省市县的纵向共享格局,将优秀的智库结晶在上下级之间形成互动。其次,形成不同地域之间的共享格局,形成横向的智慧互联互通。再次,发挥体制外智库的优势,构建内外联动、互为补充、供需平衡的信息格局。

2.以平台整合各种资源

大数据的典型思维是共享和开放,通过平台建设达到协同化。通过平台达到信息的互联互通,有效促进资源流动。由于平台的建设,传统智库的封闭性也受到冲击。并因为数字化能力的不断增强,虚拟智库迎来了发展机遇。“它运用一个开放的技术平台取代了封闭的组织结构,这从根本上突破了实体智库的组织边界,也就克服了传统智库的功能局”[3]。由于互联网的广泛使用,许多企业和组织利用互联网无所不在、无时不在的特性,打破组织的界限,使用外脑来完善决策、提升工作。“把智库产品供给方和需求方连接起来,可以通过新型智库互联网+研究平台,联系到有关智库,进行相关的政策咨询以及双向对接;双方在智库网络平台上对接后,买方可以对卖方的政策咨询服务进行评估,反过来卖方也可以对买方的政策咨询购买行为进行评估。”[4]平台的作用在于将多种元素聚集起来,让决策资源能够有效地流动起来。例如,海尔建成了自身的开放创新平台,将自身的员工创意资源整合起来,以各项机制促进自身员工智力资源价值的实现;另外也通过征求全球的用户需求资源,汇聚全球设计资源,将两者汇聚起来,获得最佳解决方案。通过这样的平台,两年内收集了12万条用户需求和创意。将拥有大量的外部研发人员,这些人员推动了企业的变革。

3.非专业智库资源的崛起

社会中存在着大量的非专业人士,这些人才成为智库必要的补充。我国智库发展还处在初级阶段,其一方面表现为“有库没智”的现象,即建设好的智库其智力资源有限,另一方面呈现出“有智没库”的现状,即流逸在体制之外的智力资源没有得到有效利用。这些流逸在体制之外的智力资源,他们往往对某一问题感兴趣,并有长期持续的关注和研究。互联网是一个庞大的平台,能将人的“认知盈余”[5]都聚集起来,形成巨大的时间、聚合了庞大的精力,能够形成巨大的思想和价值,成就一番伟业。大数据技术的兴起,导致权力结构的变化,即民众的权力逐渐上升,传统智库本身权力结构受到冲击。“在大数据所自然呈现的规律性认识面前……任何一位有数字操控能力的普通公民都可以对事物发展的基本规律进行自我解读,但在这些个体式解读的背后起支配作用的却是数字技术和数字信息”[6]。这些数字化技术提供了非专业智库参与项目建设的可能,“电子智库使得公共问题研究项目由传统的外包给少数智库学者转变为众包给所有对这一项目感兴趣的学者和业余爱好者……电子智库使政府委托的研究项目由传统的外包模式转变为众包模式,众包模式是一种突破组织边界、最大化地吸纳智力资源的超级外包,它突破了传统外包模式的治理资源封锁性、研究的封闭性等弊端”[7]。

业余爱好者成为智库的一部分,对于推动发展起到一定的作用。他们能够对公共问题提供智力支持,这些群体常被人们戏称为“高手在民间”。以前,这些群体成为专业智库的有效补充,而现在这些群体正在以更加专业的身份出现在智库的前台,成为新时期智库的有效组成部分。

三、大数据库对传统智库的冲击和重构

1.知识:从垄断到接入能力

由于专业分工越来越细密,专业知识发展成为一个庞大的知识系统,而要成为一个专家则需要经年累月的专业训练和积累。专家的地位依赖于其对知识的垄断,从而形成宽阔的视野和高超的智慧。智库之间的差别主要体现在对知识的占有量,研究的深入度和落地能力上。而在信息爆炸的今天,智库之间的差别体现在信息鸿沟上。专家的知识垄断地位被剥蚀,走向知识的分析和整理者,对信息的获取能力造成了智库能力的差距。在智库建设中,对信息库的接入程度、接入数量、开放态度等在很大程度上决定了智库的发展能力。在大数据时代智库的数据化能力本身也拉开了差距,其数据化能力越强,在发展中的竞争优势越大。以前对外文的阅读能力成为阻碍中国智库走向世界的绝对障碍,但是数据技术使语言的障碍变成过去式,各种翻译软件轻易将大量文献翻译成实用的本国语言,降低了信息的接入难度。

2.职业:从职业敏感性到数据意识

传统专家要在某一行业从业很长时间,积累足够的知识、丰富的经验,形成严谨的态度和较高的职业敏感性。职业敏感性成就专家的核心竞争力,也成为智库的核心资源。伴随着社会科学的迅速发展,资料越来越多,甚至膨胀成海量的文献、资料、数据。这严重挑战着专家的能力。传统记者要具有新闻敏感性,能敏锐地感知事物的新变动,迅速、准确的判断各种新闻线索的价值,准确地分析、判断报道方向。然而以数据为核心的软件narrative science则根据已有的数据库,通过数据算法形成写作模式,在60秒钟之内写出一篇优秀的新闻稿件。稿件不仅高潮跌宕起伏,故事性可读性强,还会精准的配上一张插图。数据分析对专家的挑战,首先体现在通过数据来说明问题,质化研究向量化研究转变,数据意识逐渐成为行业专家的重要参考。其次,对数据的占有逐渐从传统的抽样统计法转向海量数据统计法,数据公司拥有强大的数据挖掘能力,智库对数据的依赖越来越强。其次,数据分析能力在智库建设中的地位越来越凸显,通过数据分析实现决策科学民主决策成为发展趋势。

3.决策:从研究向数据决策转变

大数据的重要价值在于能够迅速整合各种数据,并对数据展开各种向度的分析,形成对现象客观可靠的分析。能够将机器语言转化为人工可以理解的语言,并以可视化的方式展现出来。这大大节省了传统智库对资料采集、调查研究甚至是文献分析的时间,并为传统智库提供了更为精准的参考数据。

大数据给智库带来了全面的冲击,首先,体现在于提供了大量的数据,提高了效率。大数据搜集的数据“有利于提高竞争情报的真实性,有利于提高竞争情报的精准性,有利于提高竞争情报的实时性,使得企业积累了大量的数据,再次,智库利用大数据中即时传播的各类信息和数据为智库迅速处理分析数据挖掘中真实可靠的价值信息提供政策咨询的时效性,大大提高了智库的工作效率。”[8]其次,借助于大数据,能够实现预测,提高决策接受实践检验的能力。“智库借助大数据技术的强大功能能据数据信息预测可能会发生的事件或者可能存在的弊端。智库人员获取相关数据之后对数据进行分析处理,得到相关的重要信息,最后将数据信息转换成重要的价值和决策方案。”[9]再次,大数据在执行过程中的数据挖掘能够纠正失误提高可行性。有许多党委政府的决策出现了正确决策,但是在实践过程中出现了与现实的不协调性,通过大数据预测,能够提早发现智库建议的优缺点,尽可能早调整、尽快适应现实。

4.数据部门:大数据时代智库的新宠

大数据的兴起有赖于大数据公司的推动。目前,全国诞生了许多新型的以数据为核心价值的智库,如百度研究院、阿里研究院等。这些研究机构是大型公司的组成部分,他们本身是公司的方针政策的参谋机构。这些机构不但掌握着公司的核心机密和核心竞争力,能够借助于公司本身的数据分析能力,以及长期的技术积累、数据挖掘和分析能力,通过数据算法,实现自身研究价值。另外,一些国家机关和团体也在研究其相关数据,组成了自身的数据智库。例如中国互联网信息中心等,这些机关能够借助于内部的结构化数据,采用部分非结构化数据,来实现其智库价值。在大数据时代,这些智库具备其它智库所不具备的优势:有丰富的数据,能够依据数据展开较为全面的分析,并做出合乎现实的判断。这些智库机构的数据一方面是本公司的结构化数据,另一方面具有强大的挖掘和分析能力,能够整合社会上的非结构化数据,掌握非结构化数据,并将之转化为有价值的信息。这些智库在大数据时代的竞争优势,正在取代传统智库的地位。另外,这些智库的数据也有溢出效应,也能为社会提供相应的数据,成为社会各个行业所必须的数据。

5.未来:数据和人工结合成为趋势

大数据所构建的智库也需要专家智库的合作,从而提升其科学水平。大数据公司“阿里巴巴今天缺的不是工程师,不是服务人员,不是产品经理,缺经济学家、心理学家、社会学家、人类学家,我们没有经验做政策。”[10]阿里巴巴具有数据存储和计算优势,但是这些优势并不能完全起到计算的精确性和科学性,计算科学的科学性和合理性需要传统专家的设计。而当代处于大数据发展的初期,在算法设计的过程中缺乏专家系统的支持。首先,智库建设拥有大量的专家,这是值得珍惜的思想资源,它为数据库建设累积了大量的专业资源。其次,专家的思想和知识成为数据计算维度之一。大数据的分析功能是其核心价值,而这些分析需要通过多种维度进行交叉整合,然后做出最后的分析结果。“很多研究中利用传统专家知识最精准的方法是把专家评估作为统计计算程序的一个辅助因素”[11]。另外,在数据计算中,大数据的算法需要大量合理的预估,引用专家的评估,将有助于提高计算能力。此外,大数据分析并不是一蹴而就,它需要从试错中不断更新,甚至有许多错误,大数据需要根据目前现状不断更新、优化、提升,从而成为大数据运算和分析的重要手段。再之,大数据有助于提高智库建议的科学性。“如果有统计预测的结果做参考,传统专家能够做出准确的建议”[12]。由于海量内容和参考的出现,为专家提供了大量的可供选择的路径,提高专家的能力,防止专家盲点的出现。总之,大数据虽然对传统智库产生了巨大的冲击,但是未来它和智库之间还会形成长期并存,相互适应,达到最佳的合作状态。

在未来,大数据将对传统智库的形式、结构和思维方式产生巨大的冲突,顺势应变成为大数据时代智库建设的重要方式。

[1]王宁江.大数据智库.浙江经济,2016(4).

[2]张述存.关于加强地方新型智库建设的几点思考.东岳论丛,2015(9).

[3]张云昊.从实体智库到电子智库:虚拟智库的提出及建构.中国科技论坛,2012(6).

[4]唐德淼.大数据背景下互联网 +新型智库平台定位与构建.南方论坛,2016(4).

[5]克莱·舍基在其巨著《认知盈余》中提到认知盈余这一概念。如果我们将每个人的自由时间看成一个集合体,一种认知盈余,那么,这种盈余会有多大?我们已经忘记了我们的自由时间始终属于我们自己,我们可以凭自己的意愿来消费它们,创造它们和分享它们,我们可以通过积累将平庸变成卓越。

[6]郧彦辉.数字利维坦:信息社会的新型危机.中共中央党校学报,2015(3).

[7]张云昊.从实体智库到虚拟智库:电子智库的提出及其建构,中国科技论坛,2012(6):60.

[8]吴金红、张飞、鞠秀芳.大数据:企业竞争情报的机遇、挑战及对策研究.

[9]陈开敏.大数据技术助推贵州智库转型升级,管理观察,2014 (9):178.

[10]马云在2012年全国电商年会上的演讲.

[11][美]伊恩·艾瑞斯.大数据思维与决策.宫相真译,人民邮电出版社,116.

[12][美]伊恩·艾瑞斯.大数据思维与决策.宫相真译,人民邮电出版社,115.

(责任编辑:白 林)

D035

A

1008-5955(2016)04-0032-04

2016-10-27

广东省委党校系统课题《大数据规划与广东发展路径研究》编号:16GL106;中山市哲学社会科学课题《国家大数据规划下的中山发展路径研究》,编号:青201601。

党西民(1977-),男(汉),陕西渭南人,中山市委党校副教授,博士后,研究方向:新媒体和大数据。

猜你喜欢

结构化智库数据库
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
数据库
微智库
微智库
数据库
数据库
数据库