大数据赋能新时代智库建设的问题与对策
2022-12-31王建红祁斌斌
王建红,祁斌斌
(华北电力大学 大数据与哲学社会科学实验室, 河北 保定,071003)
智库是现代社会发展的“思想工厂”,它的建设发展受到国家的高度重视。2014年,习近平总书记在中央全面深化改革领导小组第六次会议上指出:“改革发展任务越是艰巨繁重,越需要强大的智力支持”[1],2015年中共中央办公厅、国务院办公厅印发《关于加强中国特色新型智库建设的意见》,十九大报告提出“加强中国特色新型智库建设”,这一系列相关指示和文件都充分体现出国家对新时期智库建设的高度重视。面对百年未有之大变局以及日益复杂的国内外社会发展新风险、新挑战,智库承担着提供高质量思想产品的重任。另一方面,大数据技术已经日益成熟,利用大数据技术进行信息获取、调查分析和研判预测已成为很多行业和领域的日常。智库借助大数据可以开展触及范围更广、视野更开阔、研究周期更短、时效性前沿性更强的前瞻性研究,为智库提供全新的数据资源、分析技术和测评方法,助力智库创新研究模式,改进分析工具,从而提升建言咨政的科学水平。大数据理应成为智库研究的有力工具,推进新型智库建设实现重大突破,但迄今为止,鲜见有智库真正以大数据技术、资源和方法等为基础,提出被大众广泛认可的研究报告,大数据赋能智库研究在需求侧、供给侧、社会环境三方面面临着难题。
一、现实问题
(一) 需求侧问题
数据和信息是智库开展研究的基础,大数据能够为智库提供精准的数据来源,为新型智库提供技术支撑,为智库建设提供科学的研究工具,助力监测社会舆情、预判政策后果、监测政策执行成效,对诸如发展安全、生态保护、人口健康等较复杂的难题的治理,通过大数据都可以找到答案。
但具有极大优势的大数据在赋能新时代智库建设的过程中并没有引起足够的重视,优势停留于理论层面,实际应用依然存在需求侧难题。表现在智库缺乏利用大数据进行新型智库建设与研究的意识,以及利用大数据进行新型智库建设的能力不足。我国政府早在2015年即印发了《促进大数据发展行动纲要》,以推动大数据的发展,习近平总书记更是多次在不同场合提到大数据。政府对大数据的应用非常重视,相关政策利好不断释放,民众和社会的需求也非常迫切,人们社会活动产生的大量数据也有待于去应用,找出解决日益复杂的经济社会问题的有效方案。但除去大数据在工商业的应用有其内在需求,发展较快之外,其在国家治理和经济社会问题中的应用却一直不尽如人意。其中的关键问题之一即是,在政府、研究者和社会大众都很重视大数据价值的情况下,大数据决策应用的有效需求尚有待挖掘。
至今为止,大数据应用于决策咨询,对于政策供给方和政策需求方都只是“备胎”,只有双方形成良性互动,才有可能形成切实的大数据决策需求。习近平总书记说,“要加强决策部门同智库的信息共享和互动交流,把党政部门政策研究同智库对策研究紧密结合起来,引导和推动智库建设健康发展、更好发挥作用。”[2]智库研究者需要提供切实有效的研究报告,从而得到政策部门和大众的认可,而政府的决策人员也需要有意识地改变传统的决策模式,在决策前尽量要求智库方从大数据角度展开研究。如果决策者不在意大数据研究报告,尚不能熟练掌握大数据研究的智库人员自然更倾向于用传统方式提供政策建议。只有决策者和政策研究人员形成良性互动,出现一些用大数据支撑决策并取得良好社会效益的成功案例,大数据赋能智库发展的社会效应才会真正形成。社会公众才会慢慢理解并接受大数据应用的社会价值,从而推动整个社会增强合法利用大数据的需求。
(二) 供给侧问题
根据《全球智库报告》的数据显示,2008年我国的智库有74家,2009年激增至428家,2020年为1413家,位列世界第二。由此可见,我国已然成为了智库大国,但“大”并不意味着“强”。不足与劣势主要体现在智库建设出现泛化,如不具备智库建设资质的机构也摇身一变成为智库。此外,与国际一流智库相比,我国智库创新能力与全球视野有待进一步提升,智库建设跟不上社会大形势的发展、具有国际影响力的智库较少等。所以对我国而言,建设具备前沿化、技术化、高端化、研究新问题、提出新方法的新型智库迫在眉睫。传统的智库研究范式是理论驱动型,新型智库的建设应该是数据驱动型,采用定量分析与定性分析结合的方法,而大数据就是助力新型智库建设的有力工具,由智库大国向智库强国转变需要大数据赋能。
智库要提升大数据研究与应用能力,必须首先解决大数据人才供给短缺问题。智库能否做好大数据研究,提出有力的报告,根本上取决于智库有没有相应的大数据人才,这就需要大力培育能够胜任大数据研究的人才队伍。目前大数据赋能智库建设人才队伍方面存在的主要问题有:第一,大数据是一个新兴学科领域,大数据人才作为更高层次的复合型人才,需要掌握机器学习、数理统计、语言处理、情感分析等多方面的知识,而当前的大数据技术人员多是从计算机相关学科转行而来,现实中能够胜任具体大数据工作的人才整体缺乏,少数先行者多被工商业界的强大需求吸引,智库中的理论研究者鲜有熟练掌握大数据技术的人员,社会整体上少有可以胜任大数据研究的智库人才。根据清华大学经管学院2017年11月发布的《中国经济的数字化转型:人才与就业》报告显示,到2025年我国大数据领域人才缺口将达到200万。第二,大数据是一个需要多学科交叉融合的研究领域。真正的交叉融合不是简单的合作,需要有人既懂大数据技术,又懂所要研究领域的专业知识,同时还能知道二者融合的关键点。智库开展的大数据研究相比其他行业领域更加需要切实有效性,真正有价值的智库研究需要落地执行,不能止步于理论探索,所以更加需要做好大数据技术与所要解决的经济社会问题的交叉融合。在大数据人才本就不足的情况下,缺乏具备良好的大数据和经济社会问题交叉研究能力的人才,智库所需要的大数据交叉研究将很难成功。第三,大数据技术在工商业中的应用已经出现了很多经典案例,但将大数据应用于社会问题的研究,从而为政府或其他对象提供决策服务的成功案例仍然不足且不成熟。除去社会问题研究的复杂性之外,主要的原因即在于当前智库大多脱胎于由政府和高校从业人员组成的相关研究机构,其成员的学科背景和知识储备一般都与大数据相去较远,对大数据技术及其应用方法的掌握相对不足,大数据研究能力相对缺乏。只有提升了大数据研究能力,才能找准大数据问题,用对大数据研究范式,“当复杂数据和政府决策相结合时,才能更好地满足决策者理想得到的具体政策,”[3]也才能最终成功完成基于大数据的智库报告。
大数据赋能的智库研究,数据分析方法要从偏重解释事物之间的因果关系转变到相关性分析中,用全新的研究视角梳理和总结事物之间的关联,通过建立数据模型,提高智库研究的准确性、科学性。随着大数据时代的全面到来,只有拥有较强大数据研究能力的智库,才能很好地利用大数据抓准时代脉搏,找准问题根源,掌握问题全貌,提出更符合实际和时代要求的政策建议和智库报告,从而在智库竞争中脱颖而出,更好地服务于国家和社会,而要将大数据赋能智库建设的潜在优势发挥出来,还需努力改善技术和人才供给存在的不足。当前一些高校纷纷开设大数据相关专业的课程,以满足市场上对大数据人才的需求。但是复合型人才培养周期长,难度大,高校开设大数据专业课程并不一定代表着智库研究所需大数据人才的快速补充。从专业开设到人才成熟需要时间和实践,从大数据人才到智库所需的大数据复合型人才更需要时间,智库在短时间内依然会难以招到需要的人才,人才队伍难题仍将持续一段时间。
(三) 环境问题
1. 法治环境
对于如何利用大数据,无论政府还是个人仍然还有很多的疑虑,整体上采取谨慎策略,很多关键性数据仍被限制使用或在合理使用时受阻。一方面,个人信息相关数据受到的保护日益加强。2020年《民法典》、《个人信息保护法(草案)》相继颁布,其中《民法典》第一千零三十二条至一千零三十九条就隐私权和个人信息保护各方权责作了说明和规定,《个人信息保护法(草案)》则更加细致的确立了以“告知—同意”为核心的个人信息处理系列法规。 另一方面,我国当前的数据保护法规仍然有待健全,数据保护漏洞依然存在,对普通百姓造成的隐私信息泄露危害仍有发生,同时,一些社会发展必要的基础数据却受到“过度保护”,成为“数据孤岛”。整体来看,由于法律法规不健全,为求安全与可靠,大部分人对大数据应用依然敬而远之,正确看待大数据应用的社会共识还没有真正形成。
2. 理论环境
将大数据资源、方法应用于科学研究本质上是一种“范式革命”,只不过这一革命至今尚未全面展开,仍处于革命的酝酿期。不仅是科学,任何事物的发展都遵循周期性发展模式,随着时间的推移,新范式取代旧范式,从而进入新的常规科学时期,新常规科学在被使用一段时间后也会出现危机,又会引起新的科学革命,如此不断循环,不断前进。这种曲折前进的发展状态符合科学发展的演变趋势,也符合马克思主义的辩证法。新事物迟早会代替旧事物,只是这种代替不是一蹴而就的,需要经历由量变到质变的较长时期。
大数据的研究范式无论是在自然科学领域还是在社会科学领域都尚未达到成熟,但这并不意味着大数据研究的基本范式毫无章法可循。大数据是一个外延广大的范畴,基于大数据的研究范式已经可以很明显地在不同层次划分出一些基本类型,比如:哲学社会科学领域的大数据研究范式不同于自然科学领域;在社会科学领域内部又存在着文本大数据研究范式与行为大数据研究范式的区别;在文本大数据研究范式内部又包含着文献文本大数据和网络文本大数据的区别。具体到不同层次不同类型的大数据应用上,应该采用不同的大数据技术、工具模型和参照范例,亦即存在更加细分的研究范式的差异。这些技术、模型和范例当然还需要进一步探索和完善,但应用大数据的智库人员作为参与其中的“范式革命者”,应该有意识地对不同的分析范式进行细分,并善加选择,以“范式革命”精神开展创新性研究。
在科学研究范式本身发展以及外部环境的推动下,“基于大数据的范式革命到来是一种必然。”[4]“信息爆炸”已经对经验科学、理论科学、计算机模拟科学形成了强大的冲击,传统的范式已基本不适用于海量数据的研究。当前很多学科的基本理论问题研究,已经越来越依赖于大量数据的收集、处理、存储、分析、可视化等大数据方法。“范式革命”正在酝酿,研究方法将发生革命性的变化,但任何新事物的诞生都不是一帆风顺,旧范式的支持者仍然对新范式抱有很多质疑,有些质疑有待大数据研究通过完善自身加以解决,有些质疑也难免来自于偏见,很难通过理论自身的进步得以消除。
3. 数据共享环境
数据共享是应用大数据的前提。对企事业单位来说,数据是一种资产,在没有充分的安全保障前提下,不会轻易共享数据,并且随着数据伦理的倡议以及隐私保护、道德层面的要求日益受到重视,便出现不愿共享、不敢共享、不能共享的情况。首先,政务数据往往被看作是一种部门资产和资源,拥有和使用政务数据则被看做一种“权力”,数据整合后“部门数据”的特征不再明显,这对于数据拥有部门来说是意味着地位的下降,于是在推进数据整合共享过程中敷衍了事,态度消极;此外政府部门担心数据整合共享后会有管理边界不清晰、责任区分不明确问题,[5]从而给本部门自身工作带来一些不必要的麻烦,甚至影响本部门日常工作,于是出现不愿共享的情况。其次,数据是政府工作绩效最直接的反应,会有一些政府部门担心数据共享后会暴露出本部门工作开展中存在的一些问题,为避免自身受到重点监督或者被问责,会对数据整合产生抵触心理,不敢共享。数据共享推进速度缓慢会有基于网络安全的考虑以及整合技术方面的限制,同时,在政府部门间的整合还涉及体制机制的问题,不可否认当前数据整合共享制度并不完善,这就导致有些数据最后不能实现共享。
二、问题根源分析
(一) 技术难题
1. 技术复杂性难题
现阶段,大数据在医学、金融、教育、交通、营销、服务等领域已初步得到应用,但全行业普及应用的热潮还并未形成,存在的技术基础难题影响着全行业全面接入的进程。大数据超越了传统数据规模之“量”的限制,但在数据之“杂”上仍然受限,需要大量人为“清洗”、“降噪”和“标注”等处理,习惯于传统研究模式的智库短时间内很难应用此技术开展研究。另外,短时间熟练掌握大数据技术有一定难度。“大数据是人工智能的基础,要利用大数据技术就离不开机器学习(Machine Learning),”[6]而机器学习中,计算机排除故障(DEBUG)候选错误空间大、调试周期长,且调试结果具有不确定性。虽然目前关于机器学习已经有大量的教程、文章、开源的代码,但没有经过全面专业的机器学习,实际应用大数据开展各项工作时,依然会遇到非常大的阻碍。
2. 技术适用性难题
大数据相关专业的学习解决的是“会不会用”的问题,除此之外,还要学习“如何用”。大数据目前的发展水平,还不能完全取代传统的数据收集方法,一般是作为传统数据收集方法的补充。另外在现实生活中我们面对的很多问题在本质上并非大数据问题,这些问题本身并不需要用到大数据技术,因此我们需避免大数据自大、过度拟合等问题的发生。如果我们在不适合使用大数据技术的问题上泛泛地使用大数据,不但得不出好的结果,影响自身对大数据应用的信心,还会连带影响社会大众对大数据应用的接受态度。
技术是人开发并用来服务于人的,任何技术其本身无所谓好坏,围绕大数据技术使用出现的一系列问题由技术主体引起,是技术的使用者在运用技术的过程中出现了偏差,把不同性质的问题用同一方式解决,结果必然存在差错。如果我们对所要解决的问题性质有清晰的了解,用对方法,就可以规避这类现象的发生。
(二) 学科交叉难题
新型智库建设需要一定数量既懂大数据又懂理论研究的复合型人才,而大数据人才培养近两三年才在我国高校逐渐展开,大数据人才尚且缺乏,既熟悉理论研究又懂大数据技术的复合型人才更是匮乏。除人才培养周期问题外,交叉学科建设本身也存在一些难题。交叉学科是不同学科之间相互交叉融合、渗透而出现的新型学科,目前交叉学科还处于发展初期,相关研究成果还比较少,学科影响力小,社会有强烈的交叉学科人才需求,但高校交叉学科建设面临着学科专业设置不合理、对交叉学科研究的认识不足、观念陈旧、合作意识不强、学科交叉型师资不足、科研资源缺乏和保障系统不完善等亟待解决的实际困难。
(三) 治理模式难题
数字化社会治理模式在交通、城管、卫健诸多领域能够大大提升服务能力和效率,但社会治理与技术赋能之间存在复杂的互动关系。首先,一些人错误地认为“大数据时代决策权已成为技术精英的专属”[7],容易出现“精英治理”、“唯数据论”等不良局面使民主决策的本质难以充分发挥,悖离“以人为本”的价值理念,这些误解在一定程度上阻碍了大数据在社会治理转型中发挥其应有作用。
此外,“传统治理模式曾在几十年内保证了国内经济的高速增长、公共事业的快速发展以及社会的总体稳定”[8],加之“大数据治理”理念还处在形成的初期,人们不善用或无意识使用数据赋能社会治理,依然对传统的治理模式存在制度上的“路径依赖“和实践上的行为惯性。
三、对策建议
(一) 突破大数据应用的“最后一公里”障碍
对大数据技术知之甚少是导致技术滥用的最主要原因,对待任何技术我们正确的态度应该是“善用”而不是“技术绑架”,技术使用者要努力提高自己的认知水平与实践、技术操作能力,正确区分问题的性质与属性,在发挥大数据作用助力问题解决的同时,还要注意技术应用的合理性,正确认知技术过渡期,通过批判继承旧技术来认识新技术、使用新技术。大数据在工商业界的应用比较成熟,但是将大数据应用在智库中的场景与工商业中的应用场景存在着差异,智库建设中的大数据应用难题还没有得到完全的解决。同时,针对目前大数据自身技术方面还存在的“数据清洗”、“数据降噪”、“机器学习”等运用性难题,下一步相关领域还应继续加强这些方面的研究,努力将大数据技术最大限度的普适化,降低操作运用难度,使得大数据技术基础较差的使用者可以不经过系统完整的专业培训,实现满足自我需要的数据获取与快速精准分类,扫除数据应用“最后一公里” 障碍。
(二) 鼓励大数据学科交叉的探索与应用
多学科交叉融合发展是学科建设的必然趋势,国外有影响力的智库一般都具有跨学科研究的特征。交叉研究对我国新型智库建设具有重要的启示,我国智库建设也必须重视加强学科交叉的探索与应用。探索交叉学科建设与人才培养,高校应成为先行者,高校可以依据学校的专业设置情况,制定交叉学科人才培养组织架构,学院与学院之间展开合作,依托不同学院的教学专长,设置通识教学课程等,将学科交叉发展理念首先体现在课程设置上,主动寻求与数据关联企业、具有创新意识的传统企业等展开合作,给学生创造更多的实习机会,为我国培养出更多的交叉研究型人才。同时要努力克服学科建设中存在的师资不足、交叉研究意识不强等问题,通过加大宣传、产出高价值研究成果等,努力改变社会各界对交叉研究的认知,鼓励交叉研究在教学、智库研究中的应用,增强学科影响力。
(三) 加大大数据交叉与应用人才培养力度
随着经济社会发展,全国各地对大数据、物联网、人工智能以及智慧城市建设人才需求越来越大。因此,加快培养大数据等新兴领域的专业复合型人才,打造既懂理论又懂实操的大数据、物联网、人工智能以及智慧城市人才队伍已迫在眉睫。为了不使我国在大数据时代的国际竞争中落伍,从中央到地方都必须重视对大数据人才的培养,完善基础、设置岗位,在培养人才的基础上也要创造条件留住人才,同时也要积极面向全球广络精英,为智库建设扫除人才短缺困境。
(四) 加强顶层设计和相关法规建设
大数据战略的全面展开需要国家持续加强顶层设计,审时度势,精心谋划,超前布局,力争主动。大数据战略要精心谋划,优化战略规划,制定层级发展目标以明确方向和重点;要加强大数据共享平台和安全保障体系建设,扫除制度障碍尽快形成共享服务体系;要建立和完善大数据安全应急机制,降低大数据风险;要推动大数据与企业、政府、社会组织的融合,实施融合发展战略,构建大数据产业生态体系。大数据应用得到了社会的普遍接受和认可,大数据赋能智库建设的社会基础才能真正形成。
同时,现阶段我国关于大数据应用、大数据权益保护、数据共享、数据流通方面的法规和管理机制仍不健全,依然要加强研究完善保护个人数据隐私和数据权益的专门法案,维护大数据技术应用以及合理使用数据的良好社会氛围。数据价值在于共享,要对数据的共享、流通有明晰的法律规范,为智库使用数据开展研究提供法律保障,消除智库对数据使用合理性的担忧和现实障碍。
(五) 提升政府相关部门人员的大数据素养
数据要发挥价值就要打破“数据孤岛”现象,促进数据资源交互与共享,从而为智库研究提供大数据支持,方法上除了要完善制度建设,消除数据共享的后顾之忧外,须进一步提升政府相关部门人员的大数据素养。在制度规范的前提下,推动政府相关部门人员充分学好用好大数据技术,强化政务公开和政府透明度,加快建设数据中台和大数据服务平台,推动数据资源交互与共享。在此基础上,智库充分利用丰富的数据资源,结合大数据、云计算、物联网、人工智能等技术,构建面向复杂公共决策领域的智能模拟与仿真模型,完善公共决策的战略设计、风险预警、政策评估等步骤,探索大数据智能决策体系,借鉴国内外先进经验,推动决策流程再造。同时,政府相关部门人员的大数据素养提升后,也有助于大数据技术在政府部门的推广使用。只有了解了大数据的优势并具有一定的操作能力,政府工作人员才会乐意使用大数据技术完成纷繁复杂的工作和辅助决策,才会利用大数据进行社会治理。
此外,国外智库成立时间早,在利用大数据赋能智库建设方面比我国也更有经验,我们也要学习借鉴国际知名智库的成功经验,不断创新智库研究范式,顺应大数据发展的趋势,建立基于大数据的决策咨询系统,着力提升数据供给和服务决策的能力。