APP下载

基于Stanford TMT的国际智库研究内容挖掘分析

2016-09-28董克程妮邱均平

图书与情报 2016年2期
关键词:研究趋势

董克 程妮 邱均平

摘要:智库研究是当前各学科领域关注的共同热点。文章通过搜集WOS数据库中与智库相关的727篇研究论文,利用Stanford TMT主题模型工具包对研究论文的文本进行了主题挖掘,分析结果表明,当前国际智库研究主要包括智库建设与发展研究、特定领域和问题解决中的智库研究等两大类10个主题;通过本研究的主题挖掘结果,也证明利用StanfordTMT主题模型工具包能够有效挖掘出文献隐含的语义主题,主题模型分析能够对共词分析等文献计量方法进行良好的补充,

关键词:智库研究;研究趋势;内容挖掘;主题模型;Stanford TMT

中图分类号:G250.25 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2016038

1.引言

智库(Think Tank)一词主要出现于19世纪50年代,是研究宣传社会、政治和经济等特定主题的政策、战略的一类组织。智库的建立可以追溯到19世纪早期,如1831年成立的英国皇家联合军种国防研究所等。美国宾夕法尼亚大学发布的《2014全球智库指数报告》指出,截至2014年,全球共有智库6618个,作为一类为政策和决策服务、生产思想和知识的社会组织,智库已经成为整个社会发展中不可或缺的机构,也是各国“软实力”竞争的新焦点。

2015年1月,中共中央、国务院印发了《关于加强中国特色新型智库建设的意见》,我国的智库建设进入快速发展阶段,相关的研究也逐步引起包括图书情报领域在内的各个学科的重视。目前我国拥有的智库在全球已经具有一定的影响力,但智库研究开展时间较短,成果也较少,而国际上的智库研究则积累了相对丰富的研究成果。本文利用斯坦福大学自然语言处理小组开发的Stanford TMT主题模型工具包对国际智库研究论文进行内容挖掘研究,旨在分析国际智库研究的主题结构,揭示当前智库研究的趋势,以期为我国新型智库建设提供相应的理论支持和参考。

2.数据来源与分析方法

2.1数据来源

本研究的数据来源为WOS(Web 0f Science)核心合集,包含SCI、SSCI、A&HCI;、CPCI-SH和CPCI-SSH等5个数据库,检索字段选择为主题,检索式为“think tank*”OR“brain box*”,文献类型为articles、proceedings paper和review,检索时间为2015年11月30日,共获得文献记录727条,进一步抽取记录中的题名、关键词、摘要字段作为主题模型分析对象。

从智库研究论文发表的时间分布(见表1)来看,WOS数据库中最早与智库相关的论文发表于1968年,威斯康辛大学法学家Nieburg在该文中论述了美国保守派智库哈德逊研究所的创始人赫尔曼,卡恩在智库工作方面的得失。但1968-1998这30年间发文量为95篇,仅占到目前为止发文总量的13%左右。进入新世纪以来,智库在美国、加拿大、英国和西欧各国的政策制定中起到越来越重要的作用,与之相呼应的,从2000年左右开始,国际学术界关于智库研究的论文数量也开始出现快速的增长。

2.2分析方法

随着内容分析技术的发展,许多新的方法逐渐被应用于学科主题的发现,LDA(Latent Dirichlet Allocation)就是其中一种典型的挖掘技术。LDA分析过程中包含三个核心要素:词、主题与文本。LDA模型假设词首先构成潜在的语义主题,语义主题再进一步构成文本;词与语义主题、语义主题与文本之间均遵从狄利克雷分布:由于词和文本已知,通过Gibbs抽样等方法对模型求解,最后得到的主题均反映了文献的内容。作为一种无监督学习的文本内容挖掘方法,LDA不需要对文本进行前期的标引,算法的复杂性也不高,提出后得到了广泛的认可和应用。TMT(Topic Modeling Toolbox)是由斯坦福大学的自然语言处理小组专为社会科学研究人员进行主题模型开发的分析工具。TMT支持Excel和Csv的数据格式,并且提供了LDA、Labeled-LDA、PLDA等多种主题模型分析算法供用户选择。用户不需要较强的代码能力就可以通过TMT设定相应的运算参数,实现对主题模型分析过程的控制,最终生成包含丰富信息的分析主题结果,因此本研究以该工具进行主题挖掘。

3.智库研究主题分布

经过多次试验,本研究最终选择了10个主题进行模型计算。最终分析得到主题和各主题中出现频次前5的词(见表2),通过这些词可以很容易地确定各研究主题的内容。如主题4和主题5均与医学相关,但主题4出现的内容较泛,而主题5中出现了patients(病患)和cardiovascular(心血管的)等词,说明该主题4与医学与健康教育相关,而主题5则是具体的特定病例智库。

各主题在文献集中的频率分布,概率越高,说明该主题相关的研究越多。从10个主题的出现频率中可以发现,专家知识与智库建设、智库在风险管理、区域发展中的作用、医学病例智库等主题是当前研究的重点;各国智库发展状况、智库在外交和安全事务中的作用、智库与全球气候变化应对、医学诊疗智库等方面主题的研究居于其次:与信息获取与决策支持、智库与媒体关系等相关主题的研究略少。10个主题中,专业知识与智库建设、信息获取与决策支持、各国智库建设主要与智库的建设及其现状相关:其余主题则主要是智库在特定问题和领域中应用的研究。由于LDA的分析结果中包含了每篇论文在每个主题上的载荷,因此可以根据载荷最高的核心论文分析各个主题的具体内容。

4.智库研究主题的具体内容

4.1智库建设与发展现状研究

(1)专家知识和智库建设研究。专家是构成智库的重要单元,专家知识在智库发挥其功能的过程中具有重要的作用,国外对于专家知识在智库建设中的作用研究开始较早,且一直以来都是研究的热点。澳大利亚皇家墨尔本大学的公共管理学者Marden认为,在公共政策的决策过程中,智库往往被认为是具有专业知识的群体,Marden通过对智库来源和发展历史的分析,评估了在澳大利亚政治活动中出现的新保守主义。美国哈佛大学的学者Nye认为专家知识、学术理论和实践工作中存在的差距在政策的制定过程中十分明显,且彼此之间的脱节有愈演愈烈的趋势,Nye探讨了这种现象产生的原因,认为如何在政策研究过程中搭建理论和实践之间的桥梁,是智库发展的重要基础。英国格拉斯哥大学的学者Schlesinger讨论了媒体、文化和公共事务领域智库提供的专家意见和专业知识成为政府决策依据的过程,并以英国为例,分析了英国智库在影响国家公共政策制定和创新经济发展过程中的作用。认为从历史的角度来看,专家的意见和专业知识在整个智库的发展过程中起到了至关重要的作用。芝加哥大学全国民意研究中心的研究人员Struyk等认为,地方政策智库在经济发展和社会治理过程中发挥了重要的政策咨询作用,地方政策智库的建设应当充分重视能力建设,并提出了评估地方政策智库发展能力的评价方案,取得了较好的实践效果。

(2)信息获取与决策支持研究。智库在信息获取问题上的态度和能力决定了智库的决策支持能力,早期的相关研究主要集中于智库的信息获取倾向,近年来,随着社交网络的兴起,Twitter、微博等作为智库获取信息的新来源受到学者们的关注。德国学者Schulz-Hardt和Frey认为智库实质上就是一个提供决策支持的团体,决策的科学与否依赖于智库所获取的信息是否全面可靠:由此,他们从社会心理学的角度分析了组织决策过程中的信息检索行为,发现了集体信息搜索过程中偏见产生的机理,并展望了如何利用该研究成果使智库更好地获取信息并履行自身职能。Schulz-Hardt还进一步研究了一个由201名专家所构成的智库团体的决策过程,发现信息获取策略的不同是导致争论产生的主要原因,从决策过程来说,观点上的异质性和信任是保持智库团体获取客观信息,并且做出正确决策的有效依据。美国学者Golbeck和Hansen分析了媒体偏见对于政策信息搜寻的影响,并设计了一种新的方法来计算评估Twitter粉丝的政治性行为和观点,他们开发了相应的计算机程序并进行了实验研究,结果表明该方法能够良好地反映智库决策受到媒体和政策信息来源影响的机理。德国学者Hennig等认为博客是智库进行决策的重要开源信息来源,每天以百万数量级增加的博客中涵盖了大量的热点信息,可以利用博客信息进行预测分析。

(3)各国智库建设现状研究。世界各国均较为重视智库在政治、经济和社会生活中的作用,特别是随着发展中国家智库建设进程的加快,越来越多的学者开始重视发展中国家的智库建设工作。如学者Politzer对导致巴西国内研发效率低下的因素及其产生的原因进行了回顾,发现巴西国内的一些战略智库提出的解决方案具有重要的参考价值。英国学者Weston等论述了在南非召开的企业与艾滋病智库研讨会的内容,该智库由中小企业、公共部门和半官方机构等构成,智库会议提出的政策和程序性建议对如何克服南非所面临的艾滋病社会问题提供了重要的参考。国外学者对中国智库的工作也进行了许多研究,由英国伦敦大学出版的期刊《中国季刊》刊载了许多中国智库研究方面的文章。美国学者Shambaughtl91认为,中国智库在国家外交政策的制定和情报分析中的作用十分重要,这些智库不仅支撑着国家的决策,也成为了国际社会认识中国的重要途径。美国战略与国际问题研究中心的学者Glaser认为,在中国参加国际社会活动的过程中,民问智库发挥的作用越来越重要,并分析了中国民间智库参与国家政策制定的途径以及民间智库的角色、职能和发展趋势。加州大学圣迭戈分校的中国问题专家Naughton认为,在整个中国经济政策的决策网络中,经济智库是其中的关键节点,但是从发展趋势上看,中国智库的趋同性越来越明显,个性缺失是中国智库发展面临的主要问题。

(4)媒体视角的智库研究。媒体是智库产生社会影响力的重要渠道,也是智库的重要发声渠道,媒体视角的智库研究主要集中于两个问题:一是媒体如何在智库功能实现过程中发挥作用;二是通过媒体进行智库政治倾向分析。美国威克弗里斯特大学的媒体研究专家Rich等依据6份全国性报纸分析了全美51个公共政策智库的表现,研究表明,在美国政府支持色彩较重的保守派智库和不具备特定意识形态的智库相比,更容易获得媒体方面的知名度,美国的媒体整体上而言表现的十分保守,保守派公共政策智库受到了更多的关注,并且在美国新闻媒体中更加频繁的出现。台湾学者Tung等以海峡两岸的关系研究为例,论述了如何依据智库和专业协会公布的在线研究成果作为重要的数据来源开展研究。加州州立大学的教育学专家McDonald通过研究发现,媒体是智库在教育政策制定过程中发挥影响力的主要渠道,从当前美国的现状来看,保守派智库通过媒体对教育政策的影响力比中间派、自由派与进步派的智库更强。

4.2特定领域中的智库应用

(1)气候变化与应对。国际上关于气候变化及其应对方面的研究并非主要集中于智库在其中发挥的作用,而是更多的集中在分析智库及其所代表的政党的态度,且这方面的研究一直都是重点。澳大利亚新南威尔士大学的学者Pearse等通过调研发现,许多智库和专家认为碳排放是全球气候变暖的主要原因,各国智库应加强对碳交易市场的研究,以提供更多的环境保护建议。由于受到政治环境的影响,许多智库并未对环境保护问题持有正确的立场和公正的态度。美国学者Jacques和Dunlap等认为,环境怀疑论是应对当前国际气候变化所面临的主要挑战之一,他们分析了1972-2005年间出版的142本环境怀疑论的著作后发现,美国保守派智库是该论调的主要持有者,其目的在于打击环保主义,并推卸美国在气候变暖方面应承担的责任。密歇根大学的学者Schtddt等通过调查发现,美国的保守派智库倾向于使用“全球变暖”而非“气候变化”,试图通过这一称谓潜移默化的改变公众对气候问题严重程度的认知。学者Dunlap等认为美国的保守主义智库在气候危机问题方面一贯采取否定的态度,在通过分析相关的环境问题专著后发现,美国保守主义智库所持有的环境问题怀疑论态度通过媒体和政治精英的放大作用,已经逐步扩散到其它国家,这些问题应引起环境保护主义者的重视。

(2)医学与健康教育智库。作为一个复杂的知识系统,现代医学面临许多新的挑战,特别是在健康教育方面,传统的学校教育与医院的临床教学已经不能满足当前高速发展的形势,通过智库的集体智慧制定医学健康教育的标准、规范、要求已经得到广泛的重视。耶鲁大学医学院的专家Henry等调查了一个儿童手术培训教育的智库建议的实施情况,通过分析工作时间规定与儿科手术培训效果之间的关系,发现该智库建议确实有效地改变了儿童手术培训的效果,但手术后期的护理需要提供更多的可行性建议。加拿大健康智库专家Barclav-Goddard等认为,慢性疾病患者和残疾人治疗的主要目标是实现病患的自我管理,从而优化健康状况和生活质量,通过对病人开展变革型的健康教育和健康生活价值观的培养,能够有效优化病人的生活质量。医学智库组织美国心脏病学基金会2015年发布的心血管核心培训声明是一份具有较大影响力的医学教育智库报告,该报告详细规定了医生进入美国心脏专科培训的条件、要求、程序以及课程,充分体现了医学智库在推动整个社会的医学与健康教育方面的影响力,该智库成员Bedacher等详细介绍了全美心脏超声培训和美国超声心动图学会在培训和教育方面的工作,并提出了许多建设性的建议以推动健康教育的发展。

(3)病症与病例智库。病症和病例对于医学诊疗具有重要的参考价值,针对特定病症所建立的智库能够为医学专家交流治疗经验提供有效的渠道,发达国家一直较为重视病症与病例智库的建设,力图发挥病症与病例智库在临床治疗中的作用。美国泌尿病症诊疗智库与美国心脏安全联盟智库常以年会的形式开展诊疗方案的讨论,如该智库2010年的国际咨询年会广泛讨论了相关病症对民众健康以及社会经济的影响,并提出了未来诊疗的发展方向。杜克大学的医学专家Al-Khatib等[蚓介绍了美国心脏安全研究联盟智库SAFARI的工作情况,智库由美国心脏安全联盟、杜克大学医学院等机构组成,主要针对在美国已经对公共健康产生重要影响的心脏疾病的病例进行分析,通过国家健康协同网络对不同病症治疗建立统一的注册和会诊,该智库的建设有效提升了全美心脏疾病治疗的效率。

(4)城市与社区发展。城市和社区的发展面临社会、经济、地理、区域规划等各方面的问题,智库能够在提供综合性的解决方案方面发挥重要的作用。加拿大学者Maclellan-Wright等对21位智库专家进行调研发现,目前加拿大大量的公共服务机构以社区为中心开展工作,如何衡量这些工作的效果和产出是管理工作面临的难点,智库专家建议从9个关键领域开展社区能力评估并取得了较好的实施结果。瑞士学者Cavin认为当前的城市可持续发展仍旧面临许多困难,并介绍了瑞士联邦智库提出的城市自然公园建设方案,发现该智库较为重视环境质量控制,相关成果为瑞士取得城市区域发展和自然保护中的平衡提供了重要的参考。

(5)风险应对与问题解决。社会和科学的发展必然伴随着风险,这类风险问题大多具有高度的复杂性,需要不同层面的知识进行决策的支持,许多学者对智库在风险应对和问题解决过程中的作用进行了研究。英国智库机构公共政策研究所(Institute of Public Policy Research,IPPR)对英联邦政府公布了公务员制度改革计划存在的风险进行了系统研究,并发布了一系列的智库研究报告以降低政策风险。环大西洋毒理学智库组织(Transatlantic Think-Tank of Toxicology:t4)提出,为了应对相关风险,国际组织应当建立一个可靠、开放的信息交换机制,以防止问题的产生。美国癌细胞扩散研究智库系统讨论了特殊癌症的治疗及生物治疗方案可能存在的风险问题,并对癌症诊断、预后和质量控制方面存在的方案提供了一系列转移建议。此外,为了增强生物样本的可识别性,降低实验风险,来自美国癌症基因组学、生物信息学等多个领域的46名专家组成了一个研究智库,该智库认为通过建立数据共享体系能够有效规避因生物样本材料的不确定导致的实验风险问题。

(6)外交与安全事务。外交与安全问题是世界各国政治生活的关注重点,也是智库发挥作用的重要领域。西班牙学者Prado分析了欧洲与东盟、日本以及中国质检的外交关系,研究表明,在多元化的外交关系建立过程中,智库及精英知识分子对政策的制定起到了主导作用。伦敦大学学院的国际关系专家Klinke认为,从地缘政治学的角度来看,欧盟所持的“后现代”领土观念和俄罗斯所持有的“现代”领土观念并不对应,智库专家、记者和政治学家已经成为两者正式外交对华的重要通道。哥本哈根大学学者Beding以冷战后的欧洲安全问题为例,分析了外交关系形成过程中存在的外交理论与实践的脱离问题,认为外交关系的形成应当充分重视其过程,智库在外交关系的形成过程中起到了重要的作用。德国外交问题专家Abb经过调查发现,中国的外交政策智库在过去的10年中得到了长足的发展,这些智库的专业化水平和学术水平已经有了明显的提升,在中国外交关系的制定中也发挥着越来越重要的作用。

5.结论与讨论

5.1结论

本文通过利用斯坦福大学自然语言处理研究小组开发的主题模型分析工具包TMT对WOS数据库中国际智库研究论文进行了内容挖掘分析。从本研究的主题挖掘结果来看,国际智库研究主要包括两大类型:一类是关于智库建设的研究,包含专家知识如何在智库建设过程中发挥作用、如何获取有效的信息和情报保障智库决策、国际社会智库的发展现状以及媒体视角的智库研究等4个研究主题;第二类研究包含的6个研究主题主要集中于智库在特定问题的应用,这些问题大多为当前国际社会普遍关注的领域,具有高度的复杂性,且是单纯依赖某一行业或某一领域知识已经无法彻底解决的问题,如医学健康问题、全球气候变暖、国际安全问题、地区发展问题等,智库所具有的集体智慧能够为这些问题的解决提供重要支持。特别是在医学健康领域,由于现代医学需要综合利用各种知识提供完整的解决方案,因此无论是高效的医学教育,还是具体的病症诊疗,均重视利用智库来构建相关的解决方案。从各主题发展的时间上来看,智库在特定领域中的应用在未来会受到越来越多的关注。

本研究还发现,国际社会,无论是美国、英国还是欧洲大陆,大量的智库实质上具有明显的政府背景,特别是国际上的保守派智库发布的报告就是保守政党执政思路的重要体现,因此,智库的政治倾向及其研究成果可以成为公共政策及政党态度分析的重要情报源。同时,国际社会常以中国智库建设过程中政府色彩浓重而否认我国智库独立性的观点并不成立。

5.2讨论

信息计量中常用的共词分析法并不考虑词本身所代表的语义,因此很容易受到关键词歧义的影响而导致出现分析不准确等问题。相对而言,主题模型能够较好地发现研究内容中隐含的语义主题,以本文中的“风险管理与应对”为例,在该主题上载荷较高的论文涵盖了医学研究、政策执行、科学实验等多个领域,依据共词分析很难发现这些论文之间的相关性,但主题模型则可以深入内容,挖掘出论文研究内容之间的共性:此外,主题模型的分析结果还为不同研究主题内容的解读提供了相对客观的依据,能够避免对专家主观认知的过度依赖。因此,主题模型分析为识别领域研究结构提供了良好的渠道,同时能够对共词分析进行良好的补充。

此外,主题模型方法也存在一些缺陷,与共词分析类似,主题模型更侧重于对研究结构的分析,所以主题模型很难揭示不同研究领域的发展脉络、研究进展和应用背景:虽然可以通过主题在时序上的变化分析出大致的趋势,但是缺乏对趋势进行精确解释的必要条件。因此,本文的研究结果虽然能够反映国际智库研究主要研究内容,但在各主题本身的发展过程分析上还存在不足。较为合适的解决方案是综合多种方法全面揭示研究领域的结构和发展趋利,如可以通过引文时序分析揭示研究领域的发展脉络和主干,再利用主题模型对引文聚类的内容进行进一步的分析,相关内容将在本文后续的研究中得到进一步的探讨。

猜你喜欢

研究趋势
平衡现有矛盾,挖掘发展标准
近十五年我国大学教学研究的热点与趋势
沼液养鱼的研究现状及发展趋势
职业院校护理专业学生职业心理素质的研究趋势
我国农田氮素污染现状及研究趋势分析
我国企业环境信息披露研究述评与展望
中国经理人领域28年研究趋势演变的纵向研究
企业绩效研究评述比较与展望
大数据研究综述
主观幸福感研究的不足和趋势