“期待膨胀期”的数字人文研究
——《图书馆论坛》“数字人文”栏目的回望与展望*
2019-01-07刘洪,肖鹏
刘 洪,肖 鹏
0 引言
著名咨询公司Gartner每年都会发布《技术成熟度报告》 (Gartner’sannual Hype Cycle Report)。2018年8月底发布的最新报告通过对2000余项具体技术的评估,分析了最具影响力的35项技术的成熟度,总结出“大众化的人工智能”(DemocratizedAI)等五大新兴的技术趋势[1]。该系列报告的特点之一是将每项备受关注的技术安置在由“期待值”和“时间”构成的坐标轴上,结合“成熟度曲线”,将整个坐标轴切分为“触发期”“期望膨胀期”“幻灭期”“复苏期”“成熟期”等阶段(见图1)。这一系列报告很少公布研究细节,因此引发过一些非议,但通过对技术生命周期、技术采纳等思想的转用,“成熟度曲线”为学界和业界提供了指引,实则具有宏观层面的启发价值。
图1 新兴科技技术成熟度曲线图[1]
“触发期”“期望膨胀期”“幻灭期”“复苏期”“成熟期”等阶段的划分也适用于科学研究领域。当然,其在科学解释力上无法与类似的信息计量研究相提并论,但对研究路径的方向把控而言具有较强的参考意义。根据这一思路,一个颇具前途的研究领域或技术体系刚刚出现时,无疑容易引起狂欢和妄想,由此“触发期”的期望曲线一路陡升,并逐步进入“期望膨胀期”,学界和业界对其满怀信心和期待,从各大会议、期刊组稿与线上线下热烈的讨论来看,我国数字人文研究正在走入这一阶段。但膨胀的期待经常会遭遇冷酷的现实或无所成就的实践,继而走向“幻灭期”,部分研究从此销声匿迹,但也有一些研究艰难地穿过虚荣的幻象存活下来,继而成熟,最终演化为一个范式化、常规化的研究领域,甚至成为具有长久生命力的研究传统。
本文尝试讨论的主题是:我国数字人文研究是否已经是一项研究传统,或进一步地,是否已经成为所谓的“研究范式”?如果不是,它又应当如何通向彼岸?本文以《图书馆论坛》数字人文来稿和发表文章为数据源,对《图书馆论坛》“数字人文”专栏设置两年来进行整体性回顾,并尝试讨论数字人文研究的未来发展与关键守则。
1 《图书馆论坛》“数字人文”专栏来稿分析
1.1 定量分析
2017年1月《图书馆论坛》设置我国第一个“数字人文”专栏,有幸参与到我国轰轰烈烈的数字人文浪潮之中,踩在了这一研究“触发期”的关键节点上,也为图情档学科在该领域占据了先机。一般的文献计量学研究只针对已发表论文,很少涉及对期刊来稿的分析。由于针对来稿的分析可以呈现数字人文研究“冰山之下”的情况,为此下文做一些简要的分析。
从2016年1月1日到2018年10月24日,“数字人文”栏目来稿量逐渐攀升(见图2)。在这一期间,通过初步筛选,进入审稿流程的论文计有130篇,其中35篇被录用,录用率为26.92%。相较于《图书馆论坛》整体的稿件录用情况(2014—2017年录用率分别为 5.70%、5.65%、6.37%和6.27%),这一比例相当高,原因主要有两个:一是面向专家的约稿较多;二是推动“数字人文”领域的发展。
图2 “数字人文”来稿量
就来稿作者的机构分布而言,主要来自图情档院系和图书馆,占83.33%(见图3)。这一情况与《图书馆论坛》的学科立场有密切的关系。不过,从来稿情况看,图书馆、博物馆、数字人文中心等拥有特藏资源与实践机会的机构在数字人文研究中确乎具有先天优势,如上海图书馆的相关团队对数字人文项目建设方法、流程的实践总结便颇具示范价值[2]。
图3 来稿作者机构分布情况
作者的合作和年龄是判断某领域活跃度的重要指标。在数字人文来稿中,65%为合著。进一步分析发现,跨领域的合作案例相当少,这并不完全符合我们对数字人文研究的期待。在作者年龄分布上,45岁以上的学者仅占4%,表明该领域属于中青年学者,而博硕士研究生又占了一定比例。
在基金资助方面,在数字人文来稿中,只有26.15%受基金资助,既低于传统研究领域的基金资助情况,也低于《图书馆论坛》同期来稿52%的基金资助情况。结合已发表数字人文论文的基金资助情况来看,现有数字人文研究多是成熟研究的分支或延伸,专门针对数字人文的资助项目还不多。不过,结合2018年度国家社科基金、教育部基金的立项情况,尤其是重大项目的课题指南清单,可以说各级基金对数字人文领域的关注度正在迅速提高。
1.2 定性观察
(1)主题分布。130篇来稿的主题主要包括数字人文概念和发展历史、数字人文基础设施、数字人文教育、图书馆与数字人文的关系、数字人文研究方法和工具、数字人文案例、数字人文书评。本文并未针对各主题给出具体的统计数字,原因在于:许多论文有一定的主题和方向,但基本是粗浅的介绍和分析,或使用较多篇幅讨论数字人文定义等在学界已逐步成为常识的内容。
(2)退稿原因。数字人文来稿的审稿采用同行评议制度。退稿原因主要有:①有一定程度的学术伦理问题,尤其是对外文文献的浅层次整合;②缺乏问题意识,选题比较旧,简单地重复相关概念和历史发展情况,尤其是很多文章尝试以CBDB为案例展开探讨,但对CBDB的剖析和理解多属于介绍;③缺乏学术性,没有科学的研究方法和研究过程,基本停留在简单的思辨层面;④缺乏充分的数据和证据支撑,工作量不足。此外,还有一个因素尚未成为主流的退稿原因,却深深困扰着编辑和审稿团队:某些研究实际上是传统的可视化研究、文献计量研究或信息组织研究,却以“数字人文”之名进行投稿。若相应的研究本身达不到相应水准自不必说,但假设它们的完成度相当高、方法结论也可称合格,究竟是否应该在本栏目刊登这些成果呢?目前的处理情况往往是一事一议,但这似不符合长远的原则。
整体而言,上文分析比较简单。尽管如此,考虑到当前关于数字人文的计量研究主要以已发表论文作为数据源,而对来稿的分析同时反映了“水面之上”和“水面之下”的情形,这一工作对本专栏潜在的作者群和数字人文领域的研究者、行动者会有一定的参考价值,也可帮助我们窥得数字人文领域的一个侧面。
2 管中窥豹:我国数字人文研究的主要特点
通过对以上数据的考察和日常接触数字人文领域的个性化经验,笔者切身感受到潜藏在表面繁荣之下的危机。正如上文所言,如果在技术成熟度曲线的坐标轴上做一个顶点,当前对我国数字人文研究的期待无疑逼近期待曲线的巅峰。但在期待之外,数字人文真正的黄金时代远未到来,因为属于数字人文时代所应有的和独有的工具理念与研究范式尚未构筑完备。基于专栏的数据分析,以及与作者、审稿专家群体的交流,当前我国数字人文研究具有四个特点。
(1)数字人文正在成为学术型图书馆的创新点,但是,大部分图书馆仍然处于数字人文的迷茫期。对大型学术图书馆而言,基于特藏资源的数字化工作本就是日常性的重点工作,数字人文的崛起在这一基础上提供了两个层面的新机遇:其一,来自人文社科领域的团队变得日益主动;其二,国家、地方和学校越来越愿意针对特定项目给予日常预算之外的资助和支持;更重要的是,这两个机遇往往交缠在一起。但是,对中小型图书馆而言,如何开展数字人文,大多数管理者和图书馆员依然迷茫;随着大型图书馆迅速发掘其特藏资源与经费资源的优势,部分中小型图书馆明显地显示出焦虑和无奈。这种“鸿沟”在专栏来稿中显得尤为明显,即便只是观察同等学历和职称的图书馆馆员,大型学术图书馆的馆员多能聚焦于特定的学术资源,而中小型图书馆的馆员往往难以找到合适的切入点。
(2)当不同领域的学者、图书馆员之间建立合作关系,往往能够完成更具深度的研究课题,但这种类型的合作十分稀缺。最理想的数字人文合作模式应该是以传统人文学者为主导,提出研究问题,其他领域的学者与人员提供支持,进而解决问题或发现新的知识;但如今常常变成外来学者突然跳入某一特定的人文领域,勇敢而孤独地试错和摸索。这一问题是一个世界性的难题。笔者所在的团队近日针对五种数字人文领域的期刊——《数字人文季刊》(Digital Humanities Quarterly)、《人文研究中的数字学术》(Digital Scholarship in the Humanities)、《数字研究》(Digital Studies/Le champ numérique)、《文化分析杂志》(Journal of Cultural Analytics)、《交互技术和教育学期刊》(Journal of Interactive Technology)2012-2018年的论文发表情况做了初步的计量分析,通过绘制作者共现图谱,发现数字人文领域的整体合作情况均不理想,遑论跨领域学者的合作深度问题。
(3)数字人文存在明显的泛化危机,正在迅速“标签化”。在某种程度上,这一危机从数字人文诞生之日起就存在,但近期数字人文正在迅速沦为“大数据”般看似光芒四射、实已欠乏解释力的词汇。这一点已有论及,不再赘述。
图4 5种数字人文期刊的作者共现图
(4)新时期的数据理念和数据认识尚未被充分接受,学界和业界整体的数据公开、共享和联合情况仍不如人意。非仅《图书馆论坛》的“数字人文”专栏,在绝大部分已发表论文中,提及的数据集往往难以获取、验证,这在很大程度上影响了数字人文研究的可信度和说服力。但是,这一问题反而是最容易解决的,因为开放运动是不可逆的潮流,而我们已然身处其中。
3 四个基本原则:推动数字人文走向成熟期
针对以上问题,惟其明确并构建起独有的工具理念与研究范式,方能保持数字人文的长远发展动力,才有可能哺育和维护相对健康的数字人文领域,实现新兴知识体系的共生与长远发展。笔者斗胆初步提出数字人文研究应当具备的四个基本原则,供学界批判。显然,在短期内要求所有的相关研究都达到这一标准并不实际,但我们希望将这些原则慢慢融入未来“数字人文”专栏的审稿理念之中。从另一个层面来讲,或许这四个原则也能够帮助学界和业界厘清未来一段时期数字人文研究的发展路向与目标,为数字人文实现“期待值”与“现实情况”的契合、真正走向成熟期做出贡献。
3.1 一个中心:以“人文”为中心
“人文中心”是数字人文研究的起点与根本,失去“人文”,“数字人文”这一词汇便失去了所有被阐发和被诠释的价值。对“人文中心”至少应当有三个层次的认识:尊重人文领域的已有研究,延伸人文课题的问题边界,增强人文学者的技术赋能。
尊重人文领域的已有研究是对“人文中心”最基础也是最必要的理解。部分数字人文研究常常忽略人文学者经年累月对相关课题做出的探索。一个经典的例子是很多初涉人文领域的学者热衷于对某些经典名著进行社会网络勾勒或字频词频计算,在对应的文献综述中也以“无相关研究”一笔带过,但事实上文学领域的社会网络研究、语言学领域的语料库构建,已将相关研究推进至其他领域学者难以纵深和创新的地步,更毋论新知识的发现。
在延伸人文课题的问题边界方面,在通常的认知中,数字人文属于跨学科的研究范畴,它在人文学者的传统学术场域中撕开一道口子,为自然科学与社会科学研究者提供了发声的空间与行动的机会,但人文课题理应在这一跨领域的研究中占据主导和核心地位。数字人文的关键是以“数字”辅助“人文”,而不是以“数字”替代“人文”。
在增强人文学者的技术赋能方面,强调“人文中心”并不是简单地为人文学者的“权利”摇旗呐喊,更大程度上是对人文学者提出要求,希望人文学者迅速地认识、接受、批判和变革数字人文的研究范式,这些工作的前提是提升人文学者对技术的认识水平和习得能力。
3.2 一种平衡:“数字”与“非数字”平衡
“数字”与“非数字”平衡的追求是开展数字人文研究的第二项基本原则,过度的数字化实际上会消解人文学者解释的主动权,而程度过低的数字化则无法发挥数据科学、计算机科学等介入人文研究后带来的跨学科优势——这两者之间的拔河正是不同学者对“远距离阅读”等新兴分析技术争议纷纷的深层次原因。
2019年斯坦福大学中国史副教授Tom Mullaney将出版《中国人的死亡景观》(The Chinese Deathscape)一书,该书的研究与其多年以来主导的中国坟墓搬迁研究有着直接关系,“死亡景观”的呈现便是基于坟墓搬迁资料的可视化工作。2016年Tom Mullaney在谈及这一工作时指出,在经典的人文研究与数字化平台之间需要取得相对的平衡:“如果我们天平的一端走得太远,那么我们便会失去这一研究的人文内涵;如果朝相反的方向冲过了头,又将失去数字平台所提供的宏观尺度。”[3]这句话切中要害,一项优秀的数字人文研究应当兼顾两个方面的需求:既发挥数字化与可视化的优势,又为人文学者留下解释和分析的话语空间。
3.3 两大意识:实现“问题意识”与“数据意识”的深度融合
问题意识是支撑研究的灵魂,数据意识则丰满和充实相关研究的血肉,两者缺一不可,因此,实现问题意识与数据意识的深度融合是未来数字人文研究的第三个基本原则。这一原则具体包括两个方面:一是充分理解“问题即数据”,研究者能够自觉、流畅地通过广泛意义上的数据工作,实现对独特的人文问题的理解、呈现和探索;二是明确认识“数据即问题”,研究者能够充分理解特定问题领域的数据收集、构建和形成过程,在使用过程中明确阐述其利弊要害。
3.4 三个维度:数据的“开放性”“可验证性”“可迭代性”
数据的开放性、可验证性与可迭代性是衡量一项数字人文研究的关键标准。每个数字人文项目应尽量“张开手臂”,沿着这三个维度伸展开去,以保证该项研究的可信度和可延续性。包括本刊在内的多家图情期刊在第九届上海国际图书馆论坛上签署《共同推进图书馆学情报学期刊开放获取联合倡议》,强调“以更开放的姿态,迎接新的信息时代的到来”[4]。再早之前,《图书馆杂志》率先在数据共享方面展开行动,强调对数据出版的支持。可以说,图情领域已经为“三个维度”的实现奠定了基础性工作。笔者相信,在未来的某个节点,不符合这三项最低标准的研究不会被视为一项合格的数字人文研究。