双一流高校数字人文研究现状与知识图谱构建*
2021-06-09龙泉
龙 泉
〔1.武汉大学图书馆;2.科技大数据湖北省重点实验室(中国科学院武汉文献情报中心),湖北 武汉430000〕
1 研究背景
数字人文起源于人文计算,可追溯至20世纪60年代,始于利用计算机技术对意大利文学作品进行语言和文字处理[1],后随着文学、历史、艺术、音乐等人文学科的扩展,各类技术如超文本、超媒体、数据可视化、信息检索、数据挖掘、统计、文本挖掘等的应用,逐渐改变了传统人文学科的研究方式,数字人文也成为计算机与人文学科学习、研究、发明以及创新的新兴跨学科研究领域。
全球多个国家及高校建立了数字人文中心或联盟,如欧洲于1973年和1978年成立了关于文学、语言、计算机领域数字人文研究的组织;加拿大于1986年成立数字人文联合会;美国国家人文基金会和马里兰大学于2007年建立国际数字人文网络CenterNet。国内学者对数字人文的关注度亦不断提升。2011年,武汉大学成立了大陆地区首家数字人文研究中心,并于2018年9月加入Cen⁃terNet;2014年6月,上海市图书馆学会举行2014年图书馆前沿技术论坛“数字人文与语义技术”专题研讨会;2016年5月,北京大学图书馆联合哈佛大学“中国历代人物传记资料库(CBDB)”项目和北京大学“数字人文建设与发展研究课题组”共同举办了首届北京大学“数字人文论坛”,邀请国内外专家对数字人文在文史、艺术等方面的应用进行探讨和交流,该论坛已经举办了3届;2016年5月,中国人民大学清史研究所召开“数字人文与清史研究”学术工作坊;2017年7月1-2日南京大学召开“数字人文:大数据时代学术前沿与探索”学术研讨会,涉及地理、历史、统计学、资讯科学、建筑、经济、文学、艺术等多个学科;2017年12月,深圳大学城图书馆主办了“数字人文与图书馆”国际研讨会,来自英国、美国及国内的数字人文专家从不同角度就数字人文研究及图书馆在其中的作用进行了广泛探讨;2019年7月,敦煌研究院和中国社会科学情报学会数字人文专业委员会主办了“敦煌(DH2019)文化遗产数字化国际研讨会暨中国社会科学情报学会数字人文专委会学术年会”,会议围绕文化遗产数字化、人文社科智慧数据建设与管理,文化遗产知识图谱构建与应用等8个议题展开讨论;2019年10月,北京大学人文社会科学研究院等联合主办的“数字人文视角下的典籍传承与学科融合论坛”召开,各高校介绍了在数字人文领域现有的成果积累,研讨数字人文的发展。
随着信息技术不断发展,越来越多学科与计算机科学交叉融合,数字人文研究方兴未艾。通过文献计量学、可视化技术分析我国双一流高校数字人文研究现状,了解其研究内容、研究作者及机构,揭示其发展趋势、演化路径,有助于把握整体研究水平和研究模式,聚焦研究热点,对推动跨机构、跨学科数字人文项目建设有重要意义。
2 数据来源及研究方法
2.1 数据来源
“双一流”是世界一流大学和世界一流学科建设的简称,在2017年9月公布的名单中,有42所高校被纳入世界一流大学建设[2]。笔者以这42所高校为调研对象,在中国知网以“数字人文”或“人文计算”为主题,即限定为题名、关键词、摘要字段,机构限定为以各高校名开头的名称,发表时间截至2019年12月31日,进行检索。检索时间为2020年2月15日,得到“双一流”高校作者参与撰写的相关主题文献共246篇,占总篇数793篇的31%,去掉学位论文、报纸来源、主持人的话、主编的话等以及个别作者缺失的题录后,最终得到226篇,作为研究对象。
2.2 研究方法
笔者采用文献计量学、知识图谱可视化方法进行研究。采用EXCEL统计了226篇论文的发表时间、研究机构分布、发文期刊类型及发文量,了解研究整体情况;通过逐篇阅读对论文进行分类分析,识别主流研究方向;采用VOSviewer进行作者合著网络分析,识别合著模式和主要研究团体;采用CiteSpace进行机构合作网络分析和关键词聚类演化时间线分析,识别机构合作模式、机构关系、热点研究主题及时间分布。
3 双一流高校数字人文研究现状
3.1 年度发文量分析
中国知网上收录以“数字人文”或“人文计算”为主题词,“双一流”高校作者参与撰写的论文各年份发文量及增长幅度如表1所示。
表1 “双一流”高校数字人文研究年度发文量
最早的一篇论文发表于2006年,为数字人文研究起步阶段,探讨了技术与人文融合的利弊[3];2007—2012年间,并未迎来领域研究的快速发展阶段,只有2篇研究成果,研究内容为技术或项目介绍,为数字人文研究的探索阶段,该领域此时并未受到广泛关注;2013—2019年,经历从成长过渡到快速发展的阶段,每年均有成果发表,在数量上基本呈逐年增多态势,近3年已有一定数量积累,2019年达到84篇,且在研究内容上更多元化,包括国内外调研、研究进展等理论研究,也有基于技术、项目实践的具体经验探索。
3.2 发文机构分析
42所双一流高校中,有33所参与数字人文主题的研究,占比78.6%。其中,综合类高校20所,占比最高,为60.6%,其次为理工类高校8所,占比24.2%,另有师范类、民族类、军事类、农林类高校亦有参与。
从机构类型上看,笔者对226篇文献作者机构进行统计,结果显示:包括合著在内的所有作者共来自195家机构,其中院系、研究中心、实验室共142家,占比72.8%;图书馆35家,占比17.9%;以一级机构“大学”为发文机构的共14家,占比7.2%;公司5家,占比2.6%。进一步对其中双一流高校数据进行统计:双一流高校机构共136家,其中院系、研究中心、实验室共101家,占比74.3%;图书馆25家,占比18.4%;以一级机构“大学”为发文机构的共9家,占比6.6%;出版社/公司共2家,占比1.5%。可见,有专业学科背景的研究机构是从事数字人文研究的主体,其次,图书馆对该领域亦表现出一定程度的关注。
从机构发文量及学科背景看,将二级机构汇总至其所属一级机构后,排名前三的一级机构为:南京大学(47篇)、武汉大学(27篇)、北京大学(22篇);排名前三的二级机构为:南京大学信息管理学院(29篇)、武汉大学信息管理学院(23篇)、中国人民大学信息资源管理学院(13篇)。发文总量排名前十的一级、二级机构如表2所示。
数字人文研究是跨学科研究,除了要拥有历史、人文、教育等不同学科知识和研究基础外,还需掌握数据的搜集、处理、分析等信息技术手段。从一级机构看,发文量排名前10的除华东师范大学外,均为综合类高校,表明学科门类丰富的高校产出了更多研究成果,原因或为其多学科优势,且校内院系、研究中心等机构之间便于开展交流合作,研究人员有更多机会接触并学习不同的专业知识,具备从事跨学科研究的意愿和有利条件。
同时,根据教育部学位与研究生教育发展中心最新公布的第四轮学科评估结果[4],发文量排名前10的14所大学均开设了信息科学相关专业,其中有8所拥有图书情报与档案管理类一级学科,且南京大学、武汉大学、中国人民大学将该学科评估为A类;有13所拥有管理科学与工程一级学科,且清华大学、上海交通大学、浙江大学、四川大学、东南大学将该学科评估为A类。进一步分析排名前10的16所二级机构类型,有8所为信息科学类院系或研究中心,5所为图书馆,3所为文史学院或文学研究所。据此可知,双一流高校中从事数字人文研究的机构较为集中,主要为信息科学相关学科类型,该学科包含信息组织与管理、数据和文本的分析与挖掘、信息可视化等研究方向,具备技术优势,也是其他专业人员从事数字人文研究的有效助力。
表2 发文量排名前10的一级、二级机构
3.3 发文期刊分析
3.3.1 发文期刊类型分析
发表双一流高校作者数字人文研究的期刊共95种。按CSSCI、核心期刊、“CSSCI+核心期刊”和普通期刊四类进行分类,各类期刊种数、发文篇数及占比、平均发文量见表3所示。
表3 发文期刊种数、发文篇数及占比
从发文期刊的种数及篇数占比来看,“CSSCI+核心期刊”类是双一流高校作者主要发文渠道,且近80%的作者在CSSCI或核心期刊上发文,论文整体质量较高,或因双一流高校的教学条件、人员科研能力、职称评定等各项指标对此产生的影响。
进一步按年份统计,各类期刊发文量逐年变化趋势如下图1所示。
图1 各类型期刊年度发文趋势
从年份变化来看,近5年为数字人文研究快速发展期,其中“CSSCI+核心期刊”的发文量大幅度跃升,是拉动数据上升的关键因素。表明“双一流”高校近年来不断重视数字人文领域研究,研究数量增加,研究质量显著提高。
3.3.2 期刊所属学科分析
中国知网收录的期刊按所属学科分成不同专辑及不同专题,95种期刊共涉及7个不同专辑(4种期刊未标明专辑,只计入总数未列入表中;1种期刊同属两个专辑计2次),各专辑、专题的期刊种数及占比如表4所示。
可见,占比排名第一的信息科技类期刊是数字人文研究发表的主要阵地,共51种,占比53.7%。其下属专题图书情报与数字图书馆类期刊亦在总种数中占比最高,共36种,占比39.6%。且该类期刊发文量达135篇,占总发文量(226篇)的比例高达59.7%,说明数字人文研究除了研究机构集中,研究成果的主要类型也相对集中。
占比第二的为社会科学II类期刊,共17种,占比17.9%,其下属专题教育综合类期刊在总种数中亦排名第二,共16种,占比17.6%。同时,在这16种期刊中,有10种为人文、哲学类学报,可见双一流高校对数字人文研究有一定支持力度,且该研究的跨学科特性也在信息科学与人文社会科学的融合中得到体现。
对期刊发文量进一步分析,发文量排名前10的14种期刊中,12种为图书情报与数字图书馆类;发文量超过平均值2.4篇的期刊有25种,具体如表5所示。
由表5可见,发文量相对较高的期刊几乎都为信息科技类期刊,主要集中于图书情报与数字图书馆、档案及博物馆两类。反映了:(1)数字人文研究较多涉及信息处理及分析方法,发文期刊类型与上一节机构分析中得出的研究人员主要为信息科学相关专业相符的结论一致;(2)档案及博物馆类期刊在期刊总种数中占比并不高,但发文量却较高,一方面说明该类期刊对数字人文研究的支持力度,另一方面说明,除图情领域外,档案及博物馆领域的研究人员对数字人文的理论与方法亦颇为熟悉,且两个领域交叉、互通较多,有助于研究框架与知识结构的不断完善,也更易积累研究经验与成果。
表4 各学科期刊种数及占比
表5 发文量超过平均值以上的期刊
3.4 研究影响力分析
论文被引频次是学术评价的指标之一,也代表了该研究在业内的被认可度、学术影响力和学术价值。中国引文数据库中所有机构的数字人文研究论文被引篇数为645篇,被引总次数为3469次,平均被引5.38次;双一流高校的数字人文论文被引篇数为153篇,被引总次数为1125次,平均被引7.35次。说明“双一流”高校数字人文研究数量不多,影响力较整体平均水平略高,但优势不明显。
同时,笔者统计了被引频次高于7.35次的论文,共得到108篇。其中,“双一流”高校作者参与撰写的有36篇,占比33.3%;“双一流”高校作者为第一作者的有32篇,占比29.6%。即在影响力超过平均水平的论文中,双一流高校成果并不多,大约仅占三分之一。一方面说明,各级各类机构对数字人文研究都有重要贡献,产出了高质量的成果,并得到广泛认可和采纳;另一方面,被引量靠前的“双一流”高校论文主要集中在北京大学、南京大学、武汉大学等少数几所高校,说明“双一流”高校数字人文研究的发展不平衡,整体水平并未走在前列,研究成果的认可度及影响力在领域内并不突出。
3.5 研究方向分析
高被引论文除了作为揭示学术影响力的评价指标,也揭示了当前核心研究方向。笔者分析32篇被引频次较高的核心论文发现,这些论文的研究方向主要分为3类:数字人文研究及发展现状(11篇);数字人文应用理论(17篇);数字人文项目实践(4篇),各类被引频次排名靠前的论文如表6所示。
“数字人文研究及发展现状”类论文主要包含会议和文献综述、文献计量学分析、服务调研等,通过归纳总结、数据统计、调研等方式,阐释概念、发现热点研究领域、了解国内外现状、提出参考意见和见解,该类论文的被引及下载频次最高,为重点关注及研究方向;“数字人文应用理论”类论文在数量上占比最大,主要包含技术理论研究和工作探讨,如文本挖掘、GIS、关联数据等信息技术工具的理论及相关案例介绍、数字人文与实际工作结合模式的构想等,工作探讨集中在图书馆和档案两个领域,这亦是从事数字人文研究人员的主要学科背景;“数字人文项目实践”类论文主要为研究人员对自己亲自参与、实际从事工作或项目的介绍和分析,所提出的经验和方法来自于他们本人的实践,这类论文数量最少,且被引次数和下载次数也相对较少,说明“双一流”高校的数字人文研究主要以理论为主,将理论与实践相结合的研究力度不够。
4 数字人文研究知识图谱分析
4.1 作者合著分析
“双一流”高校作者参与撰写的226篇论文,共涉及到326位作者。在VOSviewer中创建作者合著网络,设置最小作者数为1,得到145个群组,其中72个群组包含2位及以上作者,说明近一半是合作式研究。
表6 核心研究方向论文统计
在合著作者网络中,最大关联网络涉及22位作者,如图2所示,节点大小代表发文量,连线粗细代表作者间合著频次多少。南京大学信息管理学院朱庆华为关键节点,参与撰写8篇论文,与之合著较多的为南京理工大学经济管理学院的赵宇翔(合著3次),其次为上海图书馆的陈涛、刘炜(合著2次),并以此为纽带,产生了新的子网络。
图2 双一流高校数字人文研究作者合著最大子网络
另外,作者关联数大于10人的网络有3个,如图3所示。
图3 双一流高校数字人文研究作者合著子网络
图3 (a)网络包含11位作者,均来自北京大学图书馆,11人合著1篇会议综述,没有其他相关研究,该网络中没有关键节点;图3(b)网络包含10位作者,武汉大学信息管理学院王晓光为关键节点,参与或独著5篇相关论文,与网络中其他作者均只有1次合著;图3(c)网络包含10位作者,华东师范大学信息管理系许鑫为关键节点,参与或独著6篇相关论文,且与同校同院系陈路遥、杨佳颖有过2次合著。可见,图谱中呈现出明显的核心子网络,主要原因是关键作者参与发文量和总合著次数较多,但与同一对象的合著次数较少,除以朱庆华为核心的最大子网络外,并未表现出稳定的合作关系。
进一步分析子网络发现,关键节点均为图书馆或信息科学相关人员,说明该类人员是数字人文研究的核心力量,与前文机构分析结果一致;同时,结合各作者学历层次和身份分析,主要合著模式为导师-本硕博士生,其次为同领域专家合作、同机构同事合作,这表明虽然数字人文是跨学科研究,不同学科背景的学者合作是理想的研究模式,但目前这种模式还不占主流,研究者仍更倾向于选择同领域人员作为合作对象。
4.2 机构合作分析
机构合作反映了不同高校、高校部门院系之间的联系。数字人文的典型特征之一是跨学科研究,通过对其机构合作情况进行分析,有助于了解各高校不同学科人员间的交流及参与度,揭示研究模式及研究深度。
利用CiteSpace软件进行机构合作分析,阈值设置为1,得到图谱如图4。
图4 双一流高校数字人文研究机构合作图谱
节点及字号大小代表该机构发文量多少,节点间连线代表机构间存在合作关系,连线越粗,机构间合作次数越多。图4明确显示,南京大学信息管理学院、武汉大学信息管理学院和中国人民大学信息资源管理学院是三大核心节点,这3所机构的发文量、机构合作次数最多。
南京大学信息管理学院单个机构的发文量为9篇,合作发文量最多的机构为南京理工大学经济管理学院(5篇),其次为福建师范大学社会发展学院(3篇)、上海图书馆(3篇),且与本校图书馆、工程学院有合作,与其他3所高校图书馆有合作;武汉大学信息管理学院单个机构发文量为6篇,合作发文量最多的机构为武汉大学信息资源研究中心(7篇),其次为中国人民大学信息资源管理学院(2篇)、南昌大学人文学院(2篇),与本校计算机学院、遥感信息工程学院、数字图书馆研究所、数字出版研究所有合作,与中山大学资讯管理学院有合作;中国人民大学信息资源管理学院单个机构发文量为5篇,合作发文量最多的机构为中国人民大学人文北京研究中心(3篇)和中国人民大学数据工程与知识工程教育部重点实验室(3篇)、武汉大学信息管理学院(3篇),其次为南昌大学人文学院(2篇),与本校数字人文研究中心、电子文件管理研究中心有合作,与北京航空航天大学经济管理学院有合作。
可见,机构合作方式分为4类:同机构内合作、校内合作、同地域合作和跨地域合作。同机构内人员合作是主要方式。校内合作方面,武汉大学信息管理学院与其他院系建立的联系较多;同地域合作方面,南京大学信息管理学院与南京理工大学经济管理学院较密切;跨地域合作方面,南京大学信息管理学院与福建师范大学、上海图书馆较密切。
4.3 关键词聚类演化分析
关键词随时间变化的趋势和分布,能揭示不同阶段研究热点的变化和行业发展。“双一流”高校数字人文主题论文共包含628个关键词,其中,频次最高的关键词是“数字人文”,也是主题检索用词之一,频次176次;频次10以上的关键词有两个;频次5-9次的关键词有12个;频次2-4次的关键词有102个;频次1次的有511个。利用CiteSpace软件对关键词进行聚类分析,阈值设置为1,分布模式选择时间线视图(TimeLine View),得到图谱如图5。
图5 关键词聚类时间线
图5 包含13个聚类,反映出“双一流”高校数字人文研究的13个主题。聚类词字号大小代表该类关键词数量多少,序号越小表示该聚类关键词越多;节点圆圈大小代表该关键词在全时间段内的总词频高低,关键词节点所在位置的年份代表其第一次在文献中出现的时间,连线代表其共现关键词及共现年份。
从关键词总体分布来看,自2006年第一篇论文发表后的5年内,并无太多相关研究,此阶段“双一流”高校对数字人文研究的热度较低;2012年,“数字人文”首次作为关键词出现;2013年开始,关键词数量有增加趋势,且近5年新兴关键词涌现,关键词密度明显增大,表明学者对该领域关注度及创新研究明显增加。从聚类词大小来看,知识图谱、图书馆服务、大数据为三大热点主题,各聚类主要关键词及演化过程如下。
聚类#0知识图谱:热点关键词有关联数据、可视化、知识网络等。“知识图谱”首现于2016年,主要研究内容为不同主题研究热点及演化分析[5-6]、人物关系挖掘[7]等;“关联数据”首现于2014年,相关词为“关联爵士项目”和“社会网络分析”,为音乐领域的数字人文研究[7];2016—2019年出现“演化路径”“知识网络”“马克思著作”“融合网络”等词,研究内容与“知识图谱”关联较强;“可视化”首现于2017年,但自2013年开始便有相关研究发表,为词云在内容表达方面的应用介绍[8],2017—2019年,均有可视化相关论文发表,且数量逐年增加。
聚类#1图书馆服务、#3图书馆、#6大学图书馆:这3个聚类主题词都与图书馆有关,热点关键词有移动视觉搜索、数字学术等。“图书馆”关键词最早出现于2014年,是何青芳、姚俊兰[9]的一篇国际会议综述,以敦煌研究、Mapping the Republic of Letters等国内外项目为例,说明图书馆对数字人文的推动作用。“移动视觉搜索”关键词首次出现于2016年,2017、2018年有相关论文发表,主要论述该技术及相关的图像检索、增强现实技术发展现状,及其在图书馆、高校的应用实践与未来方向的思考[10-11]。“图书馆服务”“大学图书馆”“数字学术”关键词首次出现于2017年,与之相关的关键词有“高校图书馆”“科研支持服务”等,研究内容主要为国外数字学术中心、数字人文服务调研,在此基础上总结对国内相关服务提供、中心建设、图书馆角色定位等问题的启示[12-14]。
聚类#2大数据:热点关键词有数据库、历史研究等。该类最早出现的关键词“德国”“TextGrid”首现于2009年,论文介绍了德国将网格技术用于人文科学的TextGrid项目,旨在创建虚拟研究图书馆,为人文科学学者提供文本数据处理发布的工作平台,促进跨学科研究,为中文数据信息的处理、平台建设提供指导[15]。“数据库”首现于2014年,且在2017—2019年有多篇论文关键词出现“数据库”“数据库系统”相关词语,研究内容主要为历史文献、方志、地理信息等专题数据库和特藏资源的建设[16-17]。2017年,首现“量化数据库”关键词,且共现关键词包括“历史研究”“史学方法”,研究指出需构建可量化分析的数据库,而非文献数据库,以用于数据驱动的文史研究[18]。
聚类#4档案学:热点关键词有数字化、档案工作等。该类最早出现的关键词“数字技术”首现于2006年,亦是笔者所有研究中最早出现的。“数字化”首现于2014年,2017—2019年有相关论文发表,研究内容有包含数字化技术的数字人文相关技术与理论探讨[19],也有针对古籍、非遗、图像资源等具体对象的数字化研究方法及思路。2018年,出现“档案”相关的数字人文研究,且在2019年有较多论文发表,共现关键词有“资源整合”“档案工作”“档案服务”“档案资源”等,研究内容包括档案资源的保存、整合、组织与开发利用[20-21],档案工作与数字人文的关系等[22]。
聚类#5知识组织:热点关键词有数字人文、元数据等。“数字人文”首现于2012年,也是笔者研究对象和检索词,与其他各聚类关键词均存在共现关系。“元数据”首现于2016年,共现关键词有“地方历史文献”“史料资源”等,主要为数字人文方法在史料等特藏资源组织、整理、数据化中的应用[23]。
聚类#7文学研究、聚类#8人文学科、聚类#13数字史学:这3个聚类的主题均关系到数字人文研究的对象——人文,及其所涵盖的文学和历史。热点关键词有文本挖掘、人文研究、数据库建设等。“文本挖掘”“人文研究”首现且共现于2012年,前者多次与“文学研究”共现,主要用于特藏资源揭示和数据库建设,并与#13聚类中的“远距离阅读”“文本可视化”共现于2017年关于利用计算机处理文本以帮助文献阅读和理解的论文中[24];后者则多出现于理论问题的探讨中。“文学研究”首现于2016年,且与关键词“远读”共现,可见其为文史研究中的重要技术之一;“人文学科”首现于2016年,主要为相关理论研究;“数字史学”首现于2017年,且与“远距离阅读”共现于关于德语历史文献的数据挖掘研究中[25]。
聚类#9人文计算:“人文计算”首现于2013年,该词是数字人文的概念发源和早期表达,因此,其涉及的论文多为数字人文理论研究,如发展史、研究进展分析等,相关关键词有数字人文发展史、生命周期、教育体系等。
聚类#10美国:“美国”首现于2017年,实际上关于“美国”的研究自2015年便出现了,且在2017—2019年均有相关论文发表。该聚类中的关键词,如案例分析、实践、热点等,主要体现在美国高校及图书馆关于数字人文、数字学术服务实践的调研分析中[13,26]。
聚类#11gis:“gis”首现于2014年,该文列举将地理信息系统(GIS)技术用于历史地理研究、建立历史地理信息系统的案例和可行性,提供空间综合人文社科研究说明[27]。历史地理信息可视化亦是数字人文重要研究方向之一,2017—2019年均有相关论文发表。
聚类#12语义描述:“语义描述”首现于2018年,仅2018、2019年2篇论文包含该关键词,主要内容为图像、人文资源的语义描述研究[28-29],相关关键词有语义组织、图像、人文信息资源等。
5 结论
笔者以“双一流”高校参与撰写的数字人文主题相关论文为研究对象,统计论文发表年份、发文机构、发文期刊类型及学科、论文影响力、主要研究方向,并采用科学知识图谱软件VOSviewer、Citespace绘制作者合著、机构合著和关键词聚类时间线图谱,对“双一流”高校数字人文整体研究层次、所涉学科背景、作者和机构合作模式、核心研究方向和领域进行统计及可视化分析。
研究发现,“双一流”高校数字人文研究起步于2006年,2007—2012年为探索阶段,“数字人文”首次作为关键词出现在论文中;2013—2019年从成长阶段过渡到快速发展阶段,研究数量增幅明显,所涉领域不断扩展。综合类高校为研究主体,发文机构主要为有信息科学学科背景的院系、研究中心和图书馆;发文期刊主要为CSSCI和核心期刊,且信息科学类期刊占比最高;研究影响力较领域平均水平略高,但优势不明显;论文研究方向主要为3类:数字人文研究及发展现状、数字人文应用理论、数字人文项目实践,以理论研究偏多,实践及相关成果不足。同时,通过作者合著分析发现,近一半论文为合著,主要合著模式为:导师-本硕博士生。其次为同领域专家合作、同机构同事合作,较为稳定的合著关系为以南京大学信息管理学院朱庆华为核心的子网络;通过机构合作分析发现,主要合作模式为同机构内合作,其次为校内合作、同地域合作和跨地域合作,跨学科作者、机构合作不占主流;通过关键词聚类时间线分析发现,知识图谱、图书馆、大数据为3大热点研究主题,自2013年开始主题类型有增加趋势,近5年创新研究不断涌现。
据以上结果分析,当前,信息科学为“双一流”高校数字人文主要基础学科,亦是其主要应用学科,说明该领域研究人员对数字人文的思想启蒙、初步实践、推动发展起到关键作用,产生了大量成果与贡献。但未来的发展方向不能局限于此,一方面,应更多考虑到数字人文跨学科特性,推动信息科学类研究人员与人文学科人员间的交流协作,随着数字人文机构的建立、相关服务的开展,信息科学研究人员、研究机构应成为不同学科人员间联系的纽带,并承担起将信息技术、相关研究方法引入人文学科研究实践的责任。另一方面,在数字人文研究网络中的核心高校,应发挥牵头和辐射带动作用,不局限于本机构内合作,打通与校内的人文学院、校际信息科学类学院和数字人文机构的沟通渠道,寻求并扩展合作模式,以帮助建立多样化的项目及实施落地。