APP下载

我国图书馆领域数字人文发展途径分析

2019-03-18何盼盼陈雅

新世纪图书馆 2019年1期
关键词:数字人文知识图谱图书馆

何盼盼 陈雅

摘 要 论文以中国知网、WOS等数据库收录的研究文献为基础,对图书馆数字人文的研究进行述评,以期更深刻地理解其研究成果,为图书馆更深入地参与数字人文的实践提供借鉴。国内研究热点主要为数字人文基本问题研究、图书馆资源建设、图书馆服务与科研支持三个主题。

关键词 图书馆 数字人文 知识图谱

分类号 G250.7

0  引言

伴随着大数据、地理信息系统(GIS)、文本挖掘、信息可视化等现代信息技术的飞速发展,数字人文以其跨学科、跨领域的特点,不断突破学科研究和实践的壁垒和界限,深刻地影响着历史地理、文学、计算机科学、考古等学科领域,在研究方法和研究领域上成为传统人文研究的有力补充和强劲动力。目前,已有超过180多个以“数字人文”命名的研究机构、技术中心或实验室在运行中,也有不少人文学者也以个人或团体的名义从事着数字人文项目的研究[1]。数字人文利用数字工具或思维方式去引入新方法和工具,节省了传统人文学者在文本处理、查找资料、计算等方面低水平重复的时间和精力,并利用数字思维对传统人文领域进行创造性破坏和建设,解答了人文领域的新问题[2]。就图书馆领域来看,数字人文内涵即图书馆界尝试以主体地位去参与探讨并尝试推动、参与和主导数字人文的研究进展、发展方向问题。本文拟针对国内图书馆数字人文的发展途径,从研究热点、发展趋势等几个方面进行梳理和分析,为后期图书馆深入参与研究数字人文提供借鉴。

1  国外图书馆数字人文研究概述

上世纪以来,图书馆数字人文这一研究课题主要集中于欧美等发展国家,国外研究研究主题可分为三方面。

(1)数字图书馆与基础设施建设。Ernesto Priani Saiso认为数字图书馆是数字人文研究的重要基础设施,也是数字人文研究的基础与分析对象[3]。为促进研究出版物和数据的获取再利用的基础设施建立,Buddenbohm等探讨了如何利用质量评估来评估软件的基础结构[4]。Soring提出基于数字工具组合的一体化基础设施 [5]

(2)信息与数据的组织、处理和揭示。文本挖掘是对非结构化的文本信息或人文资料进行深层次挖掘和可视化处理 [6]。美國普瑞特信息与图书馆科学学院的关联爵士项目探索关联数据在数字人文领域中应用,重点关注利用关联数据提升文化遗产文献的可视性 [7]。Leydesdorff 等认为数字人文可被认为是一个实践社区,可应用于大型馆藏,以及以数字格式存档艺术和文学的作品中 [8]。Elaine Toms等利用信息和通信技术,对169名人文主义者的人文概况进行研究[9]

(3)学术交流合作及人文知识传播。布朗大学CDS联合学校的公共人文与文化遗产中心开展面向研究生的“数字学术”课程,而斯坦福大学为在校本科生设立“数字人文辅修专业”,教授学生文本科技、地球空间人文等知识[10]。Poole认为大学图书馆的学术图书馆和数字奖学金中心可以支持数字人文学科和数字奖学金计划 [11]

2  我国图书馆数字人文发展途径分析

数字人文作为新兴的研究领域,起步于2005年,处于持续增长状态。为保证中文检索文献能够全面覆盖数字人文领域的代表性研究成果,笔者选择中国知网收录的学术期刊,采取逻辑关系检索式主题= 数字人文 or 人文计算进行检索,检索时间截止至2018年12月10日,得到371条文献。同时为了解图书馆数字人文领域的相关研究文献,限定学科领域为信息科学与图书馆学,得到文献212条文献。在研究方法上,本文运用陈超美博士开发的科学分析软件Citesapce V及文献分析法对数字人文研究的各方面进行分析。为更加清晰地探讨图书馆领域数字人文发展途径,笔者将从论文数量、研究主题的发展与变化等方面进行分析。

2.1  时区分布

近十多年来,数字人文研究文献整体上呈上升态势,第一篇文章《“超越逻辑”:数字人文的时代特征》于2005年出现在传播领域,文中提出要拒绝“生存的数字化”危机,高扬人文精神的旗帜[12];2011年是数字人文研究的重要转折点,之后的文献量呈持续增长状态。图书馆数字人文研究在2009年前一直处于空白状态,发表于《大学图书馆学报》期刊上的《德国e-Humanities项目TextGrid及其启示》拉开了图书馆领域研究数字人文的序幕,文中介绍了利用网格技术,为人文学者提供一个处理、分析、注释、编辑、链接和发布文本数据的网格工作平台的TextGrid项目[13]。从2012年开始,图书馆领域数字人文研究呈持续增长状态,学者们尝试以多种形式来支持并参与数字人文的研究与实践。

图书馆数字人文研究发展可分为三个阶段。2012年前为萌芽阶段,该阶段关注度不高,但是美国伊利诺伊大学香槟分校图书情报研究生院院长John Unsworth教授在“第三届中美数字时代图书馆学情报学教育国际研讨会”上提出,合格的"嵌入式馆员"须具备统计和计算方法、自然语言处理、语料库语言学、数字人文等多方面的知识,并提供相关知识咨询[14],这为后期图书馆数字人文研究指明了方向。2013-2015年为起步阶段,研究文献缓慢增长,年度文献量基本保持在5~15篇。2016年北京大学图书馆启动数字人文系列活动,包括举办首届北京大学“数字人文”论坛、邀请国内外数字人文学者进行专场讲座等。可以说此次论坛掀起了数字人文研究的热潮,该年学术论文呈突破式增长。随着数字人文研究的深入,此后为图书馆领域的数字人文研究文献数量越来越多,处于高速发展阶段。具体见图1.

2.2  词频分析

通过对关键词数量和词频的处理可反应国内数字人文研究主体的总体分布。在CitespaceV中,导入数据,进行数据格式转换,设置相应参数,时区分割选择2009-2018,单个事件分区的长度设置为一年,主题词来源全部选中,节点类型选择keyword,运行程序,形成相关图谱,并获取关键词351个,为使关键词更具针对性,本文对关键词进行处理,除去高频关键词,合并意思相近或有包含意思的词,并选取词频大于2的关键词,如表1所示。

2.3  知识相关性分析

根据数字人文领域图书馆研究文献高频关键词共现时区图谱(见图2),可了解图书馆数字人文研究的主题变迁与发展途径。2012年以前,数字人文研究出现的关键高频词是数字人文、图书馆员、自然语言处理、知识服务、资源建设、古籍数字化表明我国图书馆关注技术基础和数字化建设等基础问题研究。在起步阶段(2013-2015年),数字人文研究出现了文本挖掘、学术图书馆、开放存取、大数据、数据管理、数据仓储等关键词,更加注重数据的分析组织和处理。近年来(2016年后),该领域出现了数字图书馆、用户信息行为、图书馆服务、科研支持、学科服务、关联数据等关键词,说明我国开始注重研究的应用和影响。其中,数字图书馆、馆藏资源反映了数字人文的研究对象,关联数据、文本挖掘、自然语言处理则描述了数字人文的研究技术和方法,古籍数字化、资源建设等反应了数字人文处理过程。

3  图书馆领域数字人文研究热点与相关性

利用Citespace V绘制数字人文的关键词共现图谱可反映关键词的聚类分析可反映该领域的热点问题,如图3所示,主要有数字人文基础问题研究、图书馆资源建设、图书馆服务与科研支持三大主题。

3.1  基本问题研究

为总体把握数字技术与人文社科之间的关系,楊光探讨了涉及挖掘、组织、开发以及分析资源、研究对象知识本体的数字化研究资源等问题。图书馆要深刻理解数字人文中,必须弄清数字人文的基本理论与方法、相关技术与标准、模式、技术基础与发展趋势等问题[15]。赵生辉、朱学芳认为数字人文仓储的框架集合了人文实体界定、领域本体建模、人文实体数字化采集与归档、跨库信息资源搜集和导入、多元信息资源的知识组织和存储、多维度聚合服务[16]。为推动数字人文研究、教学与实践的发展,王晓光提出国内数字人文学科应发展一般性的研究方法来理解和分析新的数据集合,开展新的学术研究、创新人文科学的研究方法和研究范式[17]。刘炜、叶鹰认为数字人文技术体系主要包括数字化技术、数据管理和分析技术、可视化技术、机器学习技术等,而其理论结果涉及结构化或再造人文、数据化或计算人文、可视化或形象人文、智慧化或扩展人文、应用覆盖资源富集、知识重构、增强技术等,因而由数字人文技术体系和理论结构组成的方法共同体呈现出跨学科和跨界融合现象[18]。马丽君则认为未来图书馆数字人文服务服务正向嵌入式学科服务、集成化知识服务、数据分析服务这三种模式转变[19]

3.2  资源保障研究

作为文献资源保障中心的图书馆可利用其自身资源和技术优势,积极地投入数字人文实践。杨光认为图书馆资源渐趋数字化,但传统资源很少触及深层次方面的应用,为保障资源的发掘、组织以及开发等方面的应用,必须实现资源的整合[15]。而对于馆藏资源和文化遗产的数字化,付跃安提出从资源建设、文本建设、资源组织、数据加工、服务与版权五方面来进行图书馆地方文化遗产的数字化建设[20]。其中,具有内外均衡的人文数字生态系统的基础设施对于技术和人文研究的可持续发展是具有重要作用的。为支持人文研究,刘炜,谢蓉认为基础设施建设应具备全球范围内与研究主体相关的所有文献、数据、相关软件工具、学术交流和出版的公用设施及相关服务等条件[21],并开发设计出数字工具来解决传统问题,并尝试将非人文领域的数字工具引入到数字人文中[22]。同样地,为更好服务于图书馆数字人文实践,馆员需从数据管理者、资源的发现与整合者、跨学科的知识传递者、内容的传播者与推广者、基础设施建设者这5个方面积极学习和探索[22]。除拥有相关学科的背景知识以外,张舵,吴跃伟指出图书馆员还应掌握数字技术、计算机技术,要求其在文本数字化、数据管理、数据库建设、数据保存等方面发挥独特作用,并创建新的学术资源为用户提供高质量的知识服务转化[23]

3.3  科研与服务支持研究

作为在数字技术与人文研究环境下衍生出的一项跨学科的科学研究与实践活动,曾小莹指出,“图书馆具有成果传播与知识普及、项目支撑与辅助功能,并提供嵌入式学科服务、数据分析服务、成果运行及应用功能”,并呼吁寻求其图书馆数字人文服务新的增长点[24]。以北京大学图书馆“数字人文”实践为案例,朱本华,聂华认为图书馆很好地充当了跨学科的桥梁,充当了数字人文项目的孵化器[25]。另外再以以上海图书馆的“上川明经胡氏”和“胡广填四川”为案例,展示了关联数据技术在数字人文研究中的作用和方法,是面向知识发现的数字人文服务,反映了数字图书馆建设到一定规模后的必然趋势[26]。赖永忠认为图书馆具备逻辑的统一性和现实逻辑的可行性,主要包括面向数字人文的科研咨询与导航服务、资源获取与推送、科研数据管理、科研支持工具、科研共享空间、学术传播与出版、科研影响力评价、科研人员教育方面的科研支持内容[25]。汪东升,王瑛帆认为高校图书馆在数字人文研究方面具有馆藏和知识优势、促进研究和发现的技术优势、推动跨学科交流和校内合作的协作优势、提供项目申请和资助技术的筹资优势,为推动学术交流,满足数字化的研究需求,高校图书馆可提供数字学术服务,其中学术出版服务起重要作用[27]

“数字人文”背景下的人文研究呈现出数字化的研究对象、多学科化的研究团队、智能化的研究方法和多样化的研究范式等特征[28]。图书馆可通过引入数字人文理念和技术来拓展数字人文特藏传播服务,提供数据管理服务来深化信息服务层次,弘扬人文阅读来创新经典阅读推广服务,进而强化图书馆文化传承功能和影响力[29]

4  我国图书馆领域数字人文研究与发展着力点

我国图书馆数字人文研究起步较晚,研究氛围不浓厚,研究深度和层次仅仅停留在简单的服务与支持层面。多数国内学者在研究过程中可能在遇到资源碎片化、数据的获取和开放受限等问题时,对数字人文的认识和理解理解深度不够,在一定程度上阻碍了资源的交流和学科领域的互动协作,其相应概念、内涵与外延等基本理论问题尚未达成一致,同时也缺乏相关数据的分析、解读等技能,研究方法掌握不多,对研究的整体把握有一定偏差。因此,在对数字人文研究过程中,应突破辅助支持型服务模式限制,突破文字类史料等结构化资源处理限制,树立跨学科思维和视角,善于通过数字技术的应用窥见人文学科的涉及范围,厘清相关人文学科的融合脉搏,有效推动人文学科的研究和实践[30]

4.1  营造数字人文氛围

从国家政策、机制、图书馆等方面营造图书馆数字人文的氛围。为夯实数字人文研究的数据基础,实现数据获取和开放,圖书馆要提高自身的资源储备量,构建出数据化馆藏资源体系,开放已有的利用率不高的数据库和语料库资源,也可借助搭建的数字人文交流平台和联盟分担购买资源的费用,或对开放项目建设的过程和成果进行经验交流分享。国家制定数字人文发展规划,设立数字人文基金,鼓励搭建以图书馆为中心的交流共享平台,吸引各领域人文学者参与,并建设学习社区,鼓励教师、学者进行学术对话,开展互助协作。图书馆需培养数字人文馆员,利用其自身“中介性”“学术性”“社会性”的属性,积极推广普及数字人文知识,提供咨询服务,为数字人文研究者提供专业知识和技术培训,提升数字人文素养。建立完善的保障机制,并促使指导性和规范性的制度机制、交流及合作的协同关系机制、科学规划及高效治理的管理机制、提升认可度以及品牌价值的营销机制、质量及效益的评估机制等方面的创新,保证长效稳定的配置。图书馆可分类收集整理全球范围内的人文研究数据库、工具软件或平台信息,并讨论发布相关新闻、资讯等,方便更多用户关注了解。

4.2  助力数字人文创新研究开展

鼓励、倡导和动员全社会参与,广泛吸收社会资金,推广数字人文知识和成果,推进数字人文研究和实践。借鉴国外基金会的经验,建立数字人文项目资助体系,除受国家自然科学基金和人文社会科学基金资助外,可吸引私人资助数字人文项目[31]。例如可与博客、网络出版平台等合作,引入专业化设备、工具和软件,为数字人文提供免费的数字出版服务,通过延伸服务增强其可用性。与数据商合作,以外包形式委托数据商开展数据分析工作,但图书馆在外包合作中需要参与数据管理、项目流程等的监管工作,以此逐渐积累总结项目实施和管理经验。借鉴大数据处理经验,参考编辑出版部门或数据分析公司对非文字资料的处理成果,跨学科思维和视角地挖掘和开发、处理非结构化数据。从自身学科立场出发,突破自然社会科学、人文科学与艺术、应用工程的局限,并综合地结合其他学科领域的研究方法和途径进行研究,实现研究层面的资源最大化、分析方法的最大通约化和知识内容的最大综合性[32]

4.3  促进国际交流与协同合作

图书馆要实现开放战略,与高校、科研中心、国家数字基础设施等多个组织和机构积极开展合作,依据服务对象的需求定制个性化的数字人文服务。鼓励各高校及科研单位、私人、企业加入研究队伍,其中与经济和社会发展相关的具有市场前景的领域,鼓励企业和私人参与并推动向市场化、产业化方向发展。与计算机语言学、历史地理学、社会科学、出版学等学科共建数字人文协同研究中心,达到一定规模后可组建数字人文中心联盟。尽可能参与到国外项目共建工作之中去,并邀请国外专家帮助进行技能及项目管理经验培训。与出版商、传媒公司等合作,可委托承担部分数字人文知识和研究成果的宣传、传播、推广工作。与书店、商业机构合作,打造集学习、文创商品、共享书店、电影院、画廊、音乐、摄影等的多元创新数字空间,组建“业余”人士和人文学者的数字实验室,即可吸引公众了解关注并参与实践,以多元思维方式开展项目。

5  结语

数字人文的发展给图书馆带来了机遇,更引来了挑战,尽管目前图书馆数字人文研究实践尚处在探索阶段,但只要做好准备工作,发挥自身优势,不断突破辅助支持型服务的限制,以主体地位创新地参与数字人文研究和实践,促进跨界跨国交流和协同合作,营造良好的数字人文氛围,图书馆就能不断促使其数字人文向更深更远方向发展。

参考文献:

[1]朱本军,聂华.数字人文:图书馆实践的新方向[J].大学图书馆学报,2017,35(4):23-29.

[2]朱本军,聂华.跨界与融合:全球视野下的数字人文:首届北京大学“数字人文论坛”会议综述[J].大学图书馆学报,2016,34(5):16-21.

[3]SAISO E P. Finding support for disruption:developinga digital humanitiesproject in Mexico [J]. Aslib Proceedings,2012,64 (1):97- 103.

[4]BUDDENBOHM S, MATONI M, SCHMUNK S, et al.Quality assessment for the sustainable provision of software components and digital research infrastructures for the arts and humanities[J].Bibliothek Forschung Und Praxis,2017(41):231-241.

[5]SORING S.Technical and infrastructural solutions for digital scholarly editions: dariah-de and textgrid[J].Bibliothek Forschung Und Paraxis,2016(40):207-212.

[6]Jesuit Libraries Project[EB/OL].[2018-05-17].https://luc.edu/ctsdh/researchprojects/jesuitlibrariesproject/.

[7]Linked Jazz: Building with Linked Open Data[EB/OL].[2018-05-17].https://er.educause.edu/articles/2014/6/linked-jazz-building-with-linked-open-data.

[8]LEYDESDORFF L,SALAH A A A. Maps on the basis of the arts & humanities citation index: the journals leonardo and art journal versus “digital humanities” as a topic[J].Journal of the American Society for Information Science and Technology,2010(61) :787-801.

[9]TOMS E G,O'BRIEN H L.Understanding the information and communicationtechnology needs of the e-Humanist [J].Journal of Documentation,2008(64):102-103.

[10]张小溪.美国大学生成立数字人文辅修专业[EB/OL].(2016-01-18)[2018-05-17].

http://www.cssn.cn/bk/bkpd_qkyw/bkpd_gdxw/201601/t20160118_2831339.shtml.

[11]POOLE A H.The conceptual ecology of digital humanities[J].Journal ofDocumentation,2017(73):91-122.

[12]曾勤.德国e-Humanities项目TextGrid及其启示[J].大学图书馆学报,2009,27(4):71-74.

[13]廖祥忠.“超越逻辑”:数字人文的时代特征[J].现代传播,2005(6):23-25.

[14]约翰·安斯沃斯.Challenges in educating 21~(st)-century information professionals[J].图书情报知识,2011(1):24-28.

[15]杨光.数字人文背景下图书馆资源整合策略与应用研究[J].河南图书馆学刊,2015,35(10):7-9.

[16]赵生辉,朱学芳. 数字人文仓储的构建与实现[J].情报资料工作,2015(4):42-47.

[17]王晓光.数字人文: 概念、现状与思考[EB/OL].[2018-05-17].http: //meeting. lib. szu. edu. cn/conference/zh-hans/infomation? v=07000003.

[18]劉炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41.

[19]马丽君.浅析数字人文背景下图书馆服务的模式转变[J].河南图书馆学刊,2016,36(7):87-88.

[20]付跃安.图书馆地方文化遗产数字化研究[J]. 图书馆论坛,2016,36(11):27-36.

[21]刘炜,谢蓉,张磊,等. 面向人文研究的国家数据基础设施建设[J]. 中国图书馆学报,2016,42(5):29-39.

[22]李洁.数字人文背景下图书馆员角色转换[J].图书馆研究与工作,2017(10):26-30,37.

[23]张舵,吴跃伟.国外图书馆支持数字人文的实践及启示[J].图书馆杂志,2014,33(8):47-52.

[24]曾小莹. 数字人文背景下的图书馆:作用与服务[J].图书与情报,2014(4):111-113.

[25]赖永忠.面向数字人文的图书馆科研支持服务研究[J].图书馆工作与研究,2016(10):28-32.

[26]夏翠娟,张磊.关联数据在家谱数字人文服务中的应用[J].图书馆杂志,2016,35(10):26-34.

[27]汪东升,王瑛帆.高校图书馆数字人文服务策略研究[J].山东图书馆学刊,2016(5):67-70+84.

[28]张诗博.“数字人文”背景下的图书馆知识服务[J]. 晋图学刊,2013(5):40-42,53.

[29]熊莉君,张福阳,张灿.图书馆在数字人文领域的传播功能与服务研究[J].图书馆,2016(2):88-93,99.

[30]柯平,宫平.数字人文研究演化路径与热点领域分析[J].中国图书馆学报,2016,42(6):13-30.

[31]朱华顺.美国图书馆数字人文案例研究及启:以布朗大学、纽约公共图书馆为例[J].国家图书馆学刊,2016,25(6):58-63.

[32]徐力恒. 我们为什么需要数字人文[N].社会科学报,2017-08-24(005).

何盼盼 南京大学信息管理学院2017级硕士研究生。江苏南京,210046。

陈  雅 南京大学信息管理学院教授、博士生导师。江苏南京,210046。

(收稿日期:2018-04-07   编校:曹晓文)

猜你喜欢

数字人文知识图谱图书馆
图书馆
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
去图书馆