APP下载

中美档案数字人文项目比较研究

2019-03-20刘晋如

档案管理 2019年2期
关键词:数字人文

刘晋如

摘 要:本文通过对中美档案馆、图书馆和高校数字人文科研机构相关网站的调研,从研究主体、项目类型和技术应用方面介绍和归纳了中美代表性档案数字人文项目,进而对比中美档案数字人文项目的差异,并建议从档案数字人文观、跨界合作、人才培育三方面推进我国档案数字人文项目的深入发展。

关键词:数字人文;档案项目;人文项目

Abstract:Through the investigation of the websites of Chinese and American archives, libraries and digital humanities research institutions, this paper introduces and summarizes the representative humanities and Chinese digital files in the research subjects, project types and technology applications, and then compares the Chinese and American archives figures. The differences in humanities projects, and suggestions for the in-depth development of China's archives digital humanities projects from the three aspects of archival digital humanities, cross-border cooperation and talent cultivation.

Keywords: Digital humanities; Archive project; Humanities project

1 緒论

随着信息技术的发展,人文研究和信息领域的交叉融合越来越明显,信息服务于人文研究的方式发生变化,关于数字人文的研究日趋兴盛。数字人文是指将人文研究所需的信息资源结合数字技术以一种全新的形式服务于人文学科的研究方法,也可以理解为按照人文研究的需求设计信息数字形态的技术手段。数字人文经历了一个由低级到高级的发展阶段,目前的数字人文更加强调数据的整合、关联、挖掘,是一种数据驱动型的科学研究范式。

档案作为人文研究的重要信息资源,毋庸置疑地成为数字人文项目的重要开发对象。但是目前档案界关于数字人文的研究数量很少,处于探索阶段。以“档案”并含“数字人文”在中国知网进行篇名检索,检索时间为2018年12月15日,得到相关中文文献6篇。赵生辉介绍了国外档案领域数字人文项目的概况、特点及对我国的启示;董聪颖以威尼斯时光机为例说明了数字人文对档案信息资源开发利用的影响,并从宏观、中观、微观三个层面提出了促进数字人文在档案信息资源开发中的应用;李子林、王玉珏、龙家庆指出了数字人文与档案工作的相互关系以及数字人文背景下档案工作发展的新思路;吴加琪提出了档案工作参与数字人文建设的必要性以及档案工作在数字人文中的参与机制和保障措施。相关研究大多是探索档案工作与数字人文的关系及其参与;数字人文在档案信息资源开发中的应用;国外数字人文项目的介绍与启示。

由此可见,目前有关研究缺乏国内档案数字人文实践和项目的介绍。数字人文中心是数字人文实践的基地和展示窗口,数字人文的实践需要集合各方面的资金、技术、人才,许多数字人文中心相继成立。“国际数字人文中心网络(center-Net),自2007年4月成立以来,已将来自19个国家约100个中心的200多名成员加入国际数字人文中心目录。”[1]全球各个数字人文中心运行方式基本都采用项目制。美国是数字人文实践的先驱,占据全球数字人文中心的半壁江山。对中美档案数字人文项目的调查和比较,最能直观、客观地体现国家数字人文档案实践的发展水平,进而从中寻找差距,借鉴经验,结合国情采取切实可行的改进方法。

2 概念界定

2.1 数字人文。“数字人文源于20 世纪40 年代出现的人文计算( humanities computing) ,最初着眼于计算语言学和文本资料的数字化,随后被应用于众多人文学科领域。”[2]“2001年《数字人文指南》出版后,数字人文一词逐渐代替了人文计算,作为一个新的研究领域,在2009年的语言协会年会(the Modern Language Association)上,获得了北美文学界的承认。”[3]首先,数字人文是一项跨学科研究。“数字人文是将数化工具和技术(包含数字化、数据管理、数据分析、可视化、虚拟现实等技术)应用于传统人文学科的一项跨学科研究,涉及语言、文学、历史、艺术、文化人类学、考古学、哲学等众多人文社会科学领域。”[4]此外,数字人文是一种新的研究范式。“数字人文是指结合各种数字化材料,借助电脑的分析能力开展的人文研究。”[5]“数字人文以数据密集型计算为基础,改变了传统人文社会科学的研究范式,从定性到定量辅助加定性,为人文研究提出问题、界定问题和回答问题提供新的视角。”[6]综上所述,数字人文的内涵随着数字技术发展不断深化,数字人文已经从开始的数字化文本服务人文研究转变为基于数据密集计算服务人文研究。运用数字技术和工具实现以数据驱动人文研究的跨学科研究范式。这是问题驱动范式向数据驱动范式的转变,通过数据驱动人文研究,侧重发现而非解释的人文研究方法。

2.2 档案数字人文项目。数字人文的实践成果往往以项目的形式体现。“项目是指一系列独特的、复杂的并相互关联的活动,这些活动有着一个明确的目标或目的,必须在特定的时间、预算、资源限定内,依据规范完成。”[7]从条件来看,档案数字人文项目是运用数字人文技术,利用档案资源为解决某一主题的人文问题形成的一系列有联系、有条件(实践、资源、预算)限制的活动。从内容看,档案数字人文项目是数字人文项目的一种,是指利用数字技术和工具对档案资源进行整合、加工从而服务于人文研究的项目。档案资源是一个宽泛概念,不局限于档案馆藏,还包括其他企事业单位、行业机构和散落在个人手中的档案。数字人文的内涵随着数字技术的发展不断演化,可分为数字化人文——数据化人文——可视化人文三个发展阶段,也可看作档案数字人文项目的三个层次。分别是指利用档案数字化信息、档案数据化信息和档案可视化信息服务人文研究,三者逐层递进,都可视为档案数字人文项目建设的内容。

3 中美档案数字人文项目比较

3.1 项目研究主体。中国档案数字人文项目的研究主体较为分散。除我国台湾外,我国其他地区为数不多的数字人文中心目前并未开展专门的档案数字人文项目。中国档案数字人文项目一般由图书馆、档案馆、高校科研机构分别开展。如中国国家图书馆的“中国记忆”项目、上海图书馆开放数据平台中的“盛宣怀档案知识库”和“名人手稿档案库”、天津市档案馆的“津沽史料”项目、上海市档案馆的“上海记忆”项目、青岛市档案馆的“老青岛”项目、中国人民大学人文北京研究中心开展的“北京记忆”项目、台湾大学数位人文研究中心的“大型数位典藏”项目。图书馆、档案馆的档案数字人文项目一般由档案馆、图书馆提供档案资源并提出项目需求,外包给信息技术公司完成。高校的档案数字人文项目由高校数字人文科研中心、政府、企事业单位或个人合作完成。中国人民大学人文北京研究中心是中国人民大学与北京市政府合作组建的专门进行“人文北京”课题研究的校属跨学科研究机构。台湾大学数位人文研究中心设置的咨询委员会的成员由校内图书馆馆长及计算机资讯网络中心主任及聘请的校内外相关专长领域人士共同构成,同时根据研究发展需要聘请校内外学者专家为特约研究员。

美国档案数字人文项目的研究主体较为集中,大多由高校数字人文中心进行研究。如,美国普林斯顿大学数字人文中心提供莎士比亚书店内书籍流通和名人借阅情况的“莎士比亚书店”项目、密歇根州立大学数字人文与社会科学中心提供奴隶身份信息开放数据库的“奴隶传记”项目、布朗大学数字学术中心转录和翻译碑文文字并提供数字化开放利用的“以色列碑文”项目、斯坦福大学空间与文本分析中心关于追溯旧金山城市规划史的“想象中的旧金山”项目。截至2017年6月,数字人文合作组织“数字人文中心网络”(center-Net)所收录的数字人文中心已达192个,覆盖32个国家和地区,其中一半以上来自美国。[8]美国高校数字人文中心的成员构成可从两个角度划分。按照职责范围划分,包括:项目负责人、项目管理员、项目研究员、项目执行人员、项目咨询委员会。按照专家系统划分,包括:专业学科专家、计算机系数字技术专家、专业科学馆员以及其他相关人员。如“布朗大学数字学术中心的专家包括:社会科学数据专家、数字人文专家、数字技术顾问、GIS专家,还包括其他高校中心专家和擅长文本挖掘等技术的跨学科人才”。[9]高校数字人文科研中心集结了高校内外的信息技术人才和资源支持,因此具备开展优质档案数字人文项目的条件。

3.2 项目类型。中国档案数字人文项目的类型较单一,以档案数字历史文化项目为主。受中国历史文化的影响,中国特别注重历史档案的保存,加之公众文化需求的日益增长,中国档案数字人文项目大多服务于史学研究和文化传播。中国国家图书馆的“中国记忆”项目是“整理中国现当代重大事件、重要人物专题档案,并通过在馆借阅、在线浏览、多媒体展览、专题讲座等形式向公众提供服务的档案资源建设与服务项目”。[10]通过口述档案、影像档案,手稿、信件、照片和實物档案的收集和采集,形成多载体、多种类的专题档案资源集合,包括我们的文字、中国年画、丝绸刺绣、东北抗日联军等专题。中国人民大学人文北京研究中心的“北京记忆”项目是一个北京文化大型数字平台,融合北京城市多维文化的档案资源,囊括了铁路、饮食、建筑、艺术等专题,对京城文化进行数字化展示与传播,满足北京文化研究者资料获取和信息查询需求。“上海图书馆开放数据平台中的盛宣怀档案知识库包含了盛宣怀家族自1850至1936年间的日记、文稿、信札、电报、账册、电文、合同、章程等17.5万件档案,内容涉及政治、经济、社会、军事、外交、金融、贸易、教育各方面,是研究中国近代史的档案宝库。”[11]

美国档案数字人文项目的类型多样,包括档案数字史学项目、档案数字文学项目、档案数字地理项目、档案数字文物项目、档案数字社会学项目。美国档案信息环境和信息思维较为开放,并且数字人文中心的建立使得美国档案数字人文项目具备相关领域的专家和相应的技术资源条件。如,美国普林斯顿大学数字人文中心的“重建过去”项目,通过对破损文物建筑的档案记录进行数字化,并搜集相关建筑的文本、图片和其他材料属性描述信息,开发一个用于文物建筑遗址VR模型重建的建筑材料数据库。哈佛大学地理信息中心的“漫步伊甸园”项目,是根据普利策奖获奖作家保罗·萨洛佩克的档案记录结合地理信息系统绘制的反映人类迁移路径的空间档案地图。该作家在全球范围内行走了人类的迁徙之路,并通过文字、照片、音频和视频记录了他的所见所感,哈佛大学地理信息中心将其行程中的GPS数据绘制成地图,并将其所生成的档案信息融入其中,提供可视化图像,在地图上使用富勒投影和光谱着色来说明人类通过这条路径的行程距离和时间。这些项目通过档案数据的跨学科融合,拓宽了档案数字人文项目的服务范围,从文史学延展到地理发现、文物保护甚至社会学问题的研究。

3.3 技术应用。中国档案数字人文项目以数字化技术为主。数字化技术是构建数字人文资源的基础,包括扫描技术、OCR文字识别技术、多媒体技术等。国内通过对实体档案的扫描以人文项目形式建立了大量人文主题的专题档案数字资料库,包括文本档案资料库(全文数据库、目录数据库)和多媒体档案资料库。中国国家数字图书馆项目已经建设了馆藏甲骨实物与拓片数字化资源库、敦煌遗珍数字化资源库、馆藏年画数字化资源库等多个数字人文资料库。一些综合档案馆也在档案信息网站中设置了专题档案数字化资源库,通过数字化的文本、照片、音频、影像反映城市历史文化。如上海档案馆的“上海记忆”、天津市档案馆的“津沽史料”、青岛市档案馆的“老青岛”等。还有一些资料库实现了检索功能和检索结果的优化。“台湾大学数位人文研究中心目前已建立了35个大型数位典藏资料库,内含超过600万份全文资料、近3000万幅影像、4亿字的全文、数百小时的影音资料,开发了20多种信息检索和分析工具。”[12]其中大多是一手的档案史料,包括台湾文化资料库、日治法院档案资料库、台湾旧照片资料库等。这些档案资料库通过档案元数据的著录,运用资讯勘探分析工具和分类、统计方法分析并呈现档案材料中的关系型脉络,优化线索方式,如在台湾文化库中可进行关键词检索、时间轴检索、分类检索、地图检索。

美国档案数字人文项目以数据技术为主。“数据技术包括本体技术、语义万维网技术(包括关联数据)等专门针对知识单元(语义单位)的数据管理技术;文本分析(词频分析、共现分析、关联关系分析等)、内容(主题)分析、时序分析、空间分析、社会关系分析等数据分析技术;可视化技术、人机交互技术等数据展示技术。”[13]通过数据技术可以构建档案知识库即提供知识服务的结构化数据库,实现文本的内容分析、时空分析、历史人物的社会关系分析,并以可视化的形式直观展现档案数据的内在联系。可视化是指通过聚合和提取来展示数据的方法,可分为统计可视化、文本可视化、地理可视化。美国斯坦福大学图书馆和法国国家图书馆合作开发的“法国革命数字档案馆”项目,通过档案类别、数量和时间的量化分析和数据关联,在选择不同的检索类别时,在可视化图表中可实时观察相关档案在不同时间点的数量的变化,确定某一检索条件下档案的年代分布和数量多寡。美国内布拉斯加大学林肯分校数字人文研究中心开展的“铁路与现代美国的形成”项目,对大量铁路公司的员工信件、商务合同、薪资记录、旧照片等历史档案进行数字化,创建了铁路工人数据库,并通过文本分析、数据关联技术进行统计和挖掘,绘制了铁路工人时空变化分布地图。这种基于档案数据关联和分析的可视化直观高效地提供了档案背后的知识,为人文研究提供了新的研究思路。

4 对我国档案数字人文项目建设的启示

4.1 档案工作者要树立正确的数字人文观。首先要加强档案工作人员的数字人文意识,主动参与档案数字人文项目建设。目前国内具有代表性的档案数字人文项目都是图书馆和高校发起的,如上海图书馆的上海年华项目、中国人民大学的北京记忆项目、中国国家图书馆的中国记忆项目等,国内档案领域的数字人文项目案例较少。这些项目依托综合图书馆和高校档案馆馆藏开展,档案资源有限且缺乏档案专业人才的指导。档案馆拥有丰富的档案馆藏资源,应主动发起和参与数字人文项目。档案馆员对于社会档案需求和档案价值有更加专业的把握,由档案馆牵头发起档案数字人文项目更易全面整合相关档案资源,挖掘馆藏档案资源的深层价值。此外,档案馆在开展数字人文项目时要树立正确的数字人文观念。数字人文不等于数字记忆,数字人文强调数据驱动人文研究,仅仅通过档案数字化和检索方式的升级无法实现。档案工作者要树立持续发展的数字人文理念,不能止步于档案数字记忆的留存和人文研究的查询服务,要充分运用数字人文相关技术建立量化数据库,融合地理信息系统等相关专业领域,实现档案数据对人文研究的可视化服务和知识服务。

4.2 加强跨领域、跨国际的交流合作。要加快档案领域数字人文中心建设,整合国内档案数字人文领域的数据、人才、技术、资金等资源。目前国内档案领域数字人文项目存在高校科研机构、图书馆和档案馆各行其是的现象,不利于资金、人力、物力的集中,容易导致数据标准不统一,项目质量参差不齐,造成资源浪费、重复建设。档案数字人文项目除了需要档案、图书、人文、信息技术等各个领域的专家学者共同筹谋,还可借助网络平台,以众包模式发动公众参与档案数字人文项目。“盛宣怀档案抄录”项目是上海图书馆2017年启动的在线众包抄录平台。上海图书馆收藏的盛档记录大多是书信形式的繁体手写稿,因年代久远而字迹模糊,OCR识别困难,加之数量巨大,仅靠专业人员难以完成数字化工作。因此,上海市图书馆集结社会智慧与力量,招募业余爱好者参与盛档的元数据和全文数字化抄录和标注,完成提交后由图书馆专家进行质量審核。同时,要加强与国外数字人文中心合作,解决技术难题和档案资源流失海外的问题。如浙江大学和哥伦比亚大学合作的“甲骨文数字化”项目,北京大学、哈佛大学费正清中国研究中心、中央研究院历史语言研究所等多所高校和研究机构共同主持的“中国历代人物传记资料库”项目等。[14]通过与国际间、行业间、民众间的合作,可以减少技术、资源阻力,提高档案数字人文项目的质量。

4.3 加快档案领域数字人文人才的培育。档案数字人文项目开展的前提是档案数据的齐全完整,档案数据库的建设与维护相当于档案数字人文项目的前端,这对于档案工作者的业务技能和知识储备都提出了更高的要求。档案数字人文项目的跨学科属性决定了数字人文项目团队的多样性,需要人文专家、信息技术专家、图书档案专家、项目管理专家等结构多元的专家团队。但是从我国的现实情况来看,大多数档案馆员的知识结构和档案数字人文项目的专家结构都比较单一。因此,要积极推进档案馆员的数字人文人才培育工作,培养档案馆员跨学科研究的能力,关注数字人文技术的学习和数字人文工具的使用。如,北京大学图书馆开设的“数字人文工作坊”,旨在激发计算机等信息科学领域师生人文研究的兴趣、充实人文和社会科学领域师生的数字技术知识,并促进二者的协调互动与跨界融合。通过邀请数字人文学者作专题讲座,就人文和技术的某些专题进行交流和讨论;对学员开设社会网络分析软件培训课程;以建立“数字人文”社交网络群等方式进行数字人文技术传播与分享,营造数字技术与人文结合的学术氛围。

参考文献:

[1]centerNet.Centers[EB/OL].[2018-11-13].http://dhcenternet.org/about.

[2][8]林泽斐,欧石燕.美国高校数字人文研究项目研究内容解析[J].图书情报工作,2017(22):52-58.

[3]宋丹丹,戴凡,王安萌,周晓红.国内图书馆数字人文研究综述[J].晋图学刊,2017(5):74-78.

[4][12]金玲娟.我国图书馆数字人文服务现状、障碍与对策研究[J].图书馆工作与研究,2018(9):15-20.

[5]梁晨.量化数据库:“数字人文”推动历史研究之关键[J].江海学刊,2017(2):162-164.

[6]朱本军,聂华.跨界与融合:全球视野下的数字人文——首届北京大学“数字人文论坛”会议综述[J].大学图书馆学报,2016(5):16-21.

[7]百度百科[EB/OL].[2018-11-13].https://baike.baidu.com/item/%E9%A1%B9%E7%9B%AE/477803?fr=aladdin.

[9]邓要然,李少贞.美国高校数字人文中心调查[J].图书馆论坛,2017(3):26-34.

[10]中国国家图书馆.中国记忆项目实验网站[EB/OL].[2018-11-13].http://www.nlc.gov.cn/cmptest/.

[11]上海图书馆.盛宣怀档案知识库[EB/OL].[2018-11-13].http://sd.library.sh.cn/sd/home/index.

[13]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017(5):32-41.

[14]邓要然.美国图书馆领域数字人文项目研究[J].图书馆工作与研究,2017(8):29-35.

(作者单位:上海大学图书情报档案系 来稿日期:2018-12-20)

猜你喜欢

数字人文
图书馆未来的技术应用与发展
数据驱动下的高校图书馆数字人文服务研究
汉传佛教文化遗产数字化建设现状调查与特征分析
数字人文2011—2016年研究综述
数字人文时代公共图书馆经典阅读推广研究
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究