APP下载

中美档案领域数字人文项目比较研究

2019-12-16靳文君安徽大学管理学院

浙江档案 2019年4期
关键词:人文数字历史

靳文君/安徽大学管理学院

近年来,我国已有学者对国内外档案数字人文项目进行了研究,如董聪颖从档案信息资源开发角度研究国外档案数字人文项目对我国的启示[1];蔡迎春通过研究国内数字人文项目和案例,认为我国数字人文项目主要集中在古籍、文学、艺术、档案等人文领域,其他领域关注度并不高[2];赵生辉通过分析国外档案领域数字人文项目运行和管理特征,提出推动我国项目发展的四点措施[3]。目前对中外档案领域数字人文项目实践的综合比较还比较少。笔者利用网页调查法对中美档案领域数字人文项目(各选20项)进行对比,厘清异同点,以借鉴美国档案数字人文项目的有益经验。

1 档案数字人文项目依托机构

1.1 中国

我国档案数字人文项目主要依托高校数字人文中心、公共图书馆、档案馆及博物馆,具有以下特点:第一,高校数字人文中心是目前档案数字人文项目的主要承担机构,约占65%,能为档案数字人文项目提供资源基础及人才技术保障。第二,独立承担和联合协作模式并存,如“图文关联”标记系统项目主要由武汉大学数字人文中心承担[4],“数字敦煌”项目由中国科学院计算机研究所、武汉大学、浙江大学以及敦煌研究院联合承担[5],“中国历史人物传记资料库(CBDB)”项目则由哈佛大学燕京学社、中研院历史语言研究所、北京大学中国古代史研究中心等机构共同负责。

1.2 美国

美国档案数字人文项目大多依托高校专业学科数字人文研究中心,与特定技术或学科联系密切。第一,项目依托机构一般成立时间较早,档案数字人文项目发展成熟。美国布朗大学数字学术中心早在1994年就已成立,是布朗大学多个数字人文项目的孵化器[6]。第二,项目依托多元化的机构组成人员,为档案数字人文项目发展提供技术保障和人文学理基础。如弗吉尼亚大学的“影谷项目(The Valley of Shadow)”,前后约有82人参与其中[7];斯坦福大学空间与文本分析中心核心研究团队(CESTA),包括“人文+设计”、文学实验室、诗歌媒体实验室、“空间历史项目”等6个核心研究团队,合作推动数字人文项目[8]。第三,独立高校包含多个数字人文中心,这些数字人文中心将人文社会科学与信息技术进行深度融合。

1.3 中美比较

两国相同点体现在:第一,都主要依托高校数字人文研究中心。第二,都比较重视档案数字人文项目合作,都与公共图书馆、档案馆以及博物馆进行合作。第三,独立专有的档案数字人文项目中心都比较少,多依托档案数字资源,进行文本的挖掘分析、关联数据库的构建和可视化研究工具的开发。

两国不同点体现在档案数字人文相关研究中心成立时间、数量及核心团队组成等方面。第一,美国档案数字人文项目依托机构普遍建立较早,在20世纪90年代已有高校筹划成立数字人文研究机构。直到2011年,武汉大学才成立了数字人文研究中心,该中心的成立是我国数字人文中心建设起步的标志。第二,美国档案数字人文中心的数量远超我国。第三,美国数字人文中心发展规模相对健全,不少高校已建立了不同学科领域的数字人文中心,包含了多个核心团队。我国档案数字人文中心目前虽初具规模,但核心团队主要由高校相关学科的专家和学生组成,变动性比较大。

2 档案数字人文项目实践方式

2.1 中国

当前我国档案数字人文项目实践方式呈现多样化特点,主要有六种:第一种为早期的古籍数据库项目(3项,占15%),多是在历史古籍文献数字化基础上发展来的,“中国基本古籍库”[9]、“国学宝典”等都是此类代表[10]。第二种GIS历史地理可视化(5项,占25%),主要是将实际地理空间和档案历史文献资料互相关联,按照主题以多维模式展现。“中国历代人物传记资料库”即是采用GIS技术将唐代至清代四十多万人的传记资料清晰地呈现在地理系统中[11]。第三种是非遗数字资料库(1项,占5%),将文本、照片和视频资料进行数字化,按照不同主题对信息进行处理和呈现。“数字敦煌”项目就是对敦煌石窟和文物进行数字化处理,将非遗信息资源进行可视化展现[12]。第四种为专题历史文献资料库(6项,占3%),是对某一历史或文学主题的数字资源进行挖掘和关联,发掘新的历史文学研究视角和开发分析工具。第五种是历史图景虚拟重现(2项,占10%),主要利用制图技术和虚拟现实技术重现历史建筑图景,实现历史和现在的虚实交互。第六种是社会记忆构建网站(5项,占25%),多利用现代信息技术整合专题社会记忆资源,这是我国档案数字人文项目的特色实践方式。

2.2 美国

美国档案数字人文项目多以各类主题档案库呈现,大致包含七类:第一类是名人档案库项目(6项,占比30%),采用文本标记、词频分析及语义挖掘等技术对名人档案信息资源进行深度开发和融合,推动主题研究。弗吉尼亚大学英语系的“罗塞蒂档案库(Rossetti Archive)”项目即属于此类[13]。第二类是基于GIS的历史地理可视化项目(8项,占比40%),是美国档案数字人文项目的主要实践方式。斯坦福大学空间和文本分析中心的“绘制共和国信件(Mapping the Republic of Letters)”项目将伊拉斯谟时代到富兰克林时代关于公众人物的通信、社交等实现交互可视化,提供新的研究视角[14]。特定历史时期、对象及事件档案库(9项,占25%)是对特定时间、人物及特大历史事件的重新审视和深入挖掘,是美国档案数字人文项目实践的重点。乔治梅森大学历史与新媒体研究中心的“911事件数字档案(The September 11 Digital Archive)项目”就是对特定历史事件资料进行文本标记和图像处理[15]。此外,美国档案数字人文项目还包含少量的语言资料库和专门的学术资源档案库(2项,占10%)。

2.3 中美比较

中美两国档案数字人文项目实践方式共同点体现在:第一,项目实践方式呈现多元化,基本都包括语料库建设、GIS历史地理可视化、历史图景虚拟重现、考古和文化遗产保护等。第二,两国档案数字人文项目实践都是依托丰富的档案文本和数字化资源实施的,为人文社会科学研究提供了可靠的研究材料。不同之处在于:第一,我国档案数字人文实践比较倾向于专题历史文献资料库建设,而美国则集中在名人档案库和特定历史时期、群体以及事件资料的挖掘。第二,我国近几年比较关注数字人文与社会记忆构建的融合,开发了多个独立的有关社会记忆构建的网站,而美国专门的社会记忆构建网站比较少,多是融于其他数字人文项目之中。第三,美国有专业的学术资源档案库,将数字档案资源与大学学术出版物资源进行编码和关联,以助力学术研究,而我国在这些方面的项目比较少。

3 档案数字人文项目应用技术

3.1 中国

我国档案数字人文项目应用的技术与项目实践方式有关,主要包括数字化技术、数据关联技术、数据挖掘技术、GIS可视化技术以及虚拟现实技术。武汉大学的“图文关联标注系统”主要采用数字化技术[16];上海图书馆的“华人家谱总目”项目通过使用数据关联和数据挖掘技术实现家谱信息的关联[17];中南大学的“唐宋文学编年地图”项目利用可视化技术构建多维地图,呈现出唐宋时期的文学家在时间和空间中的行为分布信息[18];清华大学城市设计研究院的“再现圆明园”项目则是运用虚拟现实技术实现的[19]。

3.2 美国

美国名人档案库类数字人文项目多利用多媒体文本转换技术和数字化技术,对名人档案资料进行深度挖掘、分析和呈现。美国弗吉尼亚大学的“迪金森电子档案(Dickinson Electronic Archives)”项目即是通过融合多种信息处理技术,整合其作品、手稿和图片资源,揭示迪金森作品背后的理论[20]。特定历史时期、群体以及事件档案库主要使用文本编码技术和数据挖掘技术,对档案文献资源和各类影音照片资源进行编码,在此基础上进行结构化处理,重新研究历史事件。布朗大学的“开放档案(Opening the Archives)”项目即是对数万份有关巴西的解密文件进行数字化和编码,以解析20世纪60年代至80年代间美巴两国的关系[21]。文物遗迹档案库项目主要使用虚拟现实技术,结合遥感技术和计算机制图技术重新模拟历史遗迹,演绎历史建筑的发展与沉沦。弗吉尼亚大学“查科研究档案(Chaco Research Archive)”项目利用虚拟现实技术再现了墨西哥州查科谷的历史[22]。

3.3 中美比较

中美两国档案数字人文项目基本都包含数字化、可视化、数据挖掘及虚拟现实技术等方面,且不同的档案数字人文项目都有关键技术支撑。不同之处在于:第一,美国特定历史时期、群体及事件档案数字人文项目得到深度发展,与之相关的文本转化、数据关联和可视化技术比较成熟,而我国还在探索阶段。第二,美国GIS历史地理信息技术应用更加广泛,基本涵盖各类档案数字人文项目。第三,美国相关档案数字人文项目已开始自主研发适用的技术工具和技术标准,我国目前还处于理论研究阶段。

4 档案数字人文项目成果

4.1 中国

目前我国档案数字人文项目成果包括文史数据资源库、人文社会科学研究平台工具、公开网站等,其中文史数据资源库分为三种:第一种为免费的数据资源库,如首都师范大学的“国学宝典”数据库;第二种是以北京大学“中国基本古籍库”为代表的付费使用的数字化资源库[23];第三种为有权限设置的数字资源库,这种资源库一般还在建设完善中,如复旦大学历史地理研究中心的“清代驿站交通数据库”[24]。人文社会科学研究平台工具主要包含GIS历史地理信息使用平台,如“中国历代人物传记资料库”项目衍生出的“中国古代学术师承”可视化分析平台等。公开网站在档案数字人文项目成果中占比最多,这类网站一般包括档案数字人文项目介绍、项目团队构成、项目成果介绍等。

4.2 美国

美国档案数字人文项目成果比较丰富,除公开查询展示网站、数字历史资料库以外,还包括相关数字人文研究工具、专题教学资源、出版物等。美国档案数字人文项目研究工具主要是为人文学者提供分析仪、DH工具和方法等,“以色列/巴勒斯坦铭文(Inscriptions of Israel/Palestine)”项目就制作了MYSQL引文数据库供学者使用[25],“关联爵士乐社区(Linked Jazz)”项目可以提供人物关系分析仪等数据人文研究工具套件[26]。专题教学资源是档案数字人文项目的教育资源成果,通过提供专题教学资源促进数字人文教育发展和人才培养工作。除此之外,部分高校也将专题档案资源库嵌入图书馆系统中,为学术研究提供平台。

4.3 中美比较

相同之处体现在:第一,中美档案数字人文项目成果都以公开查询网站、数字历史文学资料库、数字人文研究工具居多,并且都在持续更新完善中。第二,中美档案数字人文项目成果多为历史人文学科提供相关研究工具,而关于档案学和档案工作实践本身的专业数字人文工具都比较少。第三,由档案部门主导研发的供档案学研究的数字化工具平台比较少。不同之处在于:第一,我国档案数字人文项目成果中公开查询网站比较多,而美国的电子和纸质版的专题教育资源比较多。第二,美国档案数字人文项目的研究成果和工具平台比较多样化,而我国档案数字人文项目成果比较单一。第三,美国档案数字人文项目网站多会嵌入图书馆网站中,界面设置友好、资源链接度比较强,而我国则是独立的网页,界面比较简单,数据关联性有待提升。

5 结论

本研究通过比较中美两国档案领域数字人文项目实践的异同点,发现目前美国档案数字人文项目主要集中在特定历史时期、群体和事件的文本挖掘和呈现方面,重点关注资源开发建设的深度,主动研发数字人文项目技术和相关标准。而我国目前综合性历史文学资料库建设和信息序化类项目比较多,主要关注资源建设的广度。

美国档案数字人文项目在档案资源协同开发、数字技术与档案人文融合、档案资源价值挖掘拓展等方面值得我国借鉴。两国普遍存在的主要问题包括:都缺乏专门针对档案学研究和档案实践的数字人文项目,多是利用档案文献资源进行文史研究和工具开发,与档案工作有交叉但是专指性不强;此外档案部门在档案数字人文项目中主导作用不突出,档案数字人文项目与档案工作实践的融合度有待提高。

猜你喜欢

人文数字历史
人文
答数字
人文绍兴
新历史
数字看G20
人文社科
历史上的6月
历史上的八个月
让人文光辉照耀未来
历史上的4月