国外数字人文地图项目的实践与启示⋆
2019-11-13刘芮谭必勇
刘芮 谭必勇
(山东大学历史文化学院 济南 250100)
0 引言
信息技术的进步、多学科交叉融合推动数字人文的发展。近年来,随着台湾数位人文中心(Research center for digital humanity)、加拿大人文媒体—视觉资源与计算中心(Humanities Media Audio-Visual Resource and Computing Centre)等数字人文中心的建立和威尼斯时光机(Venice Time Machine)、“影谷档案”(The Valley of Shadow) 项目、威廉姆•布莱克档案馆 (The William Blake Archive) 等数字人文项目的开展,数字人文理念深入文学、社会学、哲学等诸多领域。同时,也对这些领域带来诸多挑战。
1940年意大利学者罗伯托•布萨(R.Busa)将计算机用于文献检索,开启了“人文计算”时代[1]。2004年,苏珊•施赖布曼(Susan Schreibman)等人编辑的《数字人文指南》(A Companion to Digital Humanities)一书出版,书中正式将数字人文定位为一个学科。虽然,距离《数字人文指南》一书出版已有十余年的时间,但是关于“数字人文”的概念并没有得到统一[2]。这一概念至今仍然处于发展演进之中,图书馆领域、档案学领域的学者等对其都有不同的理解。图书馆领域的学者将数字人文作为一种研究方法[3],认为数字人文与人文计算技术息息相关,是将数据挖掘、文本分析、数字化、可视化、GIS等现代信息技术融入到人文学科的研究[4]。而档案学者则认为数字人文是借助数字技术对人文文献资源进行整合、组织和利用,其本质不在于数字技术的运用,而在于资源本体,关注资源本体的深层开发与利用[5]。还有学者将数字人文看作是一种空间,一种传统人文研究与现代技术交汇形成的空间[6]。虽然定义不同,但不同学者对数字人文的本质认识基本统一,即数字人文的本质在于数字技术和人文研究的双向互动关系,一方面是将数字技术与方法应用到人文研究过程中,另一方面则是利用人文研究方法论开展对数字媒介与技术的批判性讨论[7]。因此,本文借鉴维吉尼亚大学图书馆馆长John Unsworth教授关于“数字人文”的定义:“数字人文是一种代表性的实践和一种建模的方式,或者说是一种拟态、一种推理、一种本体论约定,将高效计算和人文沟通相结合”[8]。
目前,国内档案学界对于数字人文的研究主要集中于数字人文对档案资源开发利用的影响、介绍国外档案领域数字人文项目实践、分析档案学和档案工作与数字人文的关联三个方面。朱令俊[9]从开发客体、开发技术与开发平台三个角度出发构建了数字人文的档案信息资源开发模式;赵生辉[10]介绍了美国弗吉尼亚大学的 “影谷项目”等案例及对我国数字人文项目开展的启示;龙家庆[11]、加小双[12]等厘清数字人文与档案事业、档案学科之间的联系,强调档案领域不能缺位数字人文的发展浪潮。综上而言,我国档案领域数字人文实践和理论研究成果较少,针对数字人文地图的研究亦较少。
作为信息传递的方式之一,地图信息能够反映事物的发展规律、展现事物之间的普遍联系,是承载城市记忆、集聚文化情感的符号形态。档案作为重要的信息载体,档案馆作为公共服务的提供者,如何在数字人文浪潮中发挥档案的价值、找准档案馆的定位十分必要。探析国外数字人文地图项目实践的开展对我国档案信息资源的整合利用、城市人文价值的传承、唤醒“沉睡”的城市记忆具有重要意义。本文结合泰恩威尔档案博物馆开展的“隐藏的纽卡斯尔”、“支流”、“了解你的居住之地—英格兰西部”、“阿姆斯特丹数字地图档案馆”等项目实践,分析国外数字人文地图项目的特色之处,探索数字人文地图工作开展的难点并探析档案资源和档案馆参与数字人文地图项目的优化路径。
表1 国外部分数字人文地图项目简介
1 国外数字人文地图实践项目的特色
1.1 档案助力,嵌入特色
档案助力数字人文地图建设主要体现在以下两个方面:其一,档案资源是数字人文地图数据的重要来源。“了解你的居住之地—英格兰”数据主要来源于大英图书馆、苏格兰图书馆以及格洛斯特郡档案馆等7个地方档案馆西部。“华盛顿特区历史”的主要数据来源于DC历史建筑许可证数据库,该数据库是由D.C.历史保护办公室编制,向用户提供建筑许可证的缩微照片主要来源于美国国家档案馆。其二,档案馆在数字人文地图项目合作过程中发挥领导和协调作用。“隐藏的纽卡斯尔”和“支流”APP的开发,泰恩•威尔档案博物馆不仅负责数据的提供,也是项目的主要负责人。地方特色档案资源承载着地域文化的记忆基因,反映了特殊时期的文化记忆,具有多元的社会文化价值[13]。以 “支流”APP为例,它采用定位的移动应用程序的形式,用音乐和声音让用户感受第一次世界大战期间泰恩赛德(Tyneside)的经受的磨难。它还允许用户通过制作自己的录音来回应体验。声音信息不断的增加,集体记忆地图不断的拓展,使音频素材不断丰富,不仅丰富城市记忆,也标记个人生活,集聚公众的心理情感,增强文化认同。
1.2 技术支撑,工具开发
技术的进步和创新是数字人文发展的支撑,数字化是数字人文地图开展的前提。“华盛顿特区的历史”作为互动式地理信息系统地图,包括华盛顿特区约127,000座建筑物的信息。用于创建地图的大部分数据来自DC历史建筑许可证数据库,数据库于2000年至2010年之间编制,至今仍在扩大覆盖范围。该数据库包含建于1877年至1950年之间的建筑物的基本信息,这些建筑物约占该市建筑物的85%。对于其它的建筑信息,项目组通过挖掘税务记录和其他来源来完善地图信息。该应用程序还包括一个查询工具,允许用户分析指定地理区域或全市范围内的历史数据[14]。工具开发是推动数字人文应用的基础,技术与工具相辅相成。空间人文实践中越来越多地采用数字工具和方法 - 如地理信息系统(GIS)工具、数字地图、定位媒体和全球定位系统(GPS)启用的移动设备、地理标记等[15],同时,也集中开发新的工具为用户提供更好的服务。为了推动地方历史和文化遗产的开发与保护,学校、社区团体和其他教育设施可利用“了解你的居住之地—英格兰西部”项目组开发的数字地图工具包进行交叉学习,此工具包提供6个系列课程,每个课程都有一个可供选择的活动,以支持学校的课程、小组会议等,并且提供一系列的案例研究、更多的资源和链接来支持整个工具包的使用和维护[16]。
1.3 形式多样,在线互动
“交互式沟通”和“浸入式体验”的数字人文地图理念不仅实现与用户的双向沟通、了解用户需求,还可以提供打造丰富的视觉效果,使用户身临其境。目前数字人文地图开发主要以在线地图、APP、展览等形式为主,并且允许用户依据个人行动轨迹标记地图或为地图添加信息。“了解你的居住之地”不仅提供在线访问的历史数据,还开发了一个手机APP,方便用户利用移动设备查看地图。用户也可以添加有关居住者所在地区的信息,为每个用户建立独具个人特色的社区地图。“阿姆斯特丹数字地图档案馆”展现了17世纪以来阿姆斯特丹发展的历史,不仅提供视频以供观众观看,还可以实现档案与Google街景视图之间的切换。在“伊斯坦布尔城市数据库”地图上,提供了一系列历史地图,航拍图像,历史照片,历史交通路线等地理特征,以及伊斯坦布尔历史悠久的海滩等众多景点。 用户可以选择性地检查历史地图或叠加具有可调透明度值的多个地图,并将地理参考特征叠加到基本地图。该项目还提供了一个工具,用于对来自不同时间的两张地图进行并排比较,使用户能够详细检查随时间发生的变化。伊斯坦布尔城市数据库可以单独使用,也可以集成到其他项目中。“隐藏的纽卡斯尔”APP根据用户的定位采用图片、视频、音频等多种形式推送与城市历史相关的事件,展现了纽斯卡尔城市发展的真实写照。此外,“了解你的居住之地”将线上线下展览相结合,不仅提供网上互动展览,用户登录网站,添加该地区的邮政编码,即可查看当地历史地图;而且提供南格洛斯特郡、北萨默塞特和汤顿萨默塞特遗产中心3个线下实体巡回展览。
1.4 群策群力,互利共赢
数字人文是典型的学科交叉领域,不仅体现了技术的实践应用,而且体现了人文学科的需求导向。跨学科、跨领域的多部门协同、多元化背景人员参与有利于互利共赢。首先,与政府部门、企业、非盈利性组织等进行合作。资金是数字人文项目开展的“血液”和动力。“了解你的居住之地”资金主要来自于遗产彩票基金、南格洛斯特郡议会以及格洛斯特郡档案馆等七个组织的捐赠。资金链的连续性是“了解你的居住之地”项目不断完善的重要保障,2011年至今,地图覆盖范围由布里斯托尔扩大到格洛斯特郡、威尔特郡等八个县、面积约7279平方英里[17]。其次,与知名学者、领域专家合作。“支流”APP是泰恩威尔档案博物馆和波士顿艺术家Halsey Burgund共同合作开发。项目团队还与BBC“瞭望北方”栏目(Look North)的Jennifer Bartram合作,用其声音记录了一系列第一次世界大战的天气报告[18]。最后,与社会公众进行合作。2015年11月至2017年7月期间,约有100个团体和70个人自愿参与“了解你的居住之地”项目,他们花费了4946小时将历史地图图像添加到地图库中。泰恩威尔档案博物馆还鼓励公众为“支流”APP捐赠声音记录[19]。
2 数字人文地图项目工作开展的难点
第一,跨学科跨领域合作难度大。首先,学者在进一步探索数字和地理空间研究环境时不可避免地遇到不同数字人文空间项目和不同学科之间对话和交流过程的困难[20]。不同的学科有不同的术语,不同的学科逻辑和思考方式,不同的方法论。学科和学者之间的兼容性、学者和学者之间的兼容性是非常必要的。其次,“学术博弈”不可避免。以图书馆和档案馆为例,目前二者在数字人文地图领域的主要角色以提供馆藏信息为主。但是,2015年美国研究图书馆学会 (The Association of Research Libraries,ARL) 在一项针对339所高校图书馆数字人文项目的特别调查中指出,学者认为图书馆不是项目合作者,只是服务或内容的提供者[21]。如何协调“学术博弈”、增强彼此之间的认同感的问题亟待解决。最后,对于同一个事物,不同的学科有不同的标准和规范。不同的学科研究的进展速度也不亦相同。虽然档案馆馆藏资源数字化程度较高,但是数据理念、数据技术、平台建设、工具开发等方面仍有待进一步提升。而信息技术等应用学科对数据的认识、技术的敏锐度远高于档案馆等人文学科。
第二,数字人文团队组织架构难。数字人文团队组织架构难主要体现在:其一,成员之间存在“学科壁垒”。数字人文地图大多以项目开发为主要形式,参与人员学科背景不同、合作能力不同。其二,团队建设容易趋于形式。大多数数字人文项目都是以非常零散的方式来完成的。甚至很多著名的数字人文项目,都是仅由一名开发人员或一个小型工作组来管理,也就是说,项目的短期规划和资金波动、项目成败及持续性往往取决于项目参与者的个体意愿、能力、研究兴趣以及各项临时性拼凑计划[22],团队缺乏凝聚力、创新度不高,成员易被项目合同所约束、被动参与,不共享学术成果等行为阻碍科研的进步。其三,资源整合难度大。人力、物力、财力如何调动、如何分配是数字人文团队建设的难点之一。
第三,数据内容复杂、维护程度难。首先,数据内容多样。广泛的数据来源,决定了数据形式的多样性。数字人文地图除了包含基本的地理信息之外,还包含其他的人文信息,图层的叠加、信息的标记、用户的反馈使数据内容更加复杂。其次,海量数据产生,数据体量巨大。部分数字人文地图为方便用户使用不仅提供在线服务,也开发了APP等形式。用户参与度越高,产生的数据量也就越多。再次,数据产生迅速,需要及时处理。为了给用户提供更好的服务,对于用户提交的信息标记和问题反馈要及时处理,才能吸引更多用户使用数字人文地图。最后,筛选有价值的数据耗时长。数字人文地图的优势之一在于把信息以直观的形式展现出来,不同的用户有不同的信息需求,如何挑选对用户有价值的信息,为用户提供“定制服务”值得深思。台湾著名的“数字典藏国家型科技计划”,投入巨大,也整理出了浩瀚的史料,但多年来不仅一般历史学家对此兴趣不大,在研究中很少利用,甚至那些参与了这一庞大项目的史学家们也不借助这些新资源、新平台开展研究[23]。
第四,用户隐私保护、版权维护难。大数据时代,隐私泄露不仅直接关乎到用户的切身利益,对企业、政府等组织而言也是一个严峻的挑战。侵害版不仅仅是不尊重著作人的成果,损害了著作人的权益,对用户的利益、社会秩序也会造成严重的后果。数字人文地图项目用户隐私保护、版权维护难主要表现在:其一,为提高用户的参与度,体现数字人文地图项目的人文情怀,许多APP允许用户标记、上传个人数据。如何保证用户上传数据的真实性、可靠性,保证其数据没有侵犯版权,对于用户提交的数据的版权如何界定都需考量。其二,与公司合作,例如外包等形式容易泄露用户隐私。数字人文地图项目的开展离不开GIS、数据库等数据技术的支持,由于负责单位自身硬件条件、专业人员技术等因素受限,选择与公司合作共同开展项目,将某些流程外包给公司,用户隐私不能得到保证。其三,用户维权需要一定的成本。负责单位将业务外包,容易出现“扯皮”现象,权责不清,难以维权。最后,服务商提供的免责标准过宽。在制定用户许可协议时,故意放宽使用用户信息、获取版权的权利,使不法分子钻“法律漏洞”。
3 数字人文地图建设的优化路径
3.1 项目管理模式,完善合作机制
项目管理模式需要以项目策划和实施过程为工作核心,明确双方的合作形式,以项目预期目标的实际完成情况为考核内容,不仅仅是开展一个项目,而是完成一个项目,做好一个项目。首先,确定项目管理的目标,梳理项目时间节点,签订项目管理合同,明确项目管理的进度。数字人文地图项目不仅要利用数据技术、信息技术,而且要体现人文情怀,并且通过视频、声像等多样化、可视化的方式呈现出来,而且数字人文地图不是一成不变的,需要不断修改和完善。其次,项目负责人要及时跟进项目进度,保证对接工作按质按量完成。华盛顿特区的历史这一项目就曾被美国历史文化中心中断,在年重新启动。最后,确立监督检查机制,根据考核结果对项目负责人及项目团队予以奖惩,即项目负责任制,保证项目完成的准确率及高效性。
3.2 建立管理小组,明确自身定位
管理小组的成立是推动项目管理进程、执行管理机制的重要手段。互联网的进步、自媒体的盛行使线下核心成员与线上中坚力量相结合的管理小组形式成为可能。项目组成员学科背景应多元化。就目前数字人文中心现状来看,人文专家人员比例占据绝对优势, 图书馆员和信息技术人员次之[24]。许多人文学者缺乏项目管理经验,导致很多由人文学者主导的数字人文项目常因进度安排不合理、项目中断、成果无法按时交付等原因失败。此外,项目组成员要明确自身定位。以档案馆和图书馆为例,档案馆和图书馆作为重要的馆藏基础和信息来源,其不仅通过数字化历史地图的数字化,保存和元数据为人文学科和数字文学制图学做出贡献;也可通过举办展览、开发教学材料、数字工具等形式推动数字人文地图项目开展。
3.3 鼓励组织参与,寻求公众帮助
组织的参与是推动数字人文发展的重要力量。“外包模式”是企业、非营利性机构参与数字人文地图项目的途径之一,是整合利用专业化资源,从而达到降低成本、提高效率、充分发挥核心竞争力的目的,即以较低的成本获得更好的服务。数字人文助力“智慧城市”建设、展现 “城市记忆”,作为数据治理主体的政府部门亦要积极参与。高校作为数字人文科研的重要力量,师资力量雄厚、跨学科合作的优势明显。“了解你的居住之地”项目中,大英图书馆和苏格兰图书馆提供了6924个数字化和地理环境卫星测量地图系列,牛津大学图书馆提供了少量遗失的地图,德文郡的地图由德文县议会提供,巴斯唱片办公室、德文档案馆、格洛斯特档案馆、萨默塞特档案馆、威尔斯郡议会等7个地区从他们的收藏中亦提供了部分数据。数字人文地图本质是为公众提供服务,以数据承载城市记忆。共同生产、共同创造是公共服务领域发展的重要趋势,数字人文地图的“众包模式”是一个互惠互利、双向共赢的过程,不仅可以节约物力财力等资源,而且可以更好地了解公众需求。“阿姆斯特丹在线数字人文地图档案馆”可通过电子邮件进行“反馈”来响应所咨询数据的质量,用户可提供数据集以通过数据门户共享也可以通过门户(或API)提交用于访问新数据的应用程序。
3.4 制定法律法规,保障数据安全
网络环境、数字技术已经构成了数字人文发展的基本环境和基础条件,数字人文地图作为城市数据治理的手段之一,为城市数据治理、建设“智慧城市”提供的全新的维度和跨学科、融合的视角。而目前我国数据治理领域相关的法律法规还不完善,尤其针对数据安全、用户隐私、版权保护等方面。法律法规是数据治理的坚强后盾,政府要针对专门领域如用户隐私、版权保护等方面出台专门法律,建立数据安全分类等级,针对不同的等级采取不同的防范措施。公众可为法规的制定建言献策,同时监督政府行为,保证数据透明开放、安全可靠;要树立数据安全和版权意识,充分利用法律武器保护自己,同时做到不侵犯版权、不盗用他人信息等。
数字人文地图可以帮助我们在物理世界和虚拟世界之间无缝衔接,我们既是空间的物质体,也是互联网上的电子身份,我们永远都“在这里和其他地方”。地图实际上是使我们能够实现这种双重存在并协调这两个方面的极少数档案作为重要的信息资源[25],档案馆作为“智慧城市建设”的主体之一,不能缺席数字人文发展浪潮,数字人文地图就是一个良好的探索。