APP下载

数字人文视域下我国档案资源合作开发模式研究

2019-09-10杨千

档案与建设 2019年10期
关键词:数字人文档案资源

杨千

摘要:数字人文对档案资源的高包容度及其分析与展示等技术的多样性,为档案资源开发提供了转型契机。文章在分析数字人文指导档案资源开发现实依据的基础上,构建了一个以档案馆、数字人文研究团队和社会公众为主体,以档案材料的多重脉络解读,人、物、事关系网络揭示和社会记忆建构为目标的合作开发模式,并指出应通过专题档案开发试点、项目委托和任務众包来促进模式的具体实现。

关键词:数字人文;档案资源;合作开发

分类号:G270.7

我国长时间的数字档案资源建设,为公众利用档案资源创造了便利的条件。但就目前来看,数字化仅改变了档案资源的存在形态与保存场所,尚未达到对其内容的深度挖掘和价值的充分实现。档案资源的深度开发意味着档案材料的粒度从文件级转变为数据级,从信息单元转变为知识节点,完成数字化的进一步延伸与拓展。数字人文是一个将现代计算机与信息网络技术应用于传统人文研究而产生的新型跨学科领域,能为传统人文研究提供新的研究方法与范式,并在根本上改变人文知识发现、注释、比较、引用与展示等的方式。数字人文以人文研究中的问题意识为导向,通过计算机技术与数据处理技术等,一方面帮助人文学者从资料查找与标注等繁重的“体力劳动”中解放出来,另一方面为人文学者提供了不同于以往的多维与差异化视角,在定性与定量研究中取得平衡与突破,并从中发现新的问题。数字人文与档案资源开发有着内生的契合度。与此同时,随着互联网技术及科研众包的发展,科研活动的主体不再仅仅局限在具有专业素养的科研人员上,拥有多元、异构且广泛的群体智慧的社会公众也逐渐参与到科研活动中来。如何在我国既有的数字档案资源基础上,综合考虑内外部环境,将档案馆、数字人文研究团队和社会公众协同一致,构建档案资源合作开发的可行模式,是本文意在探讨的问题。

1基础支撑:数字人文指导档案资源开发的现实依据

1.1档案资源深度开发的切实需求

我国档案资源开发工作正稳步推进,但仍处在较为初级的阶段,以档案文献汇编为主的开发形式,不仅内容不够丰富,而且知识体系的深度也有所欠缺。这种传统的资源开发模式难以满足社会公众的资源与信息需求,更不利于档案价值的充分实现。数字人文运用数字技术对人文文献资源进行整合、组织和利用,通过概念模型的构建、内容映射与转换,呈现新的知识体系,实现资源的深层次开发与利用。借助数字人文技术,将粗粒度的档案信息转化为细粒度的知识单元,并优化重组,可以以更直观的方式深入挖掘档案资源中隐藏的信息。数字人文的研究结果,既能快速给出海量文献中存在的各种关联,达到“望远镜”的效果,也可以帮助发现各类细节和不易察觉的蛛丝马迹,达到“显微镜”的效果。

1.2数字人文理论与技术体系的不断成熟

“数字人文”概念自2001年提出距今才短短十余年,就已在人文学者中产生了热烈反响。虽然学术界至今仍未能给出“数字人文”的明确定义,但“数字人文的主要范畴是改变人文知识的发现、标注、比较、引用、取样、阐释与呈现,实现人文研究与教学的升级和创新发展”的观点获得了大多数学者的支持。数字人文的技术也处在不断发展完善的过程中,它包括数字化技术、数据管理技术、数据分析技术和可视化技术等,共同构造数字人文的资源基础、服务系统、应用平台、直观形象与交互环境。现有的数字人文技术基本能实现人文材料分析结果的立体多维展示,为研究者提供更为开阔的视野。

1.3国际档案领域数字人文项目普遍开展的示范效应

国际数字人文实践发展较早,初期是以“人文计算”的形式存在,主要关注人文领域的文献计算机索引编制、文本编码标准化等。随着计算机技术的进步和人文研究者视野的逐渐开阔,国际档案领域数字人文研究呈现出多样化的态势,开始涉及音频、视频、地图档案等。如英国伦敦大学学院的数字音乐实验室项目(Digital

Music Lab)通过分析音频、得分及其元数据,以开发用于探索和分析大型音乐收藏的研究方法和软件基础设施。美国康奈尔大学的“说服性地图”项目(Persuasive Cartograp-hy)通过预言、讽刺和绘画作品等在地图中投射说服性观点。目前,全球已成立数字人文研究中心的180余所高校的研究项目大部分都与档案相关。国际档案领域数字人文实践的普遍开展为我国档案资源的数字人文开发提供了宝贵经验。

2要素分解:档案资源合作开发的主体及其关系

数字人文视域下的档案资源开发涉及档案馆、数字人文研究团队和社会公众三个主体,为充分调动三者的积极性使之协同有序,有必要明确各自的责任和定位,并理顺三者关系。

2.1档案馆

档案馆作为一个区域、国家乃至民族文化遗产与记忆的主要保存场所,拥有丰富的档案馆藏,是官方指定进行档案资源开发的机构。据统计,近5年(2013—2017)来,我国综合档案馆馆藏档案从42454.5万卷(件)增至65371.12万卷(件),这些数量庞大且涉及社会生活各个方面的档案资源是进行数字人文研究与开发的宝贵资源。目前,档案馆在档案资源的数字化保存与编研方面投入了大量的人力物力,也取得了相应的成果,但对资源的开发并未深入到内容层面,细粒度的知识组织与关联尚在探索之中。事实上,档案数字化将会在很长一段时间内持续,但长期停留在档案资源开发的初级阶段,不仅不利于档案价值的实现,还会使档案馆逐渐丧失深入开发的主动性。

档案馆在合作开发中的具体职责包括:(1)制定统一的档案数字化、数据化加工标准,元数据著录标准和数据编码标准等。(2)按照特定主题,整合已形成但分散的档案资源,避免重复建设;遴选特色档案资源以备开发。(3)构建档案资源开发利用平台,以开发出满足用户需求的信息产品。(4)开展档案工作人员培训,使其适应新的信息技术环境。

2.2数字人文研究团队

此处将开发主体定为数字人文研究团队而不是数字人文研究机构主要是出于实践开展灵活性的考虑。一方面,一些对数字人文有兴趣且进行过实践探索的人文学者虽然并未加入相应的数字人文研究机构,呈现单兵作战的状态,但实力不容小觑;另一方面,档案资源不同于文学、艺术作品的特质,要求数字人文研究者对相关内容的熟悉与理解达到一定的程度,因而需要对数字人文研究机构中的既有成员进行灵活调整,必要时吸纳新的成员以形成新的研究团队。在这种理解下,无论是现有的数字人文研究中心,图书馆的数字人文工作坊,还是特定科研机构,都可根据实际情况自由组配,形成数字人文研究团队。

数字人文研究团队的具体职责包括:(1)形成明确的问题意识与档案资源开发工作整体预期,并围绕问题组织、处理相应的档案资源。(2)提供技术支持,将掌握的技术手段运用到档案资源开发过程中并构建档案资源开发利用平台。(3)根据研究主题和数据的需要,引入相应的数据处理与分析工具。(4)提供贯穿合作周期的项目管理,以保证项目的顺利进行并取得良好成效。

2.3社会公众

随着科学传播范式的转变,原先的知识普及、公众被动接受的科学模式已逐渐演变为公众参与并设计科学的新范式。2014年,中共中央办公厅、国务院办公厅印发的《关于加强和改进新形势下档案工作的意见》就提出“规范并支持社会力量参与档案事务”;而我国档案面向全体社会公众开放,也意味着公众有权参与到档案资源的开发中。档案资源的数字人文研究相较于传统的人文研究,需要进行大规模样本采集与海量计算,单凭机器自动处理和团队成员间的协作,难以应对如此复杂的工作,群体智慧或将有助于其取得突破。

社会公众主要承担协作式档案信息分析和辅助式研究开发工作,既包括分类、编目、标引、纠错等初级工作,也包括主体匹配、语境化和数据管护等具有一定挑战的内容。虽然档案资源的数字人文研究与开发面向所有公众,门槛也较低,但在实际操作过程中,开发团队可能会根据公众对档案本身的了解程度与认知能力进行一定的筛选,或者通过竞赛的方式对公众贡献进行排序,以保证研究成果的质量。出于资源整合与提高效率的考虑,档案资源开发利用平台也即公众参与的平台,参与开发后,作为利用者,公众也可对开发成果提出反馈意见,以进一步完善开发流程。

2.4主体间关系梳理

多主体同时存在的情况下要保证档案资源合作开发的有序有效运行,必须先明确备主体之间的关系。各主体间关系如图1所示。

档案馆与数字人文研究团队是档案资源开发的主力,它们是合作关系。数字人文研究团队拥有相对领先的技术优势,且其团队成员来自不同的学科,具有长期从事相关研究的经验,因而能为档案资源的开发提供创新视角与技术支持;档案馆掌握着数量庞大的档案资源,是数字人文团队进行档案资源开发的坚实后盾。同时,档案馆中的专业人才可通过融入数字人文团队成员的开发过程,将相关理念与技术引入到档案馆,促进档案馆档案资源开发能力的提升。

社会公众处于档案资源开发的次要位置,对档案馆和数字人文研究团队的工作起辅助作用。公众承担档案馆或数字人文研究团队在众包平台上发布的任务,在一定的激励机制下贡献自己的智慧,档案馆或数字人文研究团队接收众包分析的反馈后,对结果进行汇总或遴选,并根据需要及时调整分析思路或方案。有意愿参与到档案资源开发的社会公众往往对相关的档案知识有所了解,在辅助开发的过程中能实现自身价值。

3目标确立:档案资源合作开发的三个层次

与传统档案的数字化一样,我国档案资源的合作开发也是一个循序渐进的过程,由简单到复杂,孤立到互联。数字人文视域下的档案资源开发将经历档案材料的多重脉络解读,人、物、事关系网络的揭示和社会记忆构建三个阶段。

3.1档案材料的多重脉络解读

档案材料的多重脉络解读实际上更多是从数据库建设与用户检索的角度而言的。传统档案管理中全宗、案卷的组织方法,只给用户浏览与查询提供了单一线索,档案资源开发主体间的关系数字档案馆门户网站几乎照搬了这一结构,这使得对档案内容不熟悉的用户很难找到所需的材料。首先,数字人文环境下的档案资源组织将提供建立在对档案材料的多角度分类基础上的多重资源发现路径,包括立档单位、主题、事件、人物与年代等,每个分类结果下还提供后分类浏览,使结果更加精确。其次,分类结果能进行多角度分析或对比,从有限的档案资源中分析出更多信息内容。另外,对档案内容的标注将帮助用户发现相关资料,进行系统性的研究。

3.2人、物、事关系网络的揭示

人、物、事关系网络的揭示需要打破现有的数据信息结构,进行知识的关联与重组。数字人文在人物社交关系网络构建,人、物关系,生平经历及事件演变等方面已有成熟的工具与技术可供使用,如本体分析、社交网络分析等。此外,关联数据技术也有望发挥重大作用,美国普瑞特信息与图书馆科学学院的关联爵士项目就是通过关联数据技术,揭示爵士音乐家之间的关系及其社交网络。人与物关系的分析适合探明重要文物或艺术品等的流转,同时也可从侧面勾勒出人与人之间在亲缘关系、兴趣爱好等方面的联系;人与事关系的分析适合追溯個人成长及心态、能力变化的原因。通过对人、物、事关系的分析,可以对历史上重大事件的发展演变、知名人物的生平轨迹有直观清晰的认识。

3.3社会记忆的建构

社会记忆建构是人、物、事等关系网络揭示的进一步延伸,也是数字人文指导档案资源开发的合理走向。档案是一种社会记忆形态,含有“集体记忆的关键”,是一种珍贵的记忆资源。社会记忆建立在多主题与类型档案合作开发的基础之上,依托GIS技术和VR/AR技术等,实现知识重构、场景重建、增强艺术等。社会记忆是城市记忆、乡村记忆等的综合与抽象,以绘制出一个国家、一个社会更为宏观的发展历程图谱。另外,如前所述,数字人文的开发结果能帮助发现各类细节和不易察觉的蛛丝马迹,达到“显微镜”的效果,各类档案材料在数字人文开发过程中,能实现相互证伪,也就为社会记忆建构进行了质量上的把关。

4路径探索:档案资源合作开发的实现策略

在理清开发主体与目标后,可形成数字人文视域下我国档案资源合作开发模式的整体框架,如图2所示。由于档案资源合作开发涉及主体众多,因而必须寻找到合适的切入点并配合灵活的运作机制,才能保证档案资源的合作开发高效有序进行。

4.1以专题试点作为整体档案资源开发的切人

待开发的档案资源应围绕特定的主题集合而成,并且在相应主题下呈现体系化的特征。例如,乔治梅森大学2003年开展的“9·11事件数字档案项目”聚焦“9·11事件”给国际政治、经济等带来的影响;“威尼斯时光机”用档案数据重现古城历史。由于数字人文是建立在数据的基础之上的,数据量的丰富程度直接影响分析的结果,因而,档案资源需形成一定的规模与体系,以尽可能保证数据解读的客观与准确。在进行档案资源主题选定时,一方面要从用户的角度出发,考虑主题的代表性与社会关注度,另一方面要考虑已有主题档案整理和零散档案征集的难度。

值得注意的是,我国现有的档案馆多为综合档案馆,以政务类档案为主要保存对象,这意味着社会上很多其它类型的档案仍处在分散管理的状态中,如企业档案、行业档案等。实际上,这部分档案因其主题多元,关联各方,更能吸引开发人员和利用者的兴趣。随着公众档案意识的增强,出于留存记忆的考虑,其对自身所处领域档案的保存与开发愈加重视。档案馆可以所在省、市或区域为界,征集某一类主题的档案,如艺术档案、名店名企档案等进行开发.或者直接与企业或协会共同进行档案资源数字人文开发专题试点。专题试点能提升档案资源开发的社会影响力,也能以成功的开发案例为样板,激发档案馆进行馆藏档案资源开发的热情与信心。

4.2以项目委托作为档案馆与数字人文研究团队的主要合作形式

档案馆应将亟待开发的档案资源分主题、分类别,以项目招标的形式分派给有实力的数字人文研究团队,根据其资源开发设计方案评估其资质,以开发成果的综合效益作为核验标准。数字人文研究团队则需根据研究主题及档案资源的丰富程度等要素,制定科学可行的开发规划,融合多学科人才,为档案资源开发提供创新思路。项目委托是实现档案馆与数字人文研究团队在档案资源开发方面双赢的有效机制。一方面,档案馆馆员具备较强的档案管理实践能力,但在信息分析与组织方面的专业性就远不及数字人文研究人员,企图让档案馆馆员成为样样精通的全才并不现实,也不符合市场经济的运行规律。通过项目委托,档案馆将部分档案资源的开发工作外包给数字人文研究团队,开发成果的专业性就得到了保障。另一方面,项目委托是以一定的经费支持为基础的,数字人文研究团队在承接档案资源开发项目时,不仅能得到档案馆方面的资金,还能将项目升级为课题,获得国家的研究基金,充足的研究经费,解决了研究人员的后顾之忧,也有助于调动其研究的积极性。此外,档案馆还可以派出档案馆馆员与数字人文研究团队共同参与研究,以提升其信息技术水平,为在档案馆内部进行资源开发积蓄力量。待各项要素成熟之后,档案馆可将部分档案的开发工作委托外包,部分涉密或不宜委托的档案留在馆内开发。

4.3以众包作为联结多主体的开发尝试

档案馆与数字人文研究团队将开发项目中的部分工作通过众包平台转让给社会公众,能将公众的智慧纳入开发过程当中,实现多开发主体的联动。众包的研究与分析方式,自产生起便受到诸多质疑,包括对非专业人士技术水平及领域知识掌握程度的不确定。但在数字人文环境下,由于分析技术大多采用“黑箱”设计,公众上手工具的难度得以降低;另外,在众包中,公众往往承担技术与专业知识要求较低的部分,如关系配对,主题选择等,在汇集大量结果时,通过比对筛选,也能减小知识水平差异对研究结果造成的影响。同时,众包还需采用一定的激励机制才能维持公众持续参与开发的热情,最直接的是根据公众不同的参与效果,设定不同的奖励额度。国内外檔案领域的数字人文项目已经开始了众包的尝试,并取得了不俗的成绩。英国伦敦大学学院“斯莱德档案项目”(Slade Archive Project),借助大众标引进行元数据库的构建和完善;上海图书馆借助公众力量,对盛宣怀档案和手稿进行抄录和标引。以众包促进档案资源的开发,不仅能明确公众的主体地位,打通多主体联结渠道,还有利于引导全体社会成员关注并参与档案资源的开发。

猜你喜欢

数字人文档案资源
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究
数字学术与公众科学:数字图书馆新生态
高校校史馆建设中档案馆藏资源的作用与开发利用
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
浅谈档案资源的功能与合理利用
大规模古籍文本在中国史定量研究中的应用探索
论“档案信息资源开发中的主体”