瑞士联邦档案馆特色功能研究及启示
2021-07-01王志宇王晓宇
王志宇 王晓宇
摘要:随着信息技术的发展和数字资源的不断增多,公众对档案数据获取的便利程度要求越来越高。瑞士联邦档案馆记录了瑞士两百多年的历史,拥有大量的档案信息资源,在档案的开发利用工作中,不断探索实现档案资源的关联与共享模式。本文就瑞士联邦档案馆网站的特色功能展开研究,总结瑞士档案馆档案开发与利用的方式,并在此基础上为国内档案馆网站建设提供可行性的参考。
关键词:瑞士联邦档案馆 语义关联 知识共享
一、引言
瑞士联邦档案馆创建于1798年,是瑞士的国家档案馆。“截至2020年,拥有超过68697MB的模拟档案和22TB的数字档案,以及1050MB传输常规文件和0.7TB的传输数字文档,具有丰富的档案馆藏。”[1]因此,在档案的开发利用上,联邦档案馆承担着重要的责任。同时,数字档案资源的日益增多,带来了利用方式、存储方式、发布方式等方面的变革。为了更好满足用户需求,瑞士联邦档案馆运用前沿技术,把知识的关联与共享放在重要位置,不断创造新的服务模式。基于此,本文从瑞士联邦档案馆网站的特色功能出发,总结其开发与利用的方式,以期对我国档案馆的未来建设与发展起到参考作用。
二、瑞士联邦档案馆的关联与共享技术
瑞士联邦档案馆提供的特色服务是以档案数据的关联和共享技术为核心开展的,把相关前沿技术应用于档案管理事业的优势和便利性在这里得到了充分体现。
(一)关联数据技术
语义网的提出和实现,给信息世界带来了巨大变革,数据不再是孤立存在的个体,而是知识网络中的一份子,同时它也使数据蕴含的语义能够被机器所理解,代替人类执行越来越复杂的任务。关联数据技术是语义网实现的基础,作为连接不同结构数据的一种规范,“由互联网之父Tim Berners-Lee于2006年提出,它指代万维网上表示和链接结构化数据的一系列技术,旨在建立一张计算机能够理解的语义数据网络,能为信息资源的广泛关联提供技术框架和实现途径。”[2]目前,关联数据作为语义网的最佳实践,已经形成了较为完整的体系,应用于多个领域。瑞士联邦档案馆采用关联数据技术,对不同机构的数据进行组织与连接,从而方便用户的获取。在档案管理领域,对档案资源及其相互关系进行语义化的描述,实现数据与数据之间的互联互通,在节省管理成本的同时,可以使用户更高效的获取更大范围的信息资源。
(二)数据共享技术
信息化时代,信息获取能力是赢得竞争力的一个重要方面。用户对信息流通速度的要求越来越高,数据共享的需求性也越来越大。“数据共享是指在不同地点使用不同计算机、不同软件的用户能够读取他人数据并进行操作、运算和分析。”[3]瑞士联邦档案馆作为保存瑞士相关档案资源的场所,拥有大量的数据信息。在资源的开发与利用上,联邦档案馆将档案资源通过内外部平台发布出去,实现了档案资源的深度聚合与共享。与此同时,档案馆数据库之间的互通互访,实现了多来源数据库之间的资源共享,既减少了资源浪费,也提高了工作效率。在整个档案学领域,档案信息作为整个信息世界不可缺少的一部分,档案机构应该在数据共享技术的基础之上探索档案管理模式,实现档案资源与其他信息资源间的共享,使其融入整个信息资源体系中,促进资源的再生产和再利用。
三、瑞士联邦档案馆网站特色功能
(一)在线访问项目
瑞士联邦档案馆的在线访问项目旨在使用户可以随时随地访问联邦档案馆的所有文件。该项目主要分为两个部分:一个是在线门户网站,用户可以从www. recherche.bar.admin.ch入口进入,另一个是数字化基础设施。“门户网站已于2019年上线,并于11月25日实现了所有用户的可在线访问,同时项目计划指出到2021年数字化基础设施容量将会增加并得到完善。”[4]在线门户网站提供了多种搜索方式,其中,简单搜索是指在搜索栏目中直接输入搜索内容,搜索结果则会根据用户权限的不同而不同。而高级检索的搜索栏中包含有标题、元数据以及全文等在内的13个检索项,用户可以根据网站列出的搜索语法进行查找。此外,还拥有存档计划搜索和专题综述两个板块。联邦档案馆文件是按照档案馆计划中的等级结构排列的,存档计划可以帮助用户了解档案的上下文背景,并搜寻到主题相关的档案。专题概述是对1848年以来联邦各州文件的汇总,一共包含9个主题,用户可按主题进行查询。更重要的是,四个搜索方式并非独立存在,可支持交叉查询。除了标题之外还会显示参考代码、时间段、级别等内容信息,用户可运用筛选器过滤结果。与此同时,档案馆还提供了收藏、订购、咨询等服务,充分保障了用户的查询需求。
(二)关联数据服务
瑞士联邦档案馆的关联数据服务(LINDAS)旨在使不同来源的联邦政府、州和市政当局的结构化数据能够跨组织的進行集成和关联,以便在发生问题时能够及时地获取数据。LINDAS服务最初是由瑞士国家经济事务秘书处(SECO)在2015年开发的,2017年联邦档案馆开始负责运营,政府、私营部门以及个人等都可通过lindas-data.ch进行访问。比如联邦环境局将显示环境领域状况和发展的环境数据以开放数字数据集的形式提供给LINDAS,在LINDAS中,数据用户可以制定各种查询,并将查询与其他数据连接起来,使用者则可以在各种应用程序中以不同的格式进行搜索和下载,免费重复的利用。更重要的是,对于数据提供者来说,数据的所有权依然在他们手中,数据只是用来创建可关联的副本,因此LINDAS服务是非常值得信赖的。不仅节省了机构和用户的时间与精力,还增加了数据的价值,实现了知识的组织与管理。
(三)官方出版物和数字化文档的全文获取
联邦档案馆的官方出版物页面上提供了包含官方出版物和有关历史主题文本的数字化文档。文档类型一共有10种,分别为联邦公报、官方收藏和调整后的收藏、联邦政府的行政实践、官方公报,会议记录和联邦议会谈判概况、联邦委员会的年度报告、联邦会议纪要、州政府的法案和预算、联邦州日历、Helvetic Re? public中央档案馆(ASHR)的文件集合以及其他。它们都可以以文本的形式直接阅读,原始文档的扫描格式是PDF,皆可进行全文本搜索,为用户带来了极大的便利。在搜索页面中也同样拥有简单搜索和高级搜索,主题分类清晰,可在线浏览的年限也准确标注,减少了用户的查询时间。此外还有按日期搜索和按内容搜索,每一个板块都以文件夹的形式详细分类,以便用户能够快速有效的获取查询结果。
(四)开放政府数据
瑞士开放政府数据(OGD)门户网站(opendata. swiss)是开放的中央门户,包含来自瑞士政府可供免费访问的数据。目前已有86家组织机构向网站提供数据,包含人口、科学教育、金融、卫生等24个分类目录,并且不存在任何个人数据,这些目录由提供者自行管理。瑞士联邦档案馆作为数据提供者之一,从2013年9月1日开始在瑞士开放政府数据门户网站上提供免费的数据记录,即档案馆藏中所有档案的元数据可以自由访问。“截至2020年8月,用户可在线获取联邦档案馆中的384万份文档和257,000个文档的元数据,包括超过25,000張预览图像,并且处于不断更新的状态。”[5]用户在开放政府网站的组织机构选项中查找联邦档案局SFA(Swiss Federal Archives),即可访问到档案馆数据。
(五)维基媒体聚合
当今世界,信息量爆炸式增长,获取自由和公正的知识比以往任何时候都更为重要。维基媒体(Wiki? media CH)是瑞士官方认可的非营利组织,旨在促进瑞士及其他地区知识的自由传播。与此同时,维基百科也成为瑞士访问量排名第五的网站,代表着属于所有人的集体资源。目前,维基媒体正在推广多个项目,通过与不同机构的合作,将知识组织起来,从而为用户提供免费知识。瑞士联邦档案馆就是维基媒体的外部合作对象之一,截至目前,档案馆一共在维基媒体上发布了三个项目,供用户免费获取,分别为:(1)卡尔·杜海姆(Carl Durheim)拍摄的无家可归者照片;1852年初,伯尔尼的先驱摄影师卡尔·杜海姆受瑞士联邦的命令,拍摄了被囚禁在伯尔尼监狱的无家可归者和旅行者的照片。联邦档案馆保存了相关的221张盐纸照片,通过数字化处理将其发布在Wikimedia Commons上供大众使用。(2)第一次世界大战照片集;“第一次世界大战照片集原稿由玻璃板底片组成,被存档在《国防1848年至1950年》-E27中,联邦档案馆对该照片集进行数字化处理,并为每个底片创建了高分辨率文档和预览副本。”[6](3)日内瓦公约;联邦档案馆将数字化的日内瓦公约原始文件和与该主题相关的其他文件发布在Wikimedia Commons上,并在档案馆网站上对这段历史进行了简单的阐述说明。
(六)阿尔卑斯山新铁路线信息门户
阿尔卑斯山新铁路线信息门户网站(Alptransit)是瑞士联邦档案馆创建的用以记录NEAT铁路线历史的一个在线网站(alptransit-portal.ch),是知识共享的平台,为用户获取NEAT相关信息提供了便利。NEAT是穿越阿尔卑斯山的新铁路线,是几十年来瑞士最大的运输项目,2015年受联邦运输局(FOT)委托,联邦档案馆开始实施创建Alptransit门户网站,并于2016年5月运行至今。“目前该网站已记录了从1882年Gotthard圣哥达铁路隧道一直到今天阿尔卑斯山横断面的所有信息,包括文档、照片、电影和可视化效果等各种形式,其中,瑞士联邦档案馆馆藏中就拥有与该主题相关的大约4,500个卷宗。”[7]Alptransit门户网站中有总览、政治、社会、规划、施工五大导航块,极其详细地记录了铁路线建设的整个过程。每一步的规划、时间脉络,都用结构化的方式清晰地向公众和科学研究人员展示了NEAT的历史信息。此外,联邦档案馆还在不断地用新资源进行扩展,尽可能地为用户提供更全面的有关NEAT的信息资源。
(七)多来源数据库的资源共享
联邦档案馆为最大化地将馆藏资源提供利用,通过档案馆以外的数据库将知识共享出去,用户可通过瑞士音像文化财产保护协会数据库(Memobase)、瑞士外交文件数据库(Dodis)和可共享访问欧洲档案的数据库(APE)这些专门数据库对联邦档案馆文件进行在线研究。此外,联邦档案馆自身作为一个知识共享的平台,提供了访问如瑞士国家声音档案馆(Fonote? ca)、瑞士德语电视数据库(FaroWeb)和国际家谱数据库(Ancestry)的途径,进一步扩大了知识共享的范围。
四、瑞士联邦档案馆的特点与启示
(一)瑞士联邦档案馆开发与利用方式
1.建设档案资源利用服务平台
在档案资源的开发利用工作中,瑞士联邦档案馆以自身为开发主体,根据馆藏特点、用户需求以及社会背景,创建了档案资源利用服务平台,如在线访问平台和专题网站阿尔卑斯山新铁路线信息门户网站,充分满足了用户的线上查档需求。另外,专题性的网站还能扩充用户的知识面,提高相关信息的了解程度。同时,在平台设计上,为使用户高效准确地获取目标资源,档案馆添加了一系列便民化设计,在提高利用效率的同时,还增强了用户与网站之间的交互性,使得针对档案资源的开发与利用研究更加便利。
2.主题制模式
瑞士联邦档案馆以用户需求以及利用的便利性为出发点,采用主题制的模式,提供了包括瑞士发展史、移民史、外交政策、两次世界大战、妇女选举权等在内的15个主题内容。将档案馆分散的资源按主题进行分类,一方面可以加深相关资源间的联系,使主题与主题之间环环相扣,具有一定的内在关联性;另一方面为用户查档提供了明确指引。主题之下也同样根据内容划分模块,比如在“自1848年以来的外交政策”这一主题中,拥有“瑞士海外代表”“瑞士的人道主义传统”以及“瑞士与世界组织的联系”三大内容,清晰地结构划分能有效缩短用户的检索时间。同时,用户可根据需求下载资源的PDF版。此外,网站在每个主题中还提供了外部搜索链接,在一定程度上加大了开发与利用的范围和深度。
3.开展外部交流与合作
为做好档案资源的开发与利用工作,瑞士联邦档案馆集合多方力量,建立合作关系。一方面积极发挥主体作用,秉持着“知识共享”的理念,根据档案的开放程度以及档案的内容和特点,积极与维基媒体、开放政府网站等开展外部合作,将资源免费提供出来;另一方面鼓励公众参与,从用户需求的角度开发项目,建立反馈机制,设置档案馆联络人,并随时更新用户利用档案的注意事项。比如新冠疫情期间,为了确保用户的正常访问,及时将相关防疫要求标注在网站首页。瑞士联邦档案馆有的放矢,精准制定相关措施,为用户的知识获取与检索提供了便利,也进一步促进了用户之间的数据共享。
(二)对我国档案馆网站建设的启示
1.扩展资源共享平台
目前,国内大多数档案馆的在线平台只有档案网站一个,可供用户利用的途径较少,呈现出内容不够丰富、平台量少、形式单一等特点。而信息化时代的到来,档案利用者大多希望能够在短时间内获取更多地档案信息,减少时间精力的输出,所以实现资源共享成为档案馆建设的目标之一,也是档案用户的需求之一。而对于档案馆来说,要做好档案资源的开发与利用工作,仅靠自身力量是不够的。因此为适应时代需要,满足利用者需求,“档案馆应该打破原有的思维定式,依靠传统模式,充分利用信息时代的优势,”[8]与外部网站进行合作,扩展资源共享平台,将馆藏资源多方位、立体化的提供出来。一方面根据本馆馆藏档案的特点,有针对性地选择合作对象,可以是其他档案馆,也可以是官方性的数据发布平台;另一方面可以以某一主题的档案为主体,创建特色专题性网站。将可开放档案资源免费共享出去,在方便用户使用的同时,还可以使档案馆融入其他行业,扩大“档案”的传播度。
2.开发适合于公众参与的服务项目
公众是档案利用者,是使档案价值发挥的对象。档案馆对档案进行开发一定程度上也是为了满足用户的利用需求,因此,两者是相辅相成的。瑞士联邦档案馆在在线访问项目建设过程中,发起了一项数据挑战,希望外界能够针对项目建设内容提出一些具有创造性的思路想法。公众可以使用档案馆的数据搜索API编写应用程序以改善对文档的访问;此外,有挑战者为在线访问项目创建了3个原型,并且提出了改进API的建议,这一数据挑战使联邦档案馆的在线访问项目更加的成熟。因此档案馆在开发与利用工作中,也可以让公众适当地参与到项目建设中来,将项目进程中遇到的困难和需要改进的部分以征集的方式发布出去,以利用者的视角,为项目建设提供新思路。这不仅可以有力地提高档案意识、扩大认知度,还能完善项目建设,更有效地为公众提供信息服务。
3.对档案资源进行知识关联与组织
随着Web3.0时代的到来,互联网上的数据可不由网站个体独占与孤立,数据间的关联性以及语义化成为档案馆资源开发的目标之一。同时,随着大众知识水平的总体提高,用户查询档案更加具有目的性,如何让用户快速有效地获取更多相关信息,也是档案馆要思考的问题之一。目前,语义本体和关联数据技术在农业、工商业、医学等领域应用广泛,并取得了巨大成效,因此同样也可以将它们运用于档案资源开发工作中。“本体被认为是共享概念模型的明确的形式化规范说明。”[9]国际档案理事(ICA)于2016年陆续发布RIC(record in context)概念模型RIC-CM和形式本体RIC-O,目的是对档案进行统一的,全过程的描述,对档案资源进行知识组织与管理。因此,档案馆可以参考RIC-O及其他国际认可的本体,对各自领域的信息单元进行多层次、多维度的语义描述和组织,进而以关联数据的形式发布出去,“将档案资源融入社会关联数据‘云,”[10]从而减少用户的检索时间,扩大用户的检索范围。此外,关联数据和语义本体具有推理功能,能够挖掘与发现新的知识,为档案信息资源的开发与利用提供了新的模式。
*本文为国家社会科学基金项目“非结构化电子文件管理研究”(16BTQ089)研究成果之一。
注释及参考文献:
[1]Swiss Federal Archives. Facts and Figures.[EB/ OL].[2020- 12- 31]. https://www.bar.admin.ch/bar/en/ home/about-us/the-federal-archives/facts-and-figures. html.
[2]大卫·伍德.关联数据:万维网上的结构化数据[M].蒋楠,译.北京:人民邮电出版社,2018:3.
[3]吴鹏.高校数字校园数据共享与交换技术应用研究[D].北京工业大学,2016.
[4]Swiss Federal Archives .Project Online access.[EB/OL].[2021-02-04]. https://www.bar.admin.ch/bar/ en/home/research/searching/project-online-access.html.
[5]Swiss Federal Archives. Archive database of the Swiss Federal Archives[EB/OL].[2020-08-14]. https:// opendata.swiss/de/dataset/swiss- archives- archive- data? base-of-the-swiss-federal-archives.
[6]Swiss Federal Archives. "Active Service in the First World War" photo collection 1914-1918[EB/OL].[2019-11-25] https://www.bar.admin.ch/bar/en/home/ research/searching/search- engines- portals/wikimedia/ active-service-in-the-first-world-war--photo-col? lection-1914-19.html.
[7]Swiss Federal Archives. NRLA information por? tal.[EB/OL].[2019-11-25]. https://www.bar.admin.ch/ bar/en/home/research/searching/search- engines- por? tals/nrla.html.
[8]付永革.網络环境下民生档案资源开发利用方式探析[J].北京档案,2013(10):22-25.
[9]Studer R, Benjamins V R, Fensel D. Knowledge engineering, principles and methods[J].Data and Knowl? edge Engneering,1998,25(1-2):161-197.
[10]吕元智.数字档案资源知识“关联”组织研究[J].档案学研究,2012(06):44-48.
作者单位:辽宁大学历史学院档案系