“数字中国”背景下档案馆服务新形态
——影像档案交互服务模式机理分析
2020-12-27车婷婷
车婷婷
2019 年5 月6 日—9 日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、福建省人民政府共同主办的第二届数字中国建设峰会如期举办,会上“数字政务”成为热点话题。5 月9 日,国家档案局在电子政务分论坛发布《推进电子档案单套管理的政策与步骤》,旨在提高行政效率,提升档案资源安全保管意识及水平。结合当前档案局、馆逐步分离的现实情况,未来档案馆将向服务的、数字化的、开放的公共事业单位转型。随着“数字中国”伟大工程的建设与发展,档案馆的用户智能体验水平、数字化管理与服务水平成为未来档案馆工作质量的重要衡量标准。数字档案馆的建设并非一朝一夕之事,需逐步推进,而随着语言识别技术和全息影像技术的发展成熟,基础技术支持已具备,国内外各行业实践案例日趋丰富,由此,在前期影像档案交互式传播特征研究的基础上,针对我国档案馆影像档案交互式传播服务模式展开机理分析。
影像档案交互传播旨在通过人机交互技术与人工智能技术,增强档案用户利用档案资源的体验感,提升用户与计算机主动互动、自然互动的流畅感和真实感,借助语音识别技术实现用户自然语言与计算机程序语言的无障碍命令互动,借助虚拟成像技术提升用户阅读档案资料的临场感,最大限度地还原历史事件的真实环境,令用户查阅影像资料的同时能身临其境般回归事件原始场景,结合当前我国5G 技术优势,大力提升信息传递速度,科技赋能提升影像档案的阅读效果。
一、影像档案交互式传播流程图示及分析
人机交互的核心技术是语音识别技术和档案主题词规范化著录,影像档案的互动服务体验核心技术是全息影像技术以及影像资源的高度关联性。与此同时,还要保证档案信息资源的安全性,以及注重档案信息资源著录的及时修正和档案资源及其关键词的增量补充。基于上述关键问题,建立档案馆影像档案交互式传播服务流程模型,如图1。
图1 档案馆影像档案交互式传播服务流程模型简图
用户进入档案馆互动服务体验专区,由人脸识别技术自动捕获用户身份信息,验证用户身份后自动安全登录档案馆用户服务系统,并授权用户相应利用权限,用户开始体验档案馆交互式传播利用服务。
用户使用自然语言,甚至可以使用网络流行用语、方言,发出对话(如图1 中a 所示),服务体验区的语音识别系统捕获用户的语言信息,并解析语言,捕获并提炼关键词,将捕获到的用户自然语言中的关键词,根据语境、词义,匹配馆藏数据库中的著录关键词(如图1中b 所示),我们将关键词库称为关键词库1,关键词库1 中包含了所有馆藏数据库档案资源关联的关键词,甚至包括未开放档案资源、非影像档案资源的关键词;关键词库2 包含馆藏全部已开放影像档案资源关键词。系统将关键词库1 中匹配的结果与关键词库2 匹配,匹配并筛选已开放影像档案资源关键词(如图1 中d所示),根据筛选结果匹配高度关联的全息影像档案资源(如图1 中e 所示),传送至中控平台,在发送给用户前再进行一次安全性检查,检验其开放属性(如图1 中f 所示),最终借助全息影像设备将匹配结果的全息影像投射至服务体验区(如图1 中g 所示),实现完整的影像档案人机交互服务体验过程。
关键词库1 关联全部馆藏档案资源,而关键词库2关联馆藏已开放全息影像档案资源库,这样操作一方面便于区分已开放全息影像档案,另一方面为档案馆逐步推进全息影像档案转制工作提供过渡时间。
二、影像档案交互服务模式的现存难点
随着语音识别技术和虚拟影像技术的不断发展成熟,影像档案交互式传播过程中呈现出内容聚合性、动态关联性、功能平衡性、渠道多元性、形式灵活性、体验创新性、利用主动性、载体创新性、经济环保性的特征及技术优势,令档案服务品质、仿真体验感提升。但与此同时,当前国内技术普及以及成本效益等实际因素影响下,传统影像档案阅读模式向交互传播服务模式的转变依然面临许多困难,需档案工作者们正视困难,分步骤、分阶段地逐步攻克难题。
1.技术成熟度不断提升。影像档案交互服务模式的构建,需要建立在以语音识别技术和全息影像技术为核心的基础上,以档案著录的标准化、规范化以及主题词的科学著录为保障,以数字档案资源数据库的建设与维护为后盾。近年来,我国档案管理技术人员的业务水平不断提高,在主题词标引、档案著录以及档案资源数据库的建设、管理与维护方面积累了丰富的经验。我国语音识别技术也呈现强势发展,科大讯飞、清华同方等多家国内科技公司硕果显著,并在许多领域应用广泛。在自主研发技术不足的情况下,未来档案馆可以通过技术外包的方式实现。但是作为核心技术之一的全息影像技术,在国内的应用尚不广泛,目前主要用于舞台表演领域,且国内的成熟技术团队也较少,加之这项技术所需的耗材设备量大且价格昂贵,使得许多国内影像技术团队往往不敢轻易涉足,由此,未来档案馆在引进全息影像技术方面,无论是借助技术外包,还是自主培养技术团队,都将在时间、人力、物力、财力方面面临巨大挑战。
2.任务量大,层次复杂。实现影像档案的交互式服务,其过程复杂、工序多。首先,重新整理著录影像档案,特别是将原先零散的、碎片式的档案资源,通过主题词重新关联回到事件中心,这个过程需要档案人员重新梳理事件全部关联档案,甚至包括事件本身所涉及的人物档案;其次,将传统的影像档案转制成全息影像,不仅需要大量的设备支持,还需大量的工作人员同时参与;第三,全息影像的转制工作环境和最终投射空间的搭建,需借助建筑团队完成;第四,语音识别的关键词和档案著录的关键词之间的关联性,依赖于语音识别技术人员和档案著录人员的沟通合作;第五,在建设期间,为了保证档案以及档案利用服务的安全性,必须阻隔馆藏档案库房的外联通道,单独保管。可见,影像档案的交互式传播服务模式的实现,需要将任务模块尽量细分,既明确分工,又要保证有序沟通与合作。
3.建设周期长,资金需求大。影像档案的交互式服务模式的实现过程,是一个长期建设的过程,即使完成了现有影像档案的全息影像转制工作,随着新档案的不断产生,这项工程将不断建设。未来,在“数字中国”以及“智慧城市”的建设布局下,数字档案馆的数字化转制工作将成为常态化工作内容,优化档案用户体验感、提升档案用户服务质量将是数字化的重要衡量标准。因此,这将是一场长期项目,前期投入的资金需求是十分庞大的,除了耗材设备的资金需求,还包括技术开发、档案整理的资金需求。但是也不必悲观,数字化的时代已经到来,数字化的服务是未来公共服务的大势所趋,前期资金投入是趋势所致,后期随着技术的不断成熟和普及,这项工程的成本会越来越趋于平稳。
4.网络词汇的增量著录。当今社会,90 后、00 后已逐渐步入工作岗位,成为各行业的主流建设者和用户。90 后甚至00 后、10 后的成长环境是十分特殊的,伴随着互联网的快速发展,90 后、00 后用户有着极强的互联网触觉,对移动设备和互动服务使用更是深谙其道。与此同时,这些用户也制造出了许多独特的互联网词汇,广泛应用于工作与生活的方方面面,甚至国家语言资源监测与研究中心和商务印书馆会评选年度网络用语,商务印书馆更将网络用语修订进《现代汉语词典》中。这无疑给未来档案工作者提供了新的工作任务,在实现影像档案语音识别的过程中,不能仅关注传统的关键词,还应关注新增网络用语的关键词,及时进行增量著录,这样才能保证未来用户的无障碍人机对话。
5.操作指南待形成。当前国内关于影像档案交互式服务的研究并不多见,国外学术界对于全息影像技术在档案管理中的应用方面的研究已开展多年,并已初见成效。例如,美国南加利福尼亚大学Shoah 基金会的新型互动式口述历史项目,在2016 年展示出了阶段性成果,将二战的犹太幸存者口述历史影像转制成全息影像,利用语言识别技术与公众实现无障碍的人机互动,令用户体验超高度仿真;在此基础上,该基金会在2016 年与南京大学合作启动一项旨在保留南京大屠杀幸存者口述历史影像档案的项目。国内针对该领域的独立研究尚不丰富,针对基层工作的影像档案转制业务的指南亟待形成。
三、交互服务模式发展趋势的焦点问题
1.馆藏档案载体的安全性。在用户体验交互式服务过程中,进入档案馆区域后,设立专门的服务体验区域,一方面,由于在数字档案馆建设的过渡阶段,不能一步实现全馆范围的数字开放服务;另一方面,在地理范围上保证馆藏资源的安全性。
2.未开放档案资源的安全性。由于保管期限不同,未开放档案资源不提供利用服务,但对于开放目录用户享有知情权。基于此,根据馆藏档案资源标引、著录关键词,制成关键词库(如图1 中关键词库1 所示),关键词库1 与馆藏数据库保持物理关联,隔断互联网(如