图书馆智慧媒资管理平台建设实践探索*
2023-03-13曾洁
曾 洁
(广州图书馆 广东广州 510623)
1 引言
在大数据时代,图书馆趋向从环境、资源、服务、空间、内容等多个维度寻求新的平衡,在由“数据资源环境”向“知识资源环境”的转变中建构新的知识组织体系,并在开放式的技术创新环境中开发数字图书馆空间的新功能,发掘内容资源的新价值[1]。利用人工智能技术将图书馆数字资源进行细颗粒度建设,对多元的知识内容进行结构化,让资源实现充分互联互通,为读者提供人性化、专业化、智慧化的知识服务,是图书馆未来发展的趋势。一直以来,作为图书馆资源的重要组成部分,视听资源因受技术、存储、管理等方面的制约,很难充分发挥其知识服务的功能。本文通过分析图书馆媒资管理现状及存在问题,结合广州图书馆建设公共图书馆智慧媒资管理平台实践,探讨智慧媒资管理平台对智慧图书馆建设的意义,为图书馆从传统的数字资源建设向知识发现、知识组织、知识管理、知识服务转型提供思考路径。
2 国内图书馆媒资管理现状及存在问题
2.1 图书馆媒资管理现状
媒资,即媒体资产,主要包括视频、音频、图像、文档等多种内容资产。这个概念最早出现在广播电视行业,即电台、电视台等媒体机构生产的大量音视频、图片、文字等业务数据。媒资管理平台,即结合计算机、互联网以及多媒体技术,解决媒体资料的编目检索、存储与发布的平台[2]。笔者在知网上以“图书馆媒资管理”分别为题名、全文、关键词进行检索,查到的文献非常有限。最早开始在图书馆领域进行实践探索和研究媒资管理的是浙江传媒学院图书馆员阮海红,其发表的论文《媒资内容管理实验研究》从视听资料载体的复杂多样、介质保养存在的问题等方面对图书馆媒资管理的必要性进行了论证,分析了媒资管理系统的特点和功能,并通过规范元数据描述来创建独具特色的数据库,从而提升资源价值[3]。竺亚珍、马惟哲在《高校图书馆媒体资产管理系统建设》一文中探讨了适合高校图书馆的媒体资产管理系统,并从信息处理、内容管理、内容存储和应用等方面分析了浙江传媒学院建立的媒体资产管理系统[4]。钱静在视听资源储存介质保存年限短、检索和共享困难等方面分析了媒资管理的必要性,并结合淮安市楚州区图书馆实际应用,建立包括采集上载、编目检索、存储、应用发布等子系统在内的媒资管理系统,并就建设过程中注意的问题提出建议[5]。资料研究发现,图书馆建立媒资管理系统更多是为了解决视听资源存储、编目检索、应用发布,但还未对视听资源的知识进行精细化揭示和专题聚类,深度挖掘视听资源的文献价值。
2.2 图书馆媒资管理存在的问题
广州图书馆广州纪录片研究展示中心(以下简称“中心”)是中国第一家致力于纪录片收藏、整理、研究、展示、服务的公共文化平台,主要通过资源采购、社会捐赠、资源共享等方式建设纪录片馆藏资源。目前,馆藏纪录片资源4 000余部/集,其中音像出版类DVD介质的纪录片约占90.8%,数码格式的纪录片占9.2%;与本地广播电视台共建共享的城市数字影像资源近两千小时。因无专门的系统对纪录片资源进行统一的数字化管理,导致中心馆藏资源在存储安全、版权管理、应用服务等方面受到很大制约。
(1)资源存储安全风险。中心大量的音像出版类纪录片资源仍然是依靠DVD、VCD光盘介质存储,由于受环境影响和自身老化,有可能导致这部分存储的影像质量下降,甚至数据丢失;一部分数字资源存储于移动硬盘和服务器。媒体资源的分散性存储,对数据库的安全性和统一管理带来风险和难度。
(2)资源版权管理风险。中心馆藏的纪录片及城市影像资源的版权在使用范围、期限、播映次数等方面不尽相同,目前只能依靠人工对版权信息进行统计管理,但随着馆藏量的日益增长以及版权使用的多样性,存在版权使用和管理的风险。
(3)编目较单一。目前馆藏纪录片资源均按照《中国文献编目规则》和《中国图书馆分类法》进行编目。但是中心馆藏中有一部分是与广播电视台共建共享的城市影像资源,这些资源中包括电视节目、新闻等,则按照《广播电视音像资料编目规范》进行编目。电视资料部分的元数据项从上到下分节目层、片段层、场景层、镜头层四个层次,每个层次分别包含相应的元数据项。因此,有效统一、规范中心馆藏资源的编目规则,对今后为读者提供更精准、高效的查询检索尤为关键。
基于以上问题,在图书馆建立媒资管理平台是一种行之有效的解决方法。调研发现,数字媒资管理平台从功能、服务形态和应用方面已难以满足精细化的知识服务需求。数字图书馆的服务模式要从提供文献资源的检索获取利用向提供深层次多样化的知识服务转变,这就离不开各类智能技术的辅助[6]。因此,以人工智能为驱动的智慧媒资管理更符合智慧图书馆的发展趋势:一方面,可使视音频资料在从采集上载到发布下载的处理过程和工作流程上实现自动化管理,从而节约管理成本、人力成本和时间成本,让媒资管理更为科学、高效;另一方面,对媒体资源进行细颗粒度智能标签标引和专题聚类,可提升检索效率和检索结果的准确性,以及媒体素材的应用价值。数字媒资管理和智慧媒资管理的区别如表1所示。
表1 数字媒资管理和智慧媒资管理比较表
3 广州图书馆智慧媒资管理平台建设实践
3.1 建设目标
通过搭建广州图书馆智慧媒资管理平台(见图1),实现对存储在不同介质的视音频等媒体资源的采集,并对编目元数据描述信息、版权信息等进行统一规范和管理。利用人脸识别、语音识别、文字识别、知识图谱、语义网络分析等智能计算技术,对媒资内容中的人物、机构、地点等进行识别分析并生成标签,通过抽取关键词来对标签进行标引,实现资源的专题化聚类和精细化揭示。
图1 广州图书馆智慧媒资平台建设流程图
3.2 建设内容
3.2.1 平台框架
采用云平台相关技术,构建包含软件应用层、平台服务层、基础资源层在内的智慧媒资管理平台(见图2),并通过“平台+工具+服务”的技术框架,将多元的服务和工具组合满足不同的业务需求。采用分布式的流程设计,在现有基础架构上,实现媒体资源、媒体数据、业务数据分级存储。
智慧媒资管理平台框架设计分三层:
(1)软件应用层:媒体资源管理平台在业务软件上包括远程回传、文件上载、辅助技审、内容编目、检索浏览、出库下载、版权管理、近线归档、数据统计等功能。
(2)平台服务层:提供媒体资源管理平台后台支撑和应用服务,包括分布式框架服务、负载均衡高可用服务、转码服务、技审服务、迁移服务、资源导入导出服务、资源归档服务、编目标引服务、工作流引擎服务、检索引擎服务、分级存储服务、接口服务等媒体专用服务。
(3)基础资源层:主要包含计算资源、存储资源及网络资源。
3.2.2 资源采集
智慧媒资管理平台通过工作站,对存储在包括光盘、本地磁盘、网络磁盘和移动硬盘等不同介质的媒体资源进行采集。收集获取文件的元数据描述信息,并抽取文件 EXIF 信息等数据进行存储记录。采集过程中对视频质量进行检测,识别并标识所采集视频资源中的彩条、黑场、静帧等文件损坏情况。采集工作站支持VOB、DAT等光盘文件格式,以及MP4、WMV、MPG等常见数码视频格式和MXF、AVI、MOV等专业视频格式,同时支持对4K、8K等超高清视频的采集。
3.2.3 智能标签标引
在智慧媒资管理平台中,标签是指视频片段的关键词集合。它通过智能信息提取和融合推理,将人物、地点、机构等类别的关键词进行识别,输出为对应视频的标签。标引是对视频内容进行的一个赋予检索标识的过程,点击标引信息可以自动定位到呈现的具体一帧视频。
智能标签的形成经历了输入、处理、输出三个环节。首先对生产过程数据、录入数据和智能识别数据进行补充、转换、分解或映射,形成标签的基本元数据、版权元数据、内容标签数据。其中,生产过程数据包括入库时间、入库者、入库来源等信息,根据定义好的信息进行自动化编入目录;录入数据包括标题、版权、主题词等,由人工录入;智能识别数据则是通过语音识别、人脸识别和OCR识别获得。语音识别是将视频中的声音进行连续语音识别并转文字,进行语义分析,自动生成关键词和入出点、自动摘要、自动分类等信息;人脸识别则是通过自动识别和建立人脸特征模型,标引视频画面中特定人物人脸位置,对人脸抽取特征后,用人脸特征模型进行身份确认;OCR识别是对视频中文字区域进行识别分析,其结果包含视频中的文字内容和对应的文字坐标信息。最后,经融合推理后的标签输出形成为内容结构化数据,包括节目、镜头、场景等分层结构化标签。输出的结构化数据可通过人工进行修正,修正的结果会作为学习的样本重新带回数据处理过程。利用智能计算技术生成精确到视频内容片段的标引,生成对应的标记点信息,通过点击标记点可以快速定位到标记点位置,系统还可自动将标引信息与人工智能信息库比对校验,确保定位到标记点位置的准确性。
3.2.4 编目元数据
在实践中发现,传统的著录方式对视频资源的揭示深度越来越有限,因此,广州图书馆智慧媒资管理平台的编目元数据在设计之初,从内容描述、技术参数描述和管理描述等方面,在《中国文献编目规则》和《中国图书馆分类法》的基础上,融合了《广播电视音像资料编目规范》的著录规则,即可对各种视音频文件进行基于时间线操作方式的多级编目(包括场景层、片段层、镜头层),对所选媒体资源内容拆分的结构要求符合《广播电视音像资料编目规范》。一方面可满足各类纪录片编目信息,另一方面可满足与广播电视台共建共享资源的编目。
3.2.5 专题汇聚
平台可对已进行智能化标签标引的媒体资源进行重新聚类,形成主题化、专题化的分类揭示,从而实现智能化知识发现。馆员可在后台,按照自定义视频分类,根据需要的关键词,自动匹配标签标引信息进行主题化、专题化的汇聚和展示,符合设置条件的片段或者文件自动形成专辑。专题汇聚技术应用是基于智能分析结果内容,分析结果根据大数据的同类汇聚,最终以关键词与标题的提取进行汇聚呈现。例如,要建立一个与“军事”相关的视频专题,可以在系统后台页面创建专题,通过选择智能汇聚,将包含有“军事”标签的视频自动汇聚到创建的“军事”专题中,大幅度提升了资源的专题分类管理和聚类揭示。
3.2.6 版权和内容安全管理
严格按照《中华人民共和国著作权法》和《网络信息传播权保护条例》,对纪录片等视频资源进行统一的版权管理。在平台版权管理模块,可自定义填写资源的版权相关信息,包括版权方、责任人、版权类型、版权期限、版权使用区域等,也可批量对版权信息进行统一录入,平台还会根据版权授权期限进行自动到期提醒,确保资源版权管理的规范,避免版权使用风险。为防止涉敏内容出现在应用前端,可对媒资素材进行密级管理,并做公开、非公开、机密等权限的区分,确保资源内容的安全性。
3.3 平台建设中值得关注的问题
智慧媒资管理平台建设中需注意以下四个方面的问题:
(1)语音识别。在有限预算内,最好是对视听资源的语种进行总体评估,从而选择相应的语音识别功能模块。比如广州图书馆有一部分纪实影像资源是粤语,那么最好选择以普通话、粤语为主的语音识别功能模块。语音识别的语种模块越多,所涉及的费用也必然会多,因此在项目开始之初,需将这部分费用纳入到统筹规划中考虑。
(2)存储方式。如条件允许,最好在媒资管理平台的建设上采取云存储与本地存储相结合的模式。因地方政策原因,广州图书馆的资源要求存储在政务云上,所以媒资管理平台运行会受馆内带宽影响,也将对未来业务扩展带来一定的限制。
(3)人脸样本库。为确保视频中的敏感人物及相关场景、片段不会出现在读者应用前端,需在平时视频入库时做好人脸样本采集,不断丰富人脸样本库。一旦发现问题可即时智能匹配搜索相关视频予以封存。
(4)智能水印。在智慧媒资管理平台中最好对视音频数字化内容,尤其是源码文件、高码资源加注隐性水印,以保护版权的属性,便于追溯素材的来源。
4 智慧媒资管理平台对智慧图书馆建设的作用
智慧图书馆是图书馆在新的技术环境下为满足用户新需求而产生的新型形态,是图书馆发展的方向,是智能技术和人文智慧的融合[6]。智慧媒资管理平台建设,将发挥以点带面的作用,通过智能手段深度挖掘视听资源价值,对图书馆从以文献检索传递为主向以满足用户对信息利用多元化需求为主的知识服务转变,具有探索意义。
4.1 智能标签与编目元数据结合,提升图书馆的知识发现能力
图书馆服务就是要将这些大量的数字资源进行知识组织、知识管理和知识服务,而知识发现无疑是其中最重要的亮点[7]。智能标签与编目元数据结合,让知识发现更为全面和精准。智能标签的优势在于目标单一,对资源内容进行提炼、概括成为词语,这种形式便于计算机进行统计性规律的挖掘与应用。标签的劣势在于仅用词语描述,信息表达往往不够精准、全面,细节容易丢失,复杂关系难以体现。编目的优势在于结构严谨,有一套从管理、内容、技术指标等各个层面的完整体系对资源进行描述,但编目的劣势在于著录时往往思考维度单一,资源内容信息著录不足,同时由于编目元数据的复杂结构,也不利于计算机的统计分析。
因此,智能标签和编目有着很强的互补性,实际应用中二者的结合可为用户带来更好的使用体验。当用户需要查找某一具体资源,采用纯标签检索方式查不到时,可以再联合编目元数据内容进行联合检索、扩大范围,提升信息查询的全面性和精准度,从而提升图书馆知识发现能力。
4.2 基于智能标引的时码定位,强化图书馆的知识服务功能
在智慧媒资管理平台中,每个内容标签都是知识颗粒,都有它的作用域,即标签标引与视频画面有着强相关。在一个内容单元内,精细化标注该标签所对应事物在画面上出现的多组入出点信息,即时码信息。这样的标签在数据结构上会对应多组入出点信息,并可以时码段方式进行展示,方便在找到素材后快速准确定位到检索用户最感兴趣的镜头画面上,不需对视频画面进行逐帧拖移查找,大大提升画面定位效率。
图书馆除了采购大量的视频资源,同时还需开展自制视频的工作,如公开课、口述史拍摄等,如要对大量的视频素材进行剪辑,智能标引可大幅度提升对素材的精准查找,使后期制作越发便捷。同时,馆员在对视频素材进行汇编时,标签结合智能标引的应用,有助于馆员高效完成汇编工作。智能技术与馆员智慧的融合,将为读者提供嵌入式服务奠定基础,驱动图书馆的服务升级。
4.3 基于智能聚类的知识组织,充分发掘图书馆的资源价值
在智慧图书馆发展理念中,知识组织在知识和信息的获取与交互方面扮演着重要角色。知识组织在前向资源驱动和后向利用导向作用下,通过知识挖掘、知识发现、知识融合、定制推送、智能搜索等多种智能技术,发现隐含在信息中的有用信息单元并组织成知识库,然后提供给用户,满足用户知识的需求,为用户提供卓有成效的知识服务[8]。
基于资源内容和知识的智能聚类,就是依靠资源标签的相似性对知识进行组织、融合。比如,用户在浏览一个视频中的镜头是广州珠江,系统通过语音和OCR字幕识别出“广州”和“珠江”两个高价值标签,用户就可以通过这两个标签找到一系列包含有“广州”“珠江”标签的视频,也就是在“广州”和“珠江”间建立了知识体系联系。未来,如果在不同标签间建立关联,基于标签建立各类知识体系,形成上下位关系、平行关系,还可以形成更有价值的内容推荐。这种智能聚类功能将满足用户高层次知识需求,从而提升资源价值,增强用户黏性。