关于科研工作中声像资源管理的思考
2018-03-29
目前在大多数科研单位中科研项目所产生的声像资源数据均为非结构化数据。这些数据包括视音频文件、图片、多媒体文件,伴随着科研工作的开展呈现指数级增长,已经成为科研工作中重要的数字文化资产。声像资源主要以录音、录像、照片等形式存在,在载体上以录音带、录像带、光盘、纸质照片、硬盘数字文件为主。一般会经历拍摄、制作、发布、内部存储归档等过程,为提高工作效率,充分发挥其价值,声像资源的全周期管理势在必行。
一、制约声像资源管理效率的几个因素
(一)海量声像资源存储困难
经过日积月累,声像资源数量和容量非常庞大,特别是视频资源,载体不同,格式多样,素材、成品种类繁多,视频文件本身又不易识别,单个文件体量大不易交换,靠简单目录化方式效率低下。
(二)无法有效快速检索共享
科研工作中需要不断查询历史声像资料,传统的人工方式和资料柜管理,查找缓慢繁琐。即使在已经数字化的计算机上搜索,从大量文件中查找到所需要的资料,甚至某一视频中的特定画面也是一件耗时耗力的工作。且大多数文档、照片、视频根本只能简单题目检索,无法进行全文检索,获取信息慢,导致工作效率低下。
(三)管理无序,精细化管理举步维艰
由于有些科研项目需要跨部门合作,某些声像资源管理,既要按照日常工作要求进行分类组织管理,又要按照资料类别进行组织管理;有的需要审核后才可发布,管理规范和要求各个部门不统一,声像资源的集中管理势在必行。
(四)安全缺乏保障
大量声像资源零散的管理状态会导致灾难性的损失,如磁带、光盘介质容易受时间、环境影响导致损失,数字文件容易被病毒感染、意外丢失、权限控制不明等情况使资料的安全无法得到保障。
二、构建科学有效的声像资源管理平台
为解决以上工作中面临的问题,需要建立一套专业的声像资源管理信息系统:将声像资源尽可能集中统一管理、能够根据不同业务特点进行整理,规范管理相关资料信息、有完善的安全机制和安全存储保障能力、具有高效查找搜索功能、能迅速在大量声像资料定位所需内容、具备简单、安全、可控的资源共享功能、将声像资料纳入资产管理及精细化管理范畴,最大程度发挥资源价值。
(一)实现声像数据资源的统一采集和收集
对于声像数据资源管理,首先需要为各种不同类型的资源及不同来源情况,提供不同的收集、采集途径和工具。需要实现各种已有资源的采集导入,包括各类资源介质,如视音频磁带、蓝光、P2卡、闪存卡、光盘、各类现有硬盘文件和纸制档案文献、照片数字化后产生的数字文件。系统应能够支持各类声像资源的导入,在导入声像资源时需要根据不同的介质使用相应的读取设备,比如以磁带为载体的视频资源需使用DVCPRO、DVCAM、BETCAM、VO RECORDER等录像机,光盘载体的视频资源需使用蓝光、DVD、VCD播放机,数据卡载体的视频资源需使用P2、CF、SD读卡器;以磁带为载体的音频资源需要录音机,光盘、唱片为载体的音频资源需使用CD机、唱片机;纸媒文件则需要使用扫描仪等。声像资源除了传统的音视频、照片文件外还包括二、三维动画文件,如FLASH文件、PPT文件、Direct演示文件、三维动画等多媒体资源。
在导入资源的同时需为其编目,也就是录入资源的关键信息,对所有数字资源进行描述,以备日后查询检索。编目的主要内容包括对声像资源进行编辑和信息整理,题名拟定,编写声像资源的主要内容、提要概述并提炼关键词。特别对于视频资源要划分节目层次,抽取关键帧,分析主题内容,描述画面状况,进行段落划分,段落划分要遵循节目内容的逻辑关系和主题内容的完整性,语言描述要精准简练。编目的工作量往往很大,但精确的编目是查询使用的基础,也是资源收集最为重要的环节。
(二)对收集的声像资源进行分类
1.按文件类型分类
按文件固有类型分类,视频类文件包括AVI、MOV等类封装;编码格式如 MPEG1、MPEG2_I、MPEG2_IBP、DV25、DV50、H.264等;音频类包括MP3、WAV等;图片类文件包括JPG、TIF、BMP、PNG等;文档类包括DOC、RTF、XLS、PPT、PDF等格式。
2.按项目和项目阶段分类
声像资源管理信息系统须符合科研工作的特点和规律,在资源组织上参照通常科技档案的组织形式,按研究领域划分项目,每个项目划分阶段,一般分为科研准备阶段、研究实验阶段、总结鉴定验收阶段、科技奖励申报阶段、推广应用阶段、申请专利过程、取得负结果项目和因故中断项目形成的声像资料,每个研究阶段包含纸制文件、照片、图纸、录音录像带等数字化后存储的声像资源和数字文档、数字影音、计算机软件、工程文件等数字声像资源。
(三)实现声像资源安全长期归档存储和管理使用
声像资源管理信息系统建设应从整体考虑,为声像资源管理搭建一个符合现代化管理手段的信息平台,实现数据统一管理,支持用户稳定安全便捷的使用资源。
1.声像数据资源的检索和利用
资源的利用是系统最核心的部分,对于集中管理的资源,系统应提供方便查询及利用的手段。
(1)资源检索查询:系统平台应具备强大的检索功能,能提供全文检索、检索筛选、高级检索、基于位置检索、分类检索、标签组检索等功能,保证用户在庞大的资源库中能够方便、快捷的找到有用的数据资源。
(2)资源在线查看
①快速预览
能够浏览及快速定位资源,应具备多种资源列表浏览模式,用户可在列表展示页面中预览内容。对于视音频、图片资源目录,提供缩略图、列表等资源列表模式。
②资源详细查看
所有资源对象可查看资源详情,包括资源对象本身,相关元数据信息,文件信息,操作信息。视音频资源查看时,可以打开视频资源的展示页面,视频内容以流媒体形式播放,用户可以方便的浏览视音频内容,通过控制工具控制快进快退,控制播放时间线等。对于多媒体类对象,可以方便的通过浏览器来查看,系统应提供基于FLASH下的资源查看模式,方便用户在浏览器完整实现类似PPT下翻页的查看效果。
(3)资源下载:支持对于资源利用过程的管理,支持资源申请下载模式,多级审批服务,完成资源快捷的下载使用。
①资源快速下载
对于普通资源,管理人员在接到使用申请后,在系统中登记资源文件信息、使用人员、使用时间、用途等信息,然后开通资源使用权限。
②资源申请审批服务
对于重要的数据资源,用户在没有得到授权的情况下,不允许下载图像或者视频的原格式版本,系统提供相应的资源申请流程,需要详细记录资源文件信息、资源类别、使用人员、使用部门、申请时间、资源文件处理信息(如视频截取时间段)等,经过审批后,管理人员按照审批单内容开通资源使用权限。
③高级数据统计
高级数据统计功能提供系统相关信息统计,包括周期内资源数量、各种存储量、资源入出工作量等统计。
2.系统安全
系统需要考虑数据存储安全、系统冗余和病毒防范三方面内容。
(1)数据存储安全
数据存储最重要的是安全问题,系统在线部分采用成熟的RAID技术来保护数据的安全。在需要的情况下,也可将大量数据从存储设备(硬盘/硬盘阵列)迁移到近线存储设备(如数据流磁带机/数据流磁带库)中进行存储。
这些资源在数据流磁带中,可在非加电的情况下实现长期可靠的保存。在必要情况下也可设定离线双备份存储资料组,当系统对这些资源进行分级存储迁移的时候,会自动将一个文件同时存储在两个独立存储设备中,在存储备份完成后,只要任何一个存储设备包含的的数据可用,都可将该文件资源完整的回传到在线存储服务器中,提供在线服务的实时处理。在实际应用中,两份数据同时不能使用的情况是一个极低概率事件,这就保证了双备份资料存储的绝对安全。
(2)系统冗余
对于承担重要管理任务的系统软件模块都能支持双机实时热备,最大程度保证数据的可靠和安全。通过系统冗余等手段,可以确保整个系统业务不间断的正常运行。
(3)病毒防范
在网络环境下,未经控制的计算机病毒往往会给系统造成巨大破坏。在系统中部署病毒防护软件,保证数据安全。