网络媒体资源管理精确化需着眼的三个方面
2015-05-30郭淳
郭淳
【摘要】网络媒体资源的爆炸性增长对网络媒体资源的管理提出了更高的要求,资源存储精确化、元数据精确化和标引精确化是网络媒体资源管理精确化需着眼的三个方面。
【关键词】媒体资源信息管理精确化管理
网络媒体资源管理精确化,就是精细和准确管理网络上的图片、视频和音频等媒体资源以提高资源的检索、利用效率。网络媒体资源管理精确化要从三个方面入手,资源存储精确化、元数据精确化和标引精确化。
1 存储精确化
图片、视频、音频这些丰富的媒体资源数据量大,内容不易更改,传输时间较长,因此要想做到对这些媒体资源在网络上精确管理,首先要把资源更加精准地压缩和命名。
网络媒体资源的总体数量规模巨大,单纯使用扩大存储容量和增加网络传输带宽的办法不太现实。网络媒体资源管理要采用数据压缩技术,把媒体资源数据量压下来,以压缩的形式进行存储和传输,既节省了存储空间,又提高了传输效率。而且媒体资源本身确实有很大的压缩潜力,媒体资源数据有大量的冗余信息,在可以接受的范围进行压缩,依然可以满足用户的需求。常用的视频压缩存储格式有AVI、MOV、FLV、WMV和MPEG等,常用的音频压缩存储格式有MP3、WMA、RA、MIDI等,常用的图片压缩存储格式有JPEG、GIF、PNG、PSD和TIFF等。其中JPEG、GIF和PNG格式是支持网络浏览的图片格式,而PSD、TIFF格式不支持网络浏览,但却是教员和学员教学中常用的图片格式,因此也是网络媒体资源中常见的图片格式。网络媒体资源管理可以做到把PSD、TIFF格式的文件存储一个GIF的缩略图供网络浏览使用,把源文件提供下载链接,这样避免了教员和学员因为无法预览而造成的无用下载,同时缩略图还可供检索使用。
图片、视频、音频等媒体资源在网络中通常还是以名字来体现,容易修改且一目了然,无论是网络媒体资源管理人员还是教员、学员都倾向于先通过名字来猜测资源的具体内容。因此,命名精确化是网络媒体资源管理精确化的基础。做到精确化命名主要包括两个方面。一是命名可以依据信息表征要素中准确表达资源特征的规则来进行,例如媒体资源的内容、类型、拍摄者、时间、地点等,辅助元数据的自动提取,在录入海量资源时节省时间和精力,避免仅使用阿拉伯数字或英文字母命名,不方便管理也无法实现资源检索;二是命名要规整,避免夹杂无关信息,辅助检索关键字的自动匹配,提高搜索引擎的检索相关度。
2 元数据精确化
元数据是对数据资源的描述,即关于数据的数据。网络媒体资源数据结构复杂,其中有很多非结构化数据是难以用一般的数据库结构加以管理。要想对这些结构化数据以及非结构化数据进行全面管理,只有通过建立网络媒体资源的元数据来实现。结构化的元数据不仅能够描述数据信息,还可以规范信息的数据结构和目录内容。
目前,国际上影响较大的元数据标准有美国高等教育协会提出的学习资源元数据规范、国际电气和电子工程师协调学习技术标准委员会IEEE LTSC制定的LOM学习对象元数据模型以及OCLE的Dublin Core元数据标准,国内主要有国家教育部教育信息化技术标准委员会的《中国现代远程教育资源建设技术规范》、军队的《军队现代远程教育资源建设技术规范》。但是在实际工作中,这些标准与规范的体系过于庞大,对于元数据描述的重要程度没有区分,而且院校特色不明显,因此对于网络媒体资源的管理没有提出明确的指导性建议。院校网络媒体资源管理可以根据这些标准,建立一套与国际标准、国家标准和军队标准接轨且具有院校特色、科学性、实用性强的元数据标准,来优化网络媒体资源的组织形式,达到网络媒体资源管理的精确化。
3 标引精确化
标引,就是通过标记指引人们方便、快捷地找到所需要的信息。网络媒体资源在组织好以后,只有对其进行标引,才能使多种途径的检索成为可能。标引越精确,检索的途径越多,检索的利用率就越高。例如,视频网站优酷,仅顶部导航就包含电视剧、电影、综艺、体育、科技、财经等23个标签,整个网站有多种分类标签、提供不同检索视频方式,以帮助用户从多种途径找到所需视频。
图片、视频、音频等媒体资源本身含有丰富的内容特征,若对其进行精确标引,可以提高媒体资源的检索效率。下面介绍图片、视频和音频三种媒体资源的精确化标引方式。
图片标引。对于图片内容有三类标引方法:一是依据图片的物理层视觉特征进行标引,如颜色、色调、纹理、形状等简单直观的特征信息;二是依据图片的逻辑语义进行标引,即画面中主体的视觉特征及空间位置关系,如图片的最上方是直升机、中间是坦克战斗群、最下方是陆地;三是依据图片的抽象语义进行标引,即人在认知层面对图像的描绘,如看到天安门广场上的阅兵感到骄傲和自豪。
视频标引。对于视频内容有两类标引方法:一是类似于上述图像的标引方法,提取顏色、纹理、边缘等特征进行标引;二是采用军事训练媒体资源管理系统的视频分层的方法进行标引,把视频划分为节目、片段、场景、镜头和帧,分层标引使视频检索可以精确到镜头级,对视频的管理和应用更加精确。
音频标引。对于音频内容有两类标引方法:一是依据音频的声学特征进行标引,如音调、音色、音量等;二是依据音频的语义特征进行标引,如听到中国人民解放军军歌感到激昂。
资源存储精确化、元数据精确化和标引精确化是网络媒体资源管理精确化研究的着眼点,对于网络媒体资源管理的精确化还有更多方面需要深入研究,将在未来的研究中开展。
【参考文献】
[1] 陈翀,闫宏飞.网络资源命名及用户命名行为的分[J].情报学报,2009(8):583.
[2] 于代军.军校信息资源分类组织研究[M].北京:国防大学出版社,2012:186-187.
[3] 吴叶葵.数字图书馆中多媒体信息的组织与利用[J].现代情报,2006(6):101-102.
[4] 涂悦.基于内容的音频分类技术及其在多媒体检索中的应用[D].广州:华南理工大学,2012:7-8.
[5] 李振富,张俊星,李毅.分布式信息资源元数据标准化研究[J].现代电子技术,2010(11):147-150.