APP下载

领域导向的数字图书馆移动视觉搜索引擎建设研究

2016-11-18张兴旺郑聪

图书与情报 2016年5期
关键词:数字图书馆搜索引擎

张兴旺 郑聪

摘 要:视觉大数据资源作为大数据的重要组成部分,其价值产生机理与转换规律具有高度的领域依赖性。文章从数字图书馆移动视觉搜索引擎的领域依赖性分析入手,运用模块化设计思想对其业务流程进行了分析,在此基础上,提出了一种领域导向的、自适应的、可演化的数字图书馆移动视觉搜索引擎。最后,分析了该引擎的各功能模块,并对该引擎的自适应性、可演化等特征进行了探讨。

关键词:移动视觉搜索;数字图书馆;搜索引擎;领域导向

中图分类号: G254.9 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016092

Abstract As an important part of big data, visual big data resources have a high degree of field dependence on the mechanism and the law of the conversion. This article from the digital library mobile visual search engine field dependence analysis, using the modular design of the business process, based on this, puts forward the adaptive evolution of digital library can be a domain oriented, and mobile visual search engine. Finally, the function modules of the engine are analyzed, and the characteristics of the adaptive and the evolution of the engine are discussed.

Key words mobile visual search; digital library; search engine; field oriented

1 引言

随着互联网和信息检索技术的飞速发展,文本、图像和视频等不同类型的视觉资源及关联信息(如评论、描述、用户行为等信息)更加紧密的融合起来,以一种全新的形式来描述视觉资源之间的语义、主题和事件,并逐渐成为各类数字图书馆重要的信息载体及各种信息搜索引擎、系统与平台的重点处理对象。据IDC于2012年发布的报告显示预计到2020年,全球数据总量将超过40ZB(约4万亿GB),其中75%来自于互联网环境,数据类型主要是文本、图像与音视频等。面对如此庞大的视觉资源,如何对其进行有效的组织、描述、表达与处理,使用户能够便捷地找到最有价值的信息,自然就成为信息检索、数字图书馆等领域亟待解决的前沿问题。

视觉资源的价值发现需求与语义检索、移动互联网技术的跨界融合有效推动了移动视觉搜索理论、模型与技术的发展。而移动智能终端、移动互联网及移动应用等软硬件条件的迅速发展,也为视觉搜索从PC端向移动终端发展提供了软硬件支持[1]。同时,各类相关技术趋于成熟,也为数字图书馆移动视觉搜索提供了全方面的技术支持。一是FRBR、RDA与BIBFRAME等可为视觉大数据资源语义本体概念模型的构建提供支持;二是链接开放数据(Linking Open Data,LOD)、关联数据(Linking Data)、资源描述框架(Resource Description Framework,RDF)等可为视觉大数据资源的组织、描述与表达提供支持;三是OpenCV、RAVL、ARToolKitPlus与CImg等开源计算机视觉库可为视觉资源的分析与处理提供支持;四是Web 3.0、移动互联网、语义检索与JAVA等可为移动视觉搜索平台建设提供支持;五是现有的Google知识图谱、百度识图、爱奇艺大脑与淘宝拍立淘等成功案例可提供经验支持。而本文的研究目的是结合已有相关理论、技术与应用成果,提出一种面向视觉大数据资源的自适应的、可演化的数字图书馆移动视觉搜索引擎。

2 数字图书馆移动视觉搜索的领域依赖性与业务分析

2.1 数字图书馆移动视觉搜索的领域依赖性分析

2015年9月,国务院印发了《促进大数据发展行动纲要》,目的是要提升“领域数据资源的获取和利用能力”、实现“领域信息资源的汇聚整合和关联应用”,“推动跨领域、跨行业的数据融合和协同创新”[3]。2016年7月,国家自科基金委发布的重大研究计划《大数据驱动的管理与决策研究》提出,“大数据价值的产生机理和转换规律具有高度的应用领域依赖性”[4]。2015年7月,国家社科规划办将“面向大数据的数字图书馆移动视觉搜索机制及其应用模式研究”列入重大招标课题[5]。视觉大数据资源作为大数据重要组成部分,其价值产生机理与转换规律也必然具有高度的应用领域依赖性。

移动视觉搜索概念源于2009年12月斯坦福大学主办的第一届Mobile Visual Search研讨会,在过去的七年里,其理论与应用研究尽管有了较大发展,但受限于移动互联网环境和技术、视觉处理技术等影响,现有相关研究还具有一定局限性,已有研究重点还是集中在视觉资源处理技术[6-7]、模式探讨[8-9]、机制建设[10]、架构分析[11]与标准化问题分析[12]等方面,而忽略了数字图书馆本身的领域特性分析、移动视觉搜索引擎研究与视觉知识库构建分析等内容的研究。与大数据、互联网环境中信息资源的泛在化、非结构化或半结构化存在形式不同,各类数字图书馆均有着较强的专业性、领域性和可拓展性,且其在视觉大数据资源的语义组织、描述与表达形式等方面有着先天优势,能够较好的满足视觉大数据资源的领域依赖性处理需求。

猜你喜欢

数字图书馆搜索引擎
Chrome 99 Canary恢复可移除预置搜索引擎选项
世界表情符号日
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略
网络搜索引擎
基于Lucene搜索引擎的研究
搜索引擎,不止有百度与谷歌
图解免费搜索引擎(之上网找歌篇)