APP下载

2002—2016年国际图像检索领域文献计量分析

2017-11-09徐彤阳任浩然张国标

现代情报 2017年10期
关键词:文献计量

徐彤阳 任浩然 张国标

〔摘要〕[目的意义]图像包含了丰富、生动的信息,利用图像检索技术能够有效的对大规模图像信息进行分析、组织和处理,具有重要的实践意义。近年来,各国对图像检索的研究力度不断加大,有必要对国际图像检索文献进行梳理。[方法过程]本文采用文献计量方法和CitespaceⅢ可视化工具,对收集Web of Science数据库中有关图像检索领域的文献进行分析,梳理了文献时间分布规律、学科分布状况,并重点从作者、机构和国家和关键词频的角度探索了国际图像检索领域的主要研究力量和研究热点。[结果结论]通过总结和分析发现:图像检索领域的主要研究作者和机构大部分来自于中国;国际作者合作尚未形成较为规模的团队、美国与中国是图像检索领域研究的主要力量;目前的研究热点主要集中在基于内容的图像检索、图像分类和相关反馈这3个方面。

〔关键词〕图像检索;文献计量;Web of Science

DOI:10.3969j.issn.1008-0821.2017.10.024

〔中图分类号〕G254927;G250252〔文献标识码〕A〔文章编号〕1008-0821(2017)10-0144-07

〔Abstract〕[Purposesignificance] The image contains rich and vivid information,and it is of great practical significance to analyze,organize and deal with large-scale image information effectively by using image retrieval technology.In recent years,the research of image retrieval has been increasing,so it is necessary to sort out the international image retrieval literature.[Methodprocess]By collecting the literatures in the field of image retrieval in the Web of Science database,this paper used the method of bibliometrics and Citespace Ⅲ visualization to sort out and analyze the time distribution of relevant literatures,the distribution of disciplines,and focused on the main research strength and research hotspot in the field of international image retrieval from the perspective of authors,institutions countries and key words.[Resultconclusion]Through the summary and analysis,it was found that most of the main research authors and institutions in the field of image retrieval come from China ;the cooperation of international authors had not yet formed a relatively large-scale team.The United States and China were the main forces in the field of image retrieval.The current research focus was mainly on content-based image retrieval,image classification and related feedback.

〔Key words〕image retrieval;bibliometrics;Web of Science

隨着数据库技术、互联网技术以及多媒体技术的不断发展,数字资源早已不单单以文字的形式存在,互联网中还有大量的图像、音频、视频等丰富的多媒体资源。其中,图像资源是客观对象的一种相似性的、生动性的描述和写真,是人类社会中最常见的一种信息载体。近几年,由于博客、论坛、社交网络、微博等社交平台的发展,给人们提供了分享和交流的机会,而数据存储系统和云服务也日益完善,使得图像资源呈现几何增长。为了有效的组织、管理信息资源,自20世纪50年代,信息检索技术就已出现,它被描述为使用户的信息需求能够变为最终的有用信息的过程,对社会信息化进程起到了重大的促进作用[1]。图像检索作为信息检索研究领域中的一个分支,对快速在庞大的数据库中检索出用户需求的图像,提高检索效率具有重要的研究意义。经过20年的发展,科研人员以人工标注的方式对图像进行索引,逐渐形成了初步的图像检索系统研究体系;90年代初期,图像资源日益膨胀,以文本的方式检索图像出现了效率低、主观性强和检索结果差强人意等问题,需要新的方法去解决,因此,新一代图像检索系统应运而生。该系统通过提取图像视觉特征进行查询,大大提高了检索的效率,被称为基于内容的图像检索[2]。

近年来图像检索研究领域的发展速度很快,得到国内外学者的广泛关注,并有了丰硕的研究成果。梳理国际图像检索领域发展进程并将当前学术研究热点等特征进行系统的展示显得尤为重要。国际图像检索研究较为完善和成熟,整体来看发展状况领先于国内,并且近几年国内对国际图像检索的总结性文献较少。鉴于此,本文采用文献计量方法对国际图像检索领域相关的文献进行分析,深入探究该领域的研究结构,以期理清国际图像检索发展脉络,为进一步推动国内相关研究的发展提供理论参考依据。endprint

1数据来源与分析方法

Web of science是世界上收录最全面,具有影响力的学术期刊的数据库之一,因此本文检索来为Web of science数据库。检索时选择“题名”字段进行检索,因为主题检索会造成大量误检,影响数据有效性,构造的检索式为题名=(image retrieval or image search)and 文献类型=(ARTICLE OR PROCEEDINGS PAPER OR REVIEW)。检索时间跨度选择2002-2016年近15年的文献,最后使用NoteExpress软件去除重复和不相关的文献,共检索出属于研究范围的2 894篇文章。

本文主要采用文献计量方法和知识图谱方法对检索到的数据进行分析。结合两种方法可以综合的分析国际图像检索论文发表的规律,客观评价不同国家、机构或作者对该领域的研究现状和发展历程,并将图像检索领域的研究热点、趋势和知识结构等以客观、形象的可视化方式展现出来。主要工具选择CitespaceⅢ可视化分析软件。该软件适用于分析多元、分时、动态的复杂网络,是新一代信息可视化技术[3]。

2国际图像检索发展概述

21时间分布

研究图像检索领域的历年文献发文数量可以把握该领域的发展程度和水平,是衡量该領域发展的重要指标,对评价该领域所处的阶段、预测发展趋势和动态具有重要意义[4]。图1显示了国际近15年图像检索领域文献发表数量状况。

图12002-2016年国际图像检索文献发文时间分布

通过统计分析可得出,国际图像检索领域的发展大致经历的3个阶段。第一阶段为2002-2005年,由于文本的检索方式会浪费大量的人力,并且每个人对图像理解不相同以及其他缺陷,相关学者开始提出了新的基于内容的检索来满足用户的检索个性化需求,同时随着互联网的普及和发展,图像资源爆炸式增长,迫切需要新的技术来处理海量信息,因此图像检索的相关研究逐渐增加,发文量逐年上升。该阶段主要提出了图像检索系统的概念和实现、基于纹理、形状和颜色等基本的特征提取方法、相关反馈的概念和方法等内容。第二阶段为2006-2009年,该阶段发问数量逐年下降是因为图像检索技术达到瓶颈,但每年发文量在100篇以上,表明仍然得到学者的持续关注。第三阶段为2010~2016年,在互联网、多媒体技术以及移动端不断发展的背景和跨媒体检索、人工智能等技术的推进下,图像检索又获得了广泛的关注和重视,近几年发文量迅速增长。

22学科分布

探索国际图像检索领域的发展状况还可以着眼于研究所属的学科性质,通过深入分析其研究方向,可以揭示不同学科对推动图像检索领域的发展所做出的贡献及应用前景。表1直观展示了国际图像检索科研成果的学科分布情况。

本文统计显示了发表数量最多的前10位有关图像检索的学科领域,表1统计的数据显示,图像检索涉及多种学科,属于多学科交叉领域。其中,所属计算机科学的文献最多,共1 728篇,占总数的5967%,说明图像检索领域的发展离不开计算机技术的支持,计算机科学为推动图像检索做出了重要的贡献;其次依次为:工程学875篇占3023%、成像科学摄影技术242篇占8359%、光学226篇占7807%、电子信息136篇占470%、图书情报科学132篇占456%以及其他交叉学科的文献等。通过统计不同学科领域的发文数量,我们可以看出图像检索领域的文献广泛应用于自然科学领域,发展前景广阔。计算机科学、工程学是该领域的研究的基础,除此之外图像检索还应用于其他各个学科,这为社会发展的方方面面都起了不可忽视的作用。

从表中我们还可以得出,在今后的研究中,进一步了解图像检索领域的研究特点和发展状况时,可以重点从以上学科入手,同时可以借鉴其他学科的研究方法,扩大图像检索领域研究的内容。

3主要研究力量

31核心期刊

核心期刊是期刊中学术水平较高的刊物,是进行刊物评价而非具体学术评价的工具。核心期刊对教学科研单位申请高级职称、基本的核心馆藏、申报科研项目、科研机构或高等院校学术水平评估等都具有重要的意义。研究国际图像检索领域的核心期刊有助于了解主要发文期刊,把握国际学术研究前沿动态,对今后图像检索理论的研究具有指导意义。

依据布拉德福定律,如果科学期刊按其所刊载某一学科论文的数量多少,依递减顺序排列并划分出一个与该学科密切相关的期刊所形成的核心区期刊区以及、相关区和非相关区,各个区的文章数量相等,此时核心区、相关区、非相关区期刊数量成1∶ n∶ n2的关系。将所有相关文献划分为3个区,使每个区的文献数大致相等。笔者经过统计后,2 894篇图像检索的文献资料共有1245种涉及图像检索领域的期刊,均刊载文量为2篇。计算出属于核心期刊的刊物11种,占全部期刊类别总数的09%,相关区期刊的刊物为120种,占全部期刊类别总数的96%,非相关区域期刊的刊物为1 114,占全部期刊类别总数的894%,它们之间的比率为1∶109∶1013(n约10),并且每个区域发表文献数量大致相等,符合布拉德福定律。核心区相关期刊刊名及发文数量见表2。

由表可见,期刊《LECTURE NOTES IN COMPUTER SCIENCE》(计算机科学讲义)以总篇数327排在第一,发文数量是排在第二名期刊《PATTERN RECOGNITION》(模式识别)的35倍。LNCS于1973年设立出版,至今已发行了8 000多卷,主要涉及人工智能和生物信息等主要领域的研究,LNCS一直与计算及科研院所、众多知名学者、知名院校和学术团体之间有密切的合作,发表最新的计算机科学和信息技术的研究报告和会议论文等,学术水准较高。期刊《PATTERN RECOGNITION》于1968年设立出版,是最早发行模式识别相关文献的主要期刊之一,比较注重理论、方法的创新和应用。期刊发表涉及的主要方向有计算机视觉、图像处理、视觉神经网络、文本和文档分析、生物信息学、多媒体数据分析等,因此图像检索领域在该期刊的发文量也相对较多。endprint

在核心期刊中,除了以上2种期刊,还有《多媒体工具与应用》、《图像处理协会》、《神经计算》、《IEEE多媒体事物》、《图像和视频检索程序》和《视觉传达与影像表现杂志》等期刊。这些核心期刊均属于计算机领域的期刊,从侧面说明计算机科学领域是图像检索研究的主要力量。同时,这些核心期刊大多都是有关多媒体检索、图像检索领域的专业期刊,图像检索领域发表的相关文献向专业领域的期刊集中,所以这些期刊属于核心期刊也在情理之中。

32主要研究机构

研究机构是有明确研究方向和任务,有一定水平的学术带头人和一定数量科研人员组成的长期从事研究与开发活动的机构,是科研成果产生的重要来源。本文统计了图像检索领域排名前10的科研机构(见图2)并对其进行分析。

图2国际图像检索领域主要研究机构

从图2中可以看出,中国科学院以92篇的发文量排在第一,新加坡国立大学和南洋理工大学分别以50篇和48篇的发文量排在第二和第三名。排在前10名的机构还有微软亚洲研究院、印度理工学院、清华大学、中国科技大学、德克萨斯圣安东尼奥大学、浙江大学和美国国家航天局。通过分析发现:①中国科学院发文量遥遥领先,在图像检索领域占有一定的地位,其它机构发文数量相差不大,表明机构之间在图像检索领域之间研究水平差距较小;②图像检索领域发文量排在前10的机构有8家来自于高校,只有微软亚洲研究院和美国国家航天局不在高校之列,表明各大高校是研究图像检索领域的主力军;③排在前10的科研机构中,有4家来自中国,在科研机构中占据绝对优势,表明我国科研机构成为该领域研究的主要群体,对推动图像检索领域的发展做出了积极的贡献。

33作者发文情况

331重要影响力作者

因第一作者在文献中的贡献度较大,本文基于SSCI数据库检索结果,以第一作者发表的高被引文章数为基础进行统计,对在该领域发表高质量文章数量总被引排名前10位的作者发文情况进行分析,见表3。

从表3中看出,瑞士保罗谢勒研究所(Paul Scherrer Institut,Switzerland)的Pfeiffer,F作者发表数量虽然仅有1篇,但篇均被引高达877次,发文质量高。该文提出利用低亮度X射线成像,可以有效的表示图像,能广泛适用于医学成像和工业无损检测等领域[5]。发文质量排在第二的作者Datta,Ritendra来自宾夕法尼亚大学计算机系,在图像检索领域主要研究图像标注[6-7]。另外,排在前10的也有不少海外华人,比如澳大利亚莫纳什大学的Liu,Ying,

主要研究图像检索中的高层语义检索;英国伦敦大学伯克贝克学院的Tao,DC和美国西门子公司的Zhou,XS都分析了图像检索领域中的相关反馈机制存在的一些问题,并提出了改进的算法。

332核心作者

核心作者是推动学术创新与学科发展的骨干力量,同时也是提升期刊学术影响力和竞争力的重要因素之一。计算核心作者可以采用普莱斯指数,计算公式为:M=0749(Nmax)12,式中M 代表论文篇数,Nmax 代表统计年限中发文数最多的作者的论文数,M为核心作者。据本文统计,发表数量最多的作者论文数量为38,因此,发表了5篇以上的作者为图像检索领域的核心作者。15年间,图像检索领域发表了5篇以上的核心作者共有250人,发文数量共1 914篇,占文献总数的61%,大于半数论文,符合普莱斯指数定律。这些核心作者中,大部分作者来自中国,是图像检索领域研究的关键力量。限于核心作者数量较多,本文列举了前10位核心作者,具体见表4。

Tian,Q等人共同合作发表了许多有关图像检索模型的结构和算法,如提出基于耦合二进制嵌入的单词模型图像检索,融合了颜色和SHIF纹理特征可以有效提高视觉匹配精度[8];构建了基于视觉次模型和反向索引结构,提出了一种由两个连续的模块组成的有效的重新排列方法,提高了检索效率[9]。ZHANG HJ等人从关键词和标签等语义检索方向来提取图像信息,并在检索中引入了相关反馈方法,改善了检索效果[10-11]。其他的核心作者也提出了许多有关图像检索领域的相关理论和创新,对推动图像检索研究发展做出了重要的贡献。

333作者合作情况

探究科研人员合作情况有利于发现国际图像检索领域的主要研究团队,揭示核心团队的研究方向、了解当前该领域的前沿动态等。本文通过CitespaceⅢ软件绘制团队合著情况,其中圆点间的线条表示发文关系,圆圈表示作者,大小代表发文质量,如图3。

从图3看出,国际图像检索领域之间的作者整体联系较为稀疏,主要有3个合著团队。①Qi Tian为中心的合作网络,主要研究图像索引和聚类方法来提高图像检索效率,该团队中Qi Tian来自浙江大学、Zhou WA来自中国科技大学、Huang QM来自中国科学院、Wang SJ来自清华大学;② Tao Dacheng为中心的合作网络,Tao DC来自悉尼科技大学,主要研究医学图像检索,提出了医学图片特征提取的若干方法,如多视点的局部线性嵌入(MLLE)[12],可以有效的降低维数,提升图像的检索速度和效率。Shen HL來自北京大学,Wang M与Hua XS均来自中国科技大学,Lu YJ来自西南德克萨斯州立大学;③Zhang HJ为中的合作网络,其中Zhang HJ、Jing F、Li MJ均来自微软亚洲研究院,Zhang B来清华大学,主要研究图像检索领域中的相关反馈和基于区域的图像检索,他们还共同合作发表了许多国际会议文献。通过分析看出,国内的相关学者努力寻求合作,共同致力于图像检索领域的研究并在国际中积极扮演重要的角色。

34国际发文情况

341国际发文发展趋势

通过统计分析主要国家每年发文量变化,可以了解不同国家地区学术水平的的高低以及变化发展趋势。本文根据SSCI自有的国家地区统计功能,列举了发文量排在前6位的国家地区,如图4。endprint

猜你喜欢

文献计量
我国医学数字图书馆研究的文献计量分析