大数据时代数字图书馆的图像资源服务研究
2019-06-11金同玲
金同玲
当前,大数据时代的到来推动了数字图书馆的建设。数字图书馆因其独具的智能性与信息共享性,其发展势头越来越猛。而在大数据时代背景下的数字图书馆的重点建设内容为图像信息资源的建设和图像信息资源的检索服务,本文将对大数据时代数字图书馆的图像资源服务与信息建设进行分析探讨,提出相应的对策。
图像信息相比于文本信息来说,更加的鲜明生动形象,它能更直观的把信息印入到人们的脑海中。社会发展迅速,传统的文字阅读方式已经满足不了人们对于阅读的需求,图像阅读悄然兴起,它相比于传统文字阅读更能激发阅读者的阅读兴趣,大量珍贵资料被以视频图像的方式收藏记录,展现在阅读者的面前,其潜在价值越来越高,图像阅读已经成为大众普遍所能接受的一种阅读方式了。而随着图像的采集技术和存储技术提升,大数据时代数字图书馆的图像资源存储量正在飞快增长,如何有效地建设以及检索信息存储量巨大而又非结构化的图像资源在目前相当重要。有效地建设以及检索图像资源能帮助图像资源价值更大化,信息共享更全面,對此,下文将对数字图书馆的图像资源服务以及服务中存在的问题进行分析讲解,提出相应的对策,保证图像资源服务的进步。
1 数字图书馆图像资源检索服务的方法
1.1 文本图像服务检索
数字图书馆图像资源检索方法有三种,文本图像服务检索作为其中的一种服务检索方法,它由人工对所有的文本信息进行标注之后,再以文本关键词作为检索关键来对图像资源信息进行检索从而找到所需图像信息。现今主流的文本图像检索引擎主要有百度谷歌等,文本图像服务检索相对来说准确率更高,但由于文本图像服务检索需要由人工对所有的文本信息进行一个个标注,投入的物力和人力巨大且耗费时间长,标注过程中稍不注意就会出差错。
1.2 内容图像服务检索
内容图像服务检索作为数字图书馆资源检索三种方法中的一种,它主要是通过对图像库里面所有图像的颜色形状等特征进行分析,建立图像的特征检索库,将分析内容存入到特征检索库内,在检索时,提取等待检索图像的颜色形状等特征,输入检索库进行检索查询。当前,内容图像服务的检索引擎主要就是百度谷歌这些,还有的就是IBM公司旗下的OBIC,Virage公司旗下的Virage图像搜索引擎以及photobook和Visual SEEK等。内容图像服务检索相对于来说比较适合实际情况下的应用,它不需要使用者对需要检索的对象精细描述就能进行检索工作。但在图像的特征提取分析过程中,其提取分析性能较差且在提取过程中对于图像特征的区分能力不高,导致图像特征提取与图像高层语义之间存在着一定的差异,而仅仅以使用者所提供的图像特征进行查询所得到的结果经常不如人意。
1.3 语义图像服务检索
在使用内容图像服务检索时,会因为图像特征提取与图像高层语义之间的差异导致查询所得结果不尽人意,语义图像服务检索就是解决这个问题的检索方法,它可以通过图像语义框架的补充来拉近图像特征提取与图像高层语义之间的差异。语义图像服务检索是先将一个基础的图像特征提取出来经过各种图像预处理提取定量的信息内容之后,再通过机器学习的方式对图像基础特征进行分析集中训练,之后再将经过分析集中训练处理后的图像特征与语义关键词联系起来,方便后续的图像检索工作更快速准确。语义图像服务检索能帮助图像基础特征提取和图像高层语义间距离的拉近,经过语义标注后的图像基础特征,就能在只有文本的基础上对图像资源信息进行检索。但语义图像服务检索方法还是有部分缺陷的,因为在对所选取的基础图像特征进行预处理时要用到图像分割等方法,图像分割对于现在的技术来说还不算十分容易,它在处理中只能将图像简单分割成几个区域,图像分割之后的结果缺乏语义,而基础图像特征提取与图像高层语义之间本就存在着一定的差异,其不能直接推导进行检索。大部分的语义图像服务检索在检索过程中都是对单幅图像进行检索的,它不能将检索建立在多幅图像,这就使语义图像服务检索存在一定的局限性。
2 数字图书馆的图像资源服务所存在的问题
2.1 图像资源服务中图像资源建立不够广
大数据时代的到来使“数据”多方面的应用到人们的生活中,数字图书馆也因此加快了建设步伐,虽然数字图书馆的建设步伐快了,但它在图像资源建立方面还不够完善。现今数字图书馆中对于图像资源的建立主要是针对专题性的图像资源,它没有对于所有的图书资源信息进行收集,图像资源建立不够广缺少全面性,在使用者对图像资源服务的使用过程中不能对使用者提供全面的综合性图像资源。
2.2 图像资源信息缺少资源协作共享性
不受时间空间的限制是大数据的特点和优势,在大数据时代下建立图像资源服务就是为了打破以各自为战为目的建设的数字图书馆,从而实现所有图书馆之间的资源信息共享。但就目前来看,数字图书馆的建设还是以单个单位为建设范围,依旧是各自为战,并没有实现图书馆之间的资源信息共享。图像资源的信息缺少资源协作共享性就影响了大数据时代下真正的数字图书馆的建立,数字图书馆难以形成一个规范开放的资源信息共享平台。
3 完善图像资源服务的对策
3.1 对数字图书馆的检索知识加强学习,提升服务水平
当前,大数据时代的到来促进了数字图书馆的发展,数字图书馆成为大数据时代背景下的一种新型图书阅读模式。而数字图书馆的建立又需要多方面的对各种图像信息资源进行收集和图像信息资源服务平台的建立,所以要想图像资源服务做的更好,就需要扩大数字图书馆图像检索知识的学习人群,并对其学习深度进行加强,帮助人们学会如何使用数字图书馆的检索系统。深度学习能对图像基础的中低层特征进行更好的挖掘,而学习人群的范围不应该只包括数字图书馆的工作人员还要包括社会的普罗大众。数字图书馆的图像资源服务具有超强的智能性,它对使用者使用的图像资源检索功能具有超高的熟练度要求,使用者能熟练应用图像资源检索功能才能帮助使用者提供的检索对象与数字图书馆内所储存的图像信息特征快速比对,提高信息检索的准确率以及信息检索的效率。而在加强提升数字图书馆的检索知识水平时,数字图书馆的工作人员应该对检索知识了解更熟透,这不仅能为其他应该加强学习数字图书馆检索知识的人群提供榜样,还能帮助在数字图书馆中进行功能使用的使用者解决使用过程中出现的问题,帮助使用者更好的使用。数字图书馆就是图像基础的信息提取和图像高层语义的对接结合,它蕴含的信息资源极其丰富且使用价值极高,要想数字图书馆的使用价值最大化就要加强对于数字图书馆的检索知识学习,掌握图像资源服务信息才能帮助数字图书馆更好的使用。
3.2 对数字图书馆图像资源服务进行迁移学习,提高效率
数字图书馆的建立能帮助图像信息资源之间共享协作的进行,而在共享协作的过程中会出现信息资源迁移性的问题。对于这种问题,必须对数字图书馆的图像资源服务进行迁移学习,迁移学习就是对当前已经大量被标记的有效的信息资源进行学习,而后将其加入到当前的数据集中去。迁移学习能帮助数字图书馆在进行图像资源检索服务时减少图像资源的检索时间,提高图像资源检索效率。古籍图像资源就是一个典型的需要进行迁移学习的资源,因为古籍图像资源相对于其他图书图像资源来说,图像资源量少,而对古籍图像资源进行迁移学习之后就可以将大数据区域内学习到的知识迁移到古籍图像资源中去,丰富填充古籍图像的资源存储量。在进行有关古籍的检索工作时,能快速准确的检索到有关古籍的图像资源信息,提高图像资源检索服务的效率。同样的,对于数字图书馆的图像资源服务的迁移学习,也应该由数字图书馆的工作人员身先力行,做好数字图书馆图像资源信息的迁移学习工作,在使用者对数字图书馆图像资源服务进行使用时才能对其进行指导,帮助使用者在使用过程中对于迁移学习的渐进进行,在提高数字图书馆图像资源服务的检索效率时将数字图书馆的图像资源信息价值发挥到最大性。
3.3 推进大数据技术的应用,提高图像资源服务的智能性
当前大数据时代发展的背景下,大数据将是推动数字图书馆发展的最强主力,要想数字图书馆的发展更好,就需要在数字图书馆的图像资源服务中推进大数据技术的应用,打造独特的图书馆服务平台,使数字图书馆内的图像资源信息做到最大化的信息共享协作,将数字图书馆内的图像资源信息价值深度挖掘出来。在数字图书馆的发展规划中,可以运用大数据技术对数字图书馆内的图像资源信息使用情况进行分析,为未来发展规划提供更可靠的依据,帮助数字图书馆未来的创新发展。数字图书馆可以加强阅读者与图书馆的互动,使阅读者感受到数字图书馆的智能性和人性化服务,让越来越多的人喜欢上数字图书馆,推动数字图书馆的发展应用。
4 结束语
相对于传统的文字阅读方式来说,图像阅读方式更能满足人们的需求以及更能深度的激发人们的阅读兴趣。大数据时代背景下建立的数字图书馆其所提供的图像资源服务因其独具的智能性,能更好的服务人们,满足人们的阅读需求。而数字图书馆的图像资源服务质量好坏与数字图书馆的图像资源信息收集有着很大的关系,所以数字图书馆要完善图书馆内的图像资源收集,并对馆内工作人员对于数字图书馆使用系统的熟练度进行一定培训加强,保证数字图书馆的图像资源服务的使用性和最大使用价值。
(作者单位:泰山學院图出馆)