基于大数据的图像检索关键技术
2019-01-11陈娜肖爱萍郑刚
陈娜 肖爱萍 郑刚
(兰州工业学院,甘肃 兰州 730050)
0 引言
随着互联网信息技术的普遍和完善,越来越多的信息数据资源被广泛应用到社会诸多领域,大数据资源具有广泛性和复杂性等特点,在信息资源被扩充的同时,储存系统的性能要求不断提升,本文结合当前大数据资源检索现状,对当前大数据图像检索技术的革新和完善做深入探索。
1 图像的内容性阐述
从传统意义上讲,对于图像内容的设置是一项精简的模型,而且不同的图像特征主要包含以下数值、语义以及关系等三种形式,图像检索主要是通过图像的纹理、形象、颜色特征和人们对于图像内容的理解等语义特征来体现。首先,对于图像的颜色特征而言,具有全局性的特点,在图像描述应用中趋于简单化,而且更加行之有效;合理的颜色能给有利于确保提供最优化的图像视觉,所以与其他基本元素相比,颜色特征的应用意义更为广泛。然而,颜色特征也有一定的缺点,那就是在图像区域的大小和旋转中缺乏敏感度。图像特征的索引往往由颜色集、聚合向量以及平均查准率等组成,通过平均查全率和平均查准率的有效应用,可以针对性的比较其优点[1]。其次,形状特征也是图像的基本元素特征之一,在物体描述中具有重要的应用作用,许多数据需要在2D 图像领域范围内完成检索,而该领域主要由两部分组成,其一就是曲线,该曲线最大的特征就是封闭式,其二就是曲线的内容,由此可以推导出,区域特性是形状描述中的主要内容,其次就是该曲线的边界;然后,图像的纹理特征是第三个特性,该特性与上两个特性相比最大的区别在于纹理特性具有一定的统计性功能,与图像基于像素点的特征有所不同,需要完成对于像素灰度级的统计计算;而且图像纹理特征还能够客观体现图像的局部强度变化,并且可以通过多种检验方法完成检验,其中统计法和频谱法是最常用的两种。最后,空间关系也是图像的基本内容之一,从图像位置和方向入手,探究不同空间体系中的位置特性,从相对和绝对不同的空间体系入手,保证探索的准确性。由此,综上所述,图像颜色特征是诸多特征中最行之有效的选择。
2 大数据资源的挖掘概述
随着计算机技术以及网络技术的迅猛发展,社会诸多领域对于图像信息资源的需求越来越高,这就要求在大数据资源挖掘中,充分考虑数据检索的准确性,降低检索所耗费的时间,提供针对性,尤其是在图像信息资源丰富多样的今天,数据资源体系涵盖的容量较大,且对于数据的处理速度也越来越快,这从根本上改变了传统手段下的欠缺和难以实现之处。进入21 世纪以来,我国在资源检索方面付出了一定的精力,其中,在数据信息资源分析中,在专业化技术方法的支持下,对数据资源不断优化和改善,为不同的用户提供所需的关键元素,许多用户所需的资源往往都潜在存在资源中,现有技术下,能够从根本上消除一些不相关的元素,提升准确性和针对性。互联网信息资源社会形势,早在2 006年,谷歌公司就首次提出云计算概念,这是一种行之有效的信息资源的挖掘技术,经过十余年的应用创新和完善,云计算已经发展成为一种主流的挖掘手段,而且云计算为大数据的深度挖掘提供奠定了保障,其中web 定制可以帮助用户针对性的选择出可以应用的存储手段,为用户提供最有效的应用服务,可以降低搜索数据资源中频繁访问的次数,从而提高工作效率,保证数据检索服务更加高效的完成。
3 海量图像信息检索
Hadoop 是一种新型的分布式系统基础架构,该架构的应用下,可以解决过去无法完成多台计算机并行处理的欠缺和不足,大数据挖掘技术由多个组成部分组成,其中数据储存、数据处理以及基于视觉模式的深度挖掘是最重要的三点。
3.1 分布式文件系统
分布式文件系统是Hadoop 的集群架构,通过有效应用分布式的存储和数据访问模式,实现数据处理的更快、更准确、更高效。该系统主要包含主体系架构和从体系架构两项,通过系统协调、数据复制等功能,利用客户端完成不同数据的储存和获取,这同时又是数据处理中的基本元素之一,对于显著提升信息梳理的效率具有重要意义;现在,大数据资源在诸多领域的应用区域普遍的特性,HDFS 具有多种优势,其中最为主要的就是以下几点:第一,在单输入多响应的技术手段下,在对流数据进行访问时,能够使得信息存取的效率稳步提升,这也是重要的有效形式。其二就是数据处理中,可以有效避免硬件环境带来的影响,可适当降低计算机设备的配置所带来的成本消耗,有利于数据挖掘技术的应用和挖掘。
3.2 并行数据处理技术
当前,有多种并行数据处理技术在数据处理中有着一定的应用,其中,Mapreduce 在计算应用中具有一定的广泛性,而且该模型具有并行性的优点,在海量图像相似度计算中,能够最大化的提供帮助服务,从而更加有效的满足用户的基本需求。在数据并行处理中,健值是能够更加明确的体现出图像数据的类型。再者,映射操作和并行处理下,能够显著完成具有相似度图像的合并和处理,并且Mapreduce 和HDFS 分布式图像是两项比较成熟的技术手段,在信息输入、检索结果输出中,能够大大的提升其准确度[2]。
3.3 视觉模式检索
图像相似度的区分是检索中的一大难点所在。这种区分特性是人类特有的功能,对于人类而言十分简单,当前,需要将人类特有功能转嫁到计算机上,需要从语言概念、元素分析等方面入手,利用人类的区分功能完成颜色、纹理的图像分析和展现,这能够从根本上避免传统图像检索中的弊端。当前图像数据资源逐渐丰富多样化,每个数据资源都是由一个个的图像视觉模式单元组成,正是由于这些单一单元的存在,在图像结构的反应中才会更加富有针对性[3]。如此,对于图像检索进行有效判别、提升判别的准确度具有一定意义。
4 结语
随着信息技术的发展,网络信息时代逐渐到来,在这样的时代背景下,图像检索技术在数据检索中的应用越来越普遍,为此,应该在大数据资源的挖掘方面进行深入探析,从当前现状入手,完善现有图像检索技术,为丰富信息使用效率提供一定的支持。