数据驱动下的图像智能处理技术发展研究
2016-04-07李丽丽
李丽丽
(顺德职业技术学院,顺德 528300)
数据驱动下的图像智能处理技术发展研究
李丽丽
(顺德职业技术学院,顺德 528300)
本文论述对数据驱动下的图像进行表达和分析,简要分析图像内容获取的两个步骤,分析数据驱动的图像智能编辑,希望为我国图像智能处理技术的提升做出贡献。
数据驱动 图像处理 智能处理技术
近些年,随着互联网以及数字多媒体的不断创新,相关技术人员将两者相互融合,从而很大程度上扩大了线上可视媒体规模。可视媒体包括图像、视频和数字几何等,其中图像作为最直观的信息载体,可调动所有用户的视觉,传达出最有效的信息。然而,如何采取有效手段从大量数据信息中抓取和分析视觉内容,是值得深入探索的问题。同时,提高图像智能处理的技术也是我国正面对的挑战。
1 数据驱动下对图像进行表达与分析
众所周知,互联网中包含的图像数据和信息非常多,并且大多信息没有顺序,多数信息的质量也不高,还夹杂着大量没有相关性的信息,给用户寻找所需信息增加了难度。因此,急需一种智能图像理解方法,以便从繁杂的图像中提取和分析视觉内容,从而对提取出的有效视觉内容进行处理。
1.1 图像内容的表达方法
一直以来,对图像内容进行有效抽取和表达都是相关技术人员积极探索的问题。为了使提取出的内容有紧凑的效果,且将图像描述和表达地更加精准,相关技术人员都在针对鲁棒效应进行探索。针对提取图像这一方面,相关技术人员先后探索出GIST特征描述方法、基于直方图对比度方法、基于区域对比度的显著性提取方法。其中,第一种方法主要从图像的颜色和梯度分布等特征的角度对整个图像进行描述,第二种方法主要利用视觉显著性区域对图像进行描述,而第三种方法将视觉显著性与空间关系相结合,主要用于提取出对象外形轮廓,准确性更高,且具有自动提取的功能。如今,由于研究人员的不断主动探索,研究人员Hu探索出一种新的图像结构表达方法,即片网。这种结构表达方法可将某一区域用具有代表性的片进行标示,进而将这些区域用某种方式联系起来,形成层次结构,最终实现对整个图像的描述。片网的结构如图1所示。
图1 片网对于一幅图像的表达
1.2 数据驱动的图像内容分析
以数据驱动方法为工具,针对传统的图像内容分析问题,取得了较大进展。其中,成就最大的是算法性能。例如,研究人员通过探索发现,可利用三维模型库将二维图像做出并形成对比,对比内容包括形状与结构,从而达到对图像深度信息进行估算的效果。与此同时,分析图像库中的物体形状和外观特征也非常必要。针对这一问题可采用科学的方法,如在数据集中应用机器学习的方法。该种方法可提高对象的分析能力,也可对同类物体所有外形特征的子空间进行学习,从而将其内在视觉属性更精准地刻画出来,且这种方法不受物体发生变形的影响。在这个互联网图像技术极其发达的年代,相关技术人员逐渐将注意力转移到理解用户意图方面。因此,手绘草图的方法应运而生。这不但可以很好地理解用户意图,而且很大程度上提高了草图交互方法的智能性。
近几年,图像内容的表达和分析方法已有很大进展,打破了传统方法中的禁锢,将重点转移至对图像语义内容的智能提取和对图像库中图像结构、关系的挖掘。然而,这种方法仍受到目前科学技术水平的限制,运行时分析效率不高。因此,仍需要相关技术人员不断地挖掘和探索。
2 获取图像内容
2.1 对图像进行检索
对图像进行检索,使用的方法大多与图片颜色、纹理和梯度有关。例如,支持向量机的机器学习方法。从图像检索方法横空出世至今,图像检索方法二十年的时间内取得了非常大的进展。例如,1995年出现的多尺度图像检索方法,后来改进的倒排索引结构,2006年的视觉词汇树结构以及后来视觉等级方法等。如今,随着互联网技术的发展,有关研究人员提出交互图像搜索框架。该种方法操作起来非常简便,用户只需将图片移动到检索范围内即可。搜索系统可根据不完整的局部信息提取物体整体轮廓,从而根据物体轮廓在数据库中进行检索。
2.2 将图像对象进行匹配
一般而言,互联网中的图像信息繁多,其中不乏相似度非常高的图像。而从海量的图像中准确将图像进行匹配,难度相当大,这也是图形学与计算机视觉领域极其重视的问题。针对背景较简单且对象简易的图像,匹配方法大多以对象的外形轮廓相似性为基础。运用频率最高的方法是上下文方法。这种方法运用采样和二分图匹配算法的方法,首先需要在该对象的外形轮廓上采样,并对其周围的采样点分布情况进行统计;而后采用二分图匹配算法,将其中两个采样点进行最优匹配,从而得出这两个点的相似度。而针对背景较复杂的图像,通常运用层级过滤机制。该种机制综合考虑对象外形轮廓、内容以及视觉显著性,考察其一致性,从而对与输入对象的相似处进行提取。近几年,有关技术人员提出非监督互联网图像物体联合提取方法。这种方法通过图像搜索引擎对用户输入的关键词进行搜索,然后从图像库中对其稠密对应关系信息进行提取,并根据输入关键词的语义提取前景物体。如今的匹配方法更加精确,因为该种方法加入了一种新的手段,可将物体对象的形状信息划分为不同小组,并结合互联网对图像物体进行提取和匹配,从而为数据驱动的图像编辑应用提供多样化的图像内容。
面对繁杂多样的数据图像信息,内容检索和对象匹配均是非常重要的部分。一方面可为图像的合成提供更准确的素材,另一方面大大降低用户交互的复杂性。其中,内容检索主要依据输入关键词语义进行,对象匹配主要在用户交互的基础上根据关键词语义进行。
3 数据驱动的图像智能编辑
3.1 与图像智能编辑相关的基础技术
数据驱动的图像智能处理用到的基本技术包括许多,其中包括上文介绍过的图像内容自动提取技术和匹配技术,还包括友好的人机交互方式。正是由于综合了这几种基本技术,才能依据用户输入的关键词推测出用户意图,并精准将图像中的对象提取出来。
3.2 数据驱动的图像合成
数据驱动图像处理的核心在于图像合成环节,而图像合成环节大致可分为两大类。这两类的主要区别在于作为基础的对象不同。一类以物体对象为基础,一类以区域一致性为基础。其中,第一类合成方法主要从数据库中提取对象用于合成图像,第二类合成方法主要从数据库中提取部分区域与用户输入的图像进行一致性合成。
4 结语
纵观图像处理技术的发展过程,在相关技术人员的努力钻研下,我国的图像处理技术不断得到提升。如今,互联网技术更新速度非常快,用户对数据驱动下的图像处理要求逐渐提高。在这个大数据时代,应适应潮流的发展,将图像技术与互联网技术结合,将智能化灵活运用于图像处理技术中。
[1]汪淼,张方略,胡事民.数据驱动的图像智能分析和处理综述[J].计算机辅助设计与图形学学报,2015,(11):2015-2024.
[2]戴昌达,姜小光,唐伶俐.论发展遥感图像应用智能处理技术[J].地球信息科学,2003,(4):77-82,1.
Research on the Development of Intelligent Image Processing Technology for Data Driven
LI Lili
(Shunde Polytechnic, Shunde 528300)
This paper discusses the image of data driven expression and analysis, a brief analysis of the two steps of image content acquisition, image intelligent analysis of data driven editing, hope to make a contribution to enhance the intelligent processing technology of China’s image.
data driven, image processing, intelligent processing technology