基于深度神经网络的多模态计算机图像识别
2019-03-08伍梵
摘 要:本文基于深度神经网络对多模态计算机图像进行识别。首先提出两个削减规则。第一个削减规则用来减少邻接顶点之间相似性计算次数,第二个削减规则通过非精确计算邻接顶点间的相似性来减少计算时间;其次提出一种基于Spark中GraphX的结构化图聚类算法GXDSGC。该算法在运行期间不需要大量的磁盘I/O开销;最后通过在大量真实数据集和合成数据集上的实验,证实本文提出的GXDSGC算法的有效性。GXDSGC算法比基于Hadoop中MapReduce框架的算法快30多倍,能够显著提高计算机图像识别在大数据分析中的效率。
关键词:云计算 GXDSGC算法 分布式结构
一、引言
数字图像处理的最终目的是用计算机代替人去认识图像和找出一副图像中人们感兴趣的目标,这是计算机模式识别的主要内容。模式识别技术是用机器来模拟人的各种识别能力,当前主要是模拟人的视觉和听觉能力(Li H et al. 2015)[1]。图像模式识别是用机器对文字、图像、图片和景物等模式信息加以处理和识别,用以解决计算机与外部环境直接通信这一重要问题。图像识别由三个环节构成,分别是数据获取、数据处理、判别分类(Opieliński K J et al. 2017)[2]。解决图像识别的方法概括起来可分为统计模式识别、结构模式识别、模糊图像识别与智能模式识别(Wu D et al. 2016)[3]。
二、实证分析
基于本文构建的算法,以下通过实验来对算法进行验证,本实验所用的软硬件环境如下:集群由五台服务器组成,每台服务器的配置为:RedHat64位操作系统,16核CPU,主频1.9GHz,16G内存,2T硬盘;Hadoop版本为2.6.0,Spark版本为1.6.0,Java版本为1.8.0,Scala版本为2.10.4。开发环境配置:操作系统为Windows732位旗舰版,主频3.10GHz,4G内存,500G硬盘;开发工具IntelliJIDEACommunityEdition15.0.2,Java版本为1.8.0, Scala 版本为 2.10.4。
本文实验所用数据集包括DBLP,Youtube,LiveJournal3个真实数据集和人工数据集进行实验。其中,DBLP是一个作者协作网络;Youtube是一个用户到用户链接网络;LiveJournal是一个在线社交网络。人工数据集使用前人文献中的算法生成。数据集统计信息如表1。
下面将本文中提出的神经网络算法和Zhao等人提出的PSCAN算法进行对比实验,实验从运行时间、削减策略和可扩展性三个方面来进行比较。PSCAN算法和神经网络算法在相同配置的集群上运行,由于PSCAN算法并没有指定聚类的最小尺寸,所以在实验中将神经网络算法的最小聚类尺寸设置为2,使得两个算法的结果相同。下面分别从这三个方面对神经网络算法进行分析。首先我们比较了运行时间,在该实验中,对于不同数据集,在相似性阈值分别取0.6,0.7,0.8,0.9四个值的情况下,分别运行神经网络算法和PSCAN算法。算法在表1中数据集上的运行时间如图1所示。
三、研究结论
本文基于深度神经网络进行多模态计算机图像识别,当前多模态计算机图像识别是大图数据分析的主要技术之一,在社区检测、生物功能发现和图可视化等许多实际应用中具有重要意义。目前的多模态计算机图像识别大多基于Hadoop的MapReduce框架,但该框架需要精确计算图中所有邻接顶点之间的相似性且需要大量的磁盘I/O开销,极大增加了算法的运行时间。SCAN算法利用顶点之间的结构信息不仅能够对图进行聚类,还能识别出图中顶点的不同角色,为用户提供丰富的信息;而PSCAN算法是SCAN算法在分布式集群上的扩展。
参考文献
[1] Li H, Ding H, Huang D, et al. An efficient multimodal 2D + 3D feature-based approach to automatic facial expression recognition[J]. Computer Vision & Image Understanding, 2015, 140(45):83-92.
[2] Opieliński K J, Pruchnicki P, Szymanowski P, et al. Multimodal ultrasound computer-assisted tomography: An approach to the recognition of breast lesions[J]. Comput Med Imaging Graph, 2017, 39(16):136-142.
作者簡介:伍梵,专业:信息与计算科学,学校:湖南人文科技学院。