基于颜色特征的行李箱检索系统设计与实现
2016-12-22曹宇轩刘真
曹宇轩刘真
摘 要:为了加强对民航机场游客行李包的有效管理,减少人工查找相关行李箱的工作量,设计并实现了一个基于颜色特征的行李箱检索系统。充分利用图像的颜色特征,设计不同的特征匹配算法,实现了按照颜色特征检索行李箱的功能。实验证明,该系统具有功能全面、操作简单、安全可靠等特点,具有一定的推广价值。
关键词关键词:民航;行李箱;颜色特征;图像检索
DOIDOI:10.11907/rjdk.162058
中图分类号:TP319
文献标识码:A 文章编号文章编号:16727800(2016)011007105
0 引言
社会经济的繁荣促进了民航行业的快速发展,客运量的增加使得托运行李箱的数量也急剧增加,如何有效管理和监控众多行李箱成为各航空公司亟需解决的问题。目前,不正常行李的查找主要依靠对行李箱上所挂条形码进行扫描记录。然而针对一些特殊情况,如条形码丢失、条形码错误等,这种传统的查找方式就无法发挥作用。此时,行李箱的外观特征就成为了找寻不正常行李箱的主要依据。因此有必要将研究方向转移到行李箱的图像内容上,即通过行李箱图像本身的内容如颜色等特征进行检索,输入相似行李箱图像之后,在监控系统中查找对应行李箱的视频截图或与存储在行李库房中的无人认领行李作比对,从而跟踪其去向,完成管理和查找操作。
1 图像特征提取
基于颜色特征的行李箱检索系统,是基于内容的图像检索系统的一种,即通过分析研究图像包含的颜色信息,通过一定的特征方法进行表示,然后设计匹配算法进行相似度匹配的检索系统。只有首先准确地将图像信息提取出来,再设计出精确的匹配算法,才能实现预期的效果。由此可见,图像特征提取算法是本文基于颜色特征的行李箱检索系统的核心技术。
1.1 颜色特征模型
RGB模型是计算机中最常用的颜色模型,由于其简单并且与人眼的结构特性密切相关,所以是目前使用最为广泛的颜色模型[1]。根据人眼的结构特点,所有颜色都可以看作是3个基本颜色即红、绿、蓝的组合。为了建立标准,1931年国际照明委员会(CIE)规定了700nm、546.1nm、435.8nm为红、绿、蓝这3种颜色的标准波长。以 r、g、b 3个参数为三坐标,可以得到如图1所示的一个单位立方体结构描述的RGB 颜色模型(彩图见封三,下同)。
本系统充分利用RGB颜色模型的特点,使用其作为本系统的特征提取模型。
1.2 特征表述方法
对于一副图像,若要得到它所包含的颜色特征,首先要采集它的信息,然后用适当的方法进行表示,颜色特征表示对检索结果有很大的影响。本系统采用循环方式,逐步采集图像每一个点的R、G、B值,然后对R[0]~R[255],G[0]~G[255]和B[0]~B[255]的点的个数进行统计,再采用适当算法来表示这些统计信息,主要有以下3种方法:统计直方图、累计直方图和分块统计。
1.2.1 统计直方图
图像特征的统计直方图[2]是一个1-D的离散函数,它用来表示一副图像之中,拥有某种特征值的点在整幅图像中所占的比例,很显然所有比例之和应为1。以H向量为例,即有式(1):
H(k)=nkNk=0,1,255(1)
其中,nk代表具有特征值k的点的个数,N为这幅图像的点的个数。如图2所示,(a)是图像原图,(b)是它所对应的统计直方图。
1.2.2 累计直方图图像特征的累计直方图[2]也是一个1-D的离散函数,表示到这个特征为止的之前所有向量占总数的比例。同样以H向量为例,很显然,H(255)= 1即有式(2):
式中符号与上文统计直方图公式中的含义一致,图3即为红色行李箱图像特征的累计直方图。
1.2.3 分块统计图像的分块统计方法是在上述两种方法基础上的改进,基于颜色内容的图像检索虽然有较强的抵御旋转、尺寸变换的鲁棒性[3],但是对于图像色彩的空间分布表示却很差,经常会出现图像的直方图相似而空间分布差别很大的情况,如图4中(a)横向图和(b)交叉图的直方图完全一样而实际图像本身却差别很大。
针对这种情况,研究者提出了分块统计的概念,原理是将一幅图像先进行分割,然后分别统计每一块的直方图进行对比分析,至于如何分块以及每一块赋予的权重,还需特别计算。通过分块统计,一定程度上解决了颜色特征对于空间分布的不足,但是不能从根本上解决问题,这是颜色特征本身的缺陷。
统计直方图比较适合颜色块单一的图像,相比之下,累计直方图则更适合于真彩图像[4],分块统计弥补了颜色空间分布难以描述的缺点。由于时间有限,本文仅实现了统计直方图和累计直方图两种方法,分块统计是今后研究的方向。
2 特征匹配算法
基于文本的检索方法是通过对文本进行匹配来判断是否相似,而基于内容的图像检索则是通过计算示例图像和数据库中图像在图像特征上的相似度进行判断[5]。目前广泛使用的是对图像特征进行数字化,即用数字表示一幅图像的特征。通过数学公式设计匹配算法,计算出两者之间的距离作为衡量图像特征的相似度。本文在参考前人研究的基础上,实现了以下几种较为经典的匹配算法。
2.1 Hausdorff距离算法
Hausdorff距离的作用是度量模板和目标图像之间边缘的匹配程度。
设两个有限点集A={a1,a2,...,ap}和B={b1,b2,...,bq},其中p和q分别为点集A与点集B的元素个数。则A、B间的Hausdorff 距离H(A,B)定义如式(3)所示:
2.2 欧氏距离算法
用HQ(k)表示关键图的颜色特征直方图,HD(k)表示已经存储的数据库图像D的颜色特征直方图,则两幅图像之间的匹配值P(Q,D)用欧氏距离方法来计算[5]如式(6)所示:
2.3 加权的欧氏距离
用HQ(k)表示关键图的颜色特征直方图,HD(k)表示已经存储的数据库图像D的颜色特征直方图,则两图像之间的匹配值P(Q,D)用加权的欧氏距离方法来计算如式(7)所示:
2.4 直方图相交法
用HQ(k)表示关键图的颜色特征统计直方图,HD(k)表示已经存储的数据库图像D的颜色特征统计直方图,则两图像之间的匹配值P(Q,D)用直方图相交的方法来计算如式(8)所示:
2.5 绝对值法
用HQ(k)表示关键图的颜色特征直方图,HD(k)表示已经存储的数据库图像D的颜色特征直方图,则两图像之间的匹配值P(Q,D)用绝对值的方法来计算用式(9)所示:
以上几种匹配算法中:Hausdorff用于计算两幅图像边缘之间的距离;欧氏距离计算量大,但是精度较高;加权的欧氏距离适合于颜色丰富的真彩图像,因为当颜色比较单一时,很多为0的点都被赋值为1,这样就与原图像的特征差距很大,如果采用归一化直方图,则Wk<1,即加权距离要小于欧氏距离;直方图由于其本身特点而仅适用于统计直方图,不适用于累计直方图;绝对值方法是使用最多的方法,计算简单、运行速度快。在本文中以上5种方法均已实现。
3 系统详细设计
3.1 系统详细结构
系统功能分为3个主要模块,分别为图库管理模块、图像匹配模块和图像存储模块。除了主要模块以外,还设计了中间输出模块、时间统计模块等辅助功能。系统流程如图5所示。
3.2 主要模块实现
3.2.1 图库管理模块设计
图库管理模块提供用户对图像库的操作,包含以下操作:添加新的图像库、修改即有图像库、删除现有图像库、将图像库设置为默认检索的库、将新的图像添加到既有图像库。
本系统实现了上述几种功能,通过自定义的PicDb表来实现管理,图6为“菜单—设置”里面的图库管理。
3.2.2 图像匹配模块
在本系统的设计过程中,考虑到对于真彩图像的检索匹配,特别设计两种不同方式,即可以将所有图像的R、G、B值相加为一个通道进行匹配对比,也可以分别对R、G、B 3个通道进行匹配分析。前者在处理一些较为简单的彩色图像时效果较好,计算量少、耗费时间较短;如果采用后者,匹配精度会提高,但同时大大增加计算量[6]。该选项在用户界面上有所设计,供用户选择。
3.2.3 图像存储模块设计
由于对图像特征的提取和匹配往往涉及大规模的点阵运算,期间耗费较多时间,这往往是用户所不能容忍的,所以应当添加数据库模块以减少时间。本文将重点探讨图像特征的提取技术和存储技术。
本系统设计的数据库模块用来存储库中的图像信息,并非直接存储图像文件,而是将分析过的图像特征值及其所在的路径等相关信息存入数据库。程序启动时,会读取数据库中的用户设置,根据用户设置,系统可以找到默认的图像库,图像库里存储着该图像库中图像的所有信息,包括图像的路径、名称、特征等。随后系统根据图像库中的路径找到此图像库里面所有图像的特征值,通过解压缩函数将信息还原成文中定义的节点结构,直接读取进行匹配,从而节省了大量分析时间。
在存取图像特征时,本文将特定数据结构压缩为字符串格式存储在数据库中,其中的协议由作者自定义,协议采用“#”字符分隔通道之间的数据值,在存储阶段进行打包,读取出来之后解包赋值。经过系统测试发现,在压缩和解压缩图像特征时的用时占很小比例,而真正耗费时间的为颜色特征的提取和特征匹配阶段,因而在实际运行时达到了预期效果。数据库中存取图像特征的表是PicFeature,结构如表2所示。
通过DBOperate的一系列函数,系统可以很方便地实现对数据库的操作,从而为系统运行提供了很大帮助,节省了大量时间。
4 实验结果分析
4.1 性能评价标准
基于颜色特征的行李箱检索系统的性能可以通过查询的准确率来判断,包括查全率和查准率[7]。本文将基于这两种标准对系统进行评价,如式(10)、式(11)描述。式中PR为查全率,P
4.2 系统测试
本系统的检索图库包含50张不同颜色的行李箱图像,按颜色分为5类,每类10幅图像。实验测试阶段综合使用各种图像特征表示方法和匹配算法,得出系统对于不同图库的查全率和查准率。本文以蓝色行李箱为例,测试效果如图8所示。
统计不同颜色行李箱的查全率和查准率,测试结果如表3所示。
通过上表发现,各色行李箱的查全率和查准率均在70%以上,即针对一般查询具有较好效果,未来可以在继续提高查全率和查准率的基础上进一步优化算法。
5 结语
本文针对民航不正常行李箱的管理查找问题,提出了使用基于颜色特征的行李箱检索系统的解决方案。对基于内容的图像检索技术进行了研究和探讨,在分析目前一些基于图像颜色特征的检索算法的基础上,重点分析了算法的优点和不足,实现了一个基于颜色特征的行李箱检索系统。本文对所实现的不同算法进行了实现和测试比较,实验结果证明该系统功能全面、操作简单、查询效果较好,可在实际中进行推广应用。
参考文献:
[1] 王娟,孔兵,贾巧丽.基于颜色特征的图像检索技术[J].计算机系统应用,2011,20(7):160164.
[2] 刘德龙.基于颜色特征的图像检索系统设计与实现[D].武汉:华中师范大学,2007.
[3] 黄仁,胡敏.综合颜色空间特征和纹理特征的图像检索[J].计算机科学,2014,41(6A):118121.
[4] 董蕊,王志巍,刘淑娟,等.基于统计直方图的单幅图像去雾算法[J].计算机应用与软件,2016,33(5):196199.
[5] 项立明.基于内容的图像检索系统的设计与实现[J].软件工程师,2015,18(12):3738.
[6] 翟剑锋.基于多特征的图像检索系统的设计与实现[D].北京:北京邮电大学,2010.
[7] 王鹏.基于颜色特征的图像检索系统[D].西安:西安电子科技大学,2012.
(责任编辑:孙 娟)