APP下载

索取号分割方法研究

2016-12-06魏宏静

铜仁学院学报 2016年4期
关键词:像素点算子彩色

饶 书,魏宏静

( 1.铜仁学院 大数据学院,贵州 铜仁 554300;2.贵州理工学院 机械工程学院,贵州 贵阳 550003 )

索取号分割方法研究

饶 书1,魏宏静2

( 1.铜仁学院 大数据学院,贵州 铜仁 554300;2.贵州理工学院 机械工程学院,贵州 贵阳 550003 )

拍摄得到的索取号照片通常含有很多干扰信息,需要进行相应的图像分割才能得到正确的索取号。在分割算法中,首先需取得原照片的灰度图像,然后经过多种算子对比后使用 CANNY算子来检测该灰度图的边缘点。检测得到的边缘点在经过S分量的进一步分割后,仍然还有少量的非文字边缘点干扰。为了排除这些干扰,采用文字行、列区域检测来确定边缘点数量最多的区域,从而正确的分割出照片中的索取号部分。

索取号; 干扰信息; CANNY算子; 分割

索取号,即图书馆藏书的编号。以往总是需要对图书馆索取号进行人工记录,但是这种记录方式成本较大,为此,需要开发一种索取号自动识别系统,该系统只需要给书架上的书籍照相并上传到电脑中,就能够自动获取书籍上的索取号信息并转化为电子文档,方便藏书的管理工作。在该系统中,首先需要剔除各种可能存在的干扰信息从而获取索取号的正确位置,为此在本篇文章中将讨论一种将照片中索取号正确识别并分割的算法。

1.索取号的干扰元素

从图1中可以看到CCD拍摄的图书索取号图像,其中除了索取号以外,还包括了各种色彩的边框以及出版社和彩色封面等信息,这些信息将对之后的识别起到很大的干扰作用。

针对于复杂背景文字边缘数量特征干扰严重的问题,决定采用基于边缘点数量统计的文字图像分割方法来正确分割图书索取号。索取号文字图像具

有如下特征:(1)索取号文字采用黑色印刷;(2)索取号文字数量至少为6个;(3)索取号字符的水平排列;(4)索取号贴在书脊的下半部分。算法主要由以下几个部分组成:(1)HSI 彩色空间转换;(2)索取号边缘检测;(3)索取号文字图像边缘点彩色分割;(4)文字图像行区域检测;(5)文字图像列区域检测;(6)区域边界调整[1]。以下将从彩色空间转换开始对索取号的算法步骤进行介绍。

2.彩色空间转换

在索取号的提取中,首先必须得到一个灰度图像,因为在之后的边缘点检测中能够减少算法的耗时[2]。摄像头拍摄的彩色图片的像素点通常是采用24位RGB表示,但R,G和B三值在程序中并不易分割,在接下来的CANNY算子检测中很难得到正确的边缘点。因此选择更接近于人眼感知、且易于分割的(HSI)空间,H代表色度,S代表饱和度、I代表亮度。

图2. HSI彩色空间的I分量

在文字切割算法上,只对边缘点S分量进行彩色分割。在本算法中,首先只转换I分量,得到灰度图像,如图2所示。待接下来的边缘点检测出来后,再对边缘点进行S分量计算。转换关系如式(1)所示:

3.索取号边缘检测

在彩色空间转换得到灰度图以后,接下来为得到灰度图的边缘点进行边缘检测,以便于之后对于边缘点的S分量彩色分割来得到索取号正确边缘点。首先,分别使用PREWITT算子、 LOG算子和CANNY算子对图2(a)的灰度图进行边缘检测以确定哪一种算法能够得到最好的边缘检测效果(如图3所示)。

图3. 三种算子的检测边缘对比

比较前面的PREWITT算子、LOG算子和CANNY算子,可以发现CANNY算子的边缘检测结果最满意,所以接下来将使用CANNY算子进行索取号边缘检测[3]。

CANNY算子需要定义三个参数,分别为高斯函数的分布参数,高阈值(TG)和低阈值(TL)[4]。其中设置为1,TL=0.4×TG。在经过反复试验以后发现,当TG取值在0.3以上的时候会将大量的边缘点丢失而导致无法检测到正确的边缘点,而当 TG 取值在

0.1以下时,则会将过多的非边缘点检测为边缘点,在接下来的S分量彩色分割中这些非边缘点会直接使得最后无法分割得到需要的索取号边缘点,所以在实验中取TG=0.2。 CANNY 算子边缘检测结果如图4所示。

4.索取号边缘点彩色分割

通过CANNY算子检测得到的边缘图像可以看到关于文字的边缘像素点部分通常具有两个特征,首先是分布集中,然后是像素点数量较多。虽然有光照、污渍以及纸张质量等干扰元素的存在,但是因为上述的特征,使得文字边缘像素点分布图像较难被干扰。CANNY算子检测得到的边缘点在HSI

彩色空间S分量上进行索取号文字边缘点分割。由于索取号文字采用黑色印刷,但发生不同程度的褪色, 即黑颜色的饱和度 S有一定的变化,故:

式中,BW(i,j)是Canny算子检测的边缘,BW_Word(i,j)是文字的边缘点,S1=0,S2=0.05。经边缘点S分量分割后的图像如图5所示,图中边缘点主要为文字边缘点。

虽然还有少量的非文字边缘点,但是相对于文字边缘点来说,其边缘点的数量已经非常少了,根据文字图像结构边缘点数量更多的特点,只需要通过文字图像行、列区域检测选择出包含图像行、列边缘点最多的区域为索取号文字图像,即可大致判断出索取号的位置。

5.文字图像区域检测

由于文字边缘像素点部分的两大特征(分布集中、像素多)。则可得下式:

文字图像区域的字符间隔可能会导致非文字图像区域的行边缘点数量高于文字图像区域的边缘点数量,但是从行平均值来看却依然能较为准确的分

割出文字图像区域内边缘像素点,如(4)式所示:

其中NY(word)为文字图像区域中某行的边缘点数量,NY(non-word )是非文字图像区域内某行的边缘点数量,表示图像所有边缘像素点数量的行均值。根据(4)式检测出可能的文字图像行,如图5(a)的行边缘点数量统计如图6所示。

图6 行方向边缘点数量统计

检测出的文字图像区域行边缘点进行合并得到初步的文字图像行区域。在算法中,设置行间隔值TY=10。当文字行间距为DY≤TY时,默认为是单独一个的文字图像区域。反之,则为两个文字图像区域[5]。

检测出的文字图像区域列像素点进行合并得到初步的文字图像列区域。在算法中,设置列间隔值TX=20。当文字列间距为DX≤TX时,默认为是单独一个的文字图像区域。反之,则为两个文字图像区域[4]。

在计算过程中,可能会出现多个可能文字图像列区域,选择其中可能包含文字图像列像素点最多的区域为最终的索取号图像区域。在行、列检测以

在计算过程中,可能会出现多个可能文字图像行区域,选择其中包含可能文字图像行最多的区域为最终的索取号图像区域。同理,可进一步确定行区域内和列区域的文字图像。检测可能的文字图像列,图5(a)的文字图像行区域中列边缘点数量统计如图7所示。后基本确定了索取号文字区域。但是由于本身索取号文字的原因,可能会影响边界的检测,所以在文字图像的分割的最后一步,需要对分割得到文字图像区域进行进一步的修正。

6.边界调整

文字图像中部分字符的笔画可能会因为种种原因出现漏检,如字符“F”的下半部分因为边缘点数量较少容易漏检。因此,需要针对文字区域进行相应的边界调整。在已经分割出的文字图像区域附近,若行、列边缘点数量大于2,则都作为索取号区域,并提取出相应区域内的文字图像。图1 所示的索取号经分割后如图8所示。

图7 列边缘点数量统计

图8 分割出的索取号图像

7.结语

本文经过对三种算子的实验对比,认为canny算子来检测图像的边缘具有较好的效果,同时基于文字图像结构的基本特征,使用了行列区域检测的办法,最终去除了图像中的干扰元素,较为准确地分割出了照片中的索取号图像。

[1] 罗华杏.条形码技术在图书馆管理系统中的应用[J].广船科技学报,1999,(4):30-31.

[2] 胡小锋,赵辉.Visual C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.

[3] 王圆妹.图书索书号自动识别技术的研究与实现[D].武汉:长江大学,2009.

[4] 哈力旦·A,伊力哈木·亚尔买买提,库尔班·买提木沙.复杂背景下维吾尔文字符的分割算法[J].计算机工程与应用,2007,(20):163-165.

[5] 龚才春,刘荣兴.基于整体特征的快速手写体数字字符识别[J].计算机工程与应用,2004,(19):82-83.

Research of Method for Call Number Segmentation

RAO Shu1, WEI Hongjing2
(1. School of Data Sciences, Tongren University, Tongren, Guizhou 554300,China; 2. School of Mechatronics Engineering,Guizhou Institute of Technology, Guiyang, Guizhou 550003,China )

Call numbers’ photos obtained by shooting usually had interference information. So image segmentation was an indispensable means of obtaining exact call numbers. Firstly, call numbers’ photos should be converted to gray level images. Secondly, using CANNY operator detected this images edge points after comparing with several kinds of operators. But a little interference information was still existed among the words’ edge points after using S component segmentation. Finally, we used edge area detection which based on row and column to eliminate the interference and segment exact call numbers’ edge.

call numbers, interference information, Canny operator, segmentation

TP301

A

1673-9639 (2016) 04-0063-04

(责任编辑 田 波)(责任校对 毛 志)

2016-06-03

饶 书(1988-),男,贵州铜仁人,铜仁学院教师,硕士,研究方向:电子科学技术。魏宏静(1987-),女,黑龙江省肇东人,贵州理工学院教师,研究方向:机械、电子工程。

猜你喜欢

像素点算子彩色
彩色的梦
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
一类截断Hankel算子的复对称性
彩色的线
拟微分算子在Hp(ω)上的有界性
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
基于局部相似性的特征匹配筛选算法
有那样一抹彩色
基于5×5邻域像素点相关性的划痕修复算法
彩色的风