改进Niblack算法及其在不均匀光照条件下的应用
2019-06-09贾坤昊夹尚丰杨栩余振军蔡丽杰李志国孙林
贾坤昊 夹尚丰 杨栩 余振军 蔡丽杰 李志国 孙林
摘 要:文本二值化是光学字符识别的关键技术,但在光照不均的情况下,采用传统全局阈值二值化在图像过亮或暗区域情况下会造成大量文字信息丢失,因此通常采用局部阈值二值化方法。Niblack二值化是一种经典的局部阈值法,能够提取全部文字信息,缺点是存在大量伪影,且运算效率低,但优点是方法简单,易于实现。针对Niblack算法存在的问题,提出一种基于邻域信息的Niblack算法。该算法结合像素点空间八邻域灰度信息,能自适应调整阈值,逐点进行二值化处理,从而基本消除了伪影,并使用积分图法使运算时间从30s降低到3s,同时运用形态学腐蚀操作对笔画进行增强。实验结果表明,与传统Niblack、Sauvola等算法相比,在光照不均条件下,该方法图像噪声少、速度快,笔画更清晰,且更易于识别。
关键词:二值化;Niblack算法;图像分割;阈值选取;积分图
DOI:10. 11907/rjdk. 191109
中图分类号:TP312文献标识码:A文章编号:1672-7800(2019)004-0082-05
0 引言
文本图像二值化[1-2]是提取图像文本信息的重要步骤,也是保证图像文本信息提取质量的前提。文本圖像分割效果决定着提取信息量的大小及准确度。因文本图像目标区域与背景区域灰度级差别明显,所以通常利用阈值化方法[3-6]进行图像分割。阈值法分为全局阈值法[7]与局部阈值法[8-11]。全局阈值法根据文本图像直方图或灰度空间分布确定一个阈值,算法较为简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对光照不均匀、噪声干扰较大的图像,二值化效果则明显变差。局部阈值法通过定义考察点的邻域,并根据邻域计算模板对考察点灰度与邻域点进行比较,根据区域灰度分布特性,自适应调节阈值,但缺点也十分明显,如存在伪影现象、运算速度慢等。
Niblack算法[12]最早于1896年提出,是局部阈值法中较为常用的方法之一。赵天雪等[13]在视频文本图像增强算法研究中,对Niblack算法公式中的偏移量进行改进,通过加入概率系数,增加了背景或前景分离出来的可能性; 吴留生等[14]在基于Niblack的手掌静脉图像二值化研究中,结合Niblack算法与局部静态阈值方法,降低了伪影及断纹出现的概率,但需要先将图像分成6块,并进行分块处理; 申森等[15]对枪号图像二值化进行研究,利用小波包将低通图像作为二值化阈值进行处理,并与Niblack算法获得的二值化图像进行融合,很好地实现了枪号图像的二值化,但由于其提出的算法应用小波滤波器的分解与重构,增加了一些计算量,执行时间有所延长;卜飞宇[16]针对字符断裂和伪影问题,对Niblack算法阈值计算公式进行改进,但由于光照不均的暗区域相机噪点灰度值接近目标点灰度值,所以仅根据像素灰度值作为判断依据并不能有效去除此类伪影;Guo等[17]在Niblack动态阈值分割法基础上,结合形态学开闭运算,获得失真较小的静脉图像;Nandy等[18]对Niblack和Sauvola两种二值化技术在视网膜血管分割中的应用进行对比分析;Li等[19]提出一种基于阈值分割Niblack算法的陶瓷瓶表面缺陷可视化检测方法。
本文在文献[16]基础上,根据点与八邻域点的关系,对其计算公式进行改进,使其能够自适应调整局部阈值。相较于文献[16],本文方法结合了像素点八邻域之间的空间关系,对孤立噪点进行二次判别,不仅消除了常规伪影, 也基本消除了由暗区域相机噪点产生的伪影,并且保留了足够的文本信息,使文本图像更加清晰,且更易于识别;在速度方面,结合积分图法大大加快了算法速度,加速后所用运算时间仅为原算法的1/10。因此,本文提出算法在光照不均的文本图像分割上可取得更好效果。
1 Niblack算法及改进
Niblack算法中,对图像的每一个像素点,在大小为w×w的邻域窗口[20-21]中求取所有点的灰度均值及方差,再以下式计算每个点的阈值:
Niblack算法通过逐点计算确定阈值,其计算量较大,导致运算速度较慢。当邻域窗口在大片背景区域移动时,根据算法公式,必然有点的灰度值小于均值m(x,y),且s(x,y)较小,减去0.2×s(x,y)后结果依然小于T(x,y),则被判定为目标点。大量背景点被判定为目标点,则形成了伪影,伪影的出现对后续文本信息提取带来不利影响。依据伪影产生的原因,只要通过合理方式适当减小阈值T(x,y),使背景点灰度值不会小于阈值,即可消除伪影,同时保留足够的图像信息。
本文主要从提高运算速度与尽量有效地消除伪影两方面对Niblack算法进行改进,在提高运算速度方面,结合全局阈值并利用积分图法进行加速; 在消除伪影方面,通过改进计算公式的方法进行伪影消除。
1.1 积分图法提高运算速度
Niblack算法运算速度较慢,主要由于该算法需遍历图像中每一个点,逐点计算窗口邻域的像素均值及标准差,而且需要重复求和,计算量较大。若采用积分图法,则可避免重复求和计算,从而大大减少了运算量。对于一幅灰度图像,积分图[22]中任意一点(x,y)的值是指从图像左上角到该点所构成矩形区域内所有点的灰度值之和。
式(5)中M(x,y)为该点灰度值,Mmin为该点八邻域内灰度最小值,Mmax为该点八邻域内灰度最大值。p的取值在2~10之间,若该点灰度值与八邻域各点灰度值越相近,该点是噪点的可能性越小,则p接近于10,阈值仅略微减小,不会将目标黑色区域判定为白色; 若该点灰度值与八邻域各点灰度值差别越大,该点是噪点的可能性越大,则p值越接近于2,阈值越小,会将黑色噪点判定为白色背景区域,可以消除噪点。二值化阈值T(x,y)随该点与八邻域各点的差异大小动态变化,可起到消除噪点的作用,同时目标区域因不是孤立点受影响较小,保留了足够的图像信息。但仍有少数目标点被作为噪点消除,影响了成像效果,最后利用形态学腐蚀处理后,图像取得了更清晰的效果,如图4所示。
2 實验结果分析
实验所用的两张图像大小分别为780×1 040(见图5)、1 040×780(见图6),实验在CPU为Intel(R)Core(TM)i3-6100 3.70GHz的台式机上进行,编译软件为Visual Studio 2013。
对两张光照不均的文本照片分别采用OTSU(最大类间方差法)算法、Niblack算法、文献[16]提出的算法、VFCM算法[23]、Sauvola算法与本文方法进行实验对比。
图5(b)、图6(b)与图5(c)、图6(c)相比可以看出,因光照不均,图像在不同区域的背景灰度值差异较大,而采用局部阈值的Niblack算法提取的文本信息量多于全局阈值的OTSU算法,能够显示全部目标文字区域,但存在大量明显的伪影。
图5(c)、图6(c)与图5(d)、图6(d)相比可以看出,文献[16]提出的改进Niblack算法中基本消除了常规伪影,但在图5(d)、图6(d)中可以发现,在原图像暗区域存在大量相机噪点产生的伪影,文献[16]算法公式未对光照不均的暗区域噪点伪影进行单独讨论,没有消除在较暗区域中相机噪点产生的伪影。
图5(e)、图6(e)、图5(f)、图6(f)与图5(g)、图6(g)相比可看出,VFCM算法在较暗区域噪声明显,而Sauvola算法在较暗区域也存在部分伪影无法消除的现象。
图5(d)、图6(d)与图5(g)、图6(g)相比可以看出,因本文算法通过对噪点八邻域特点的分析,采用噪点相关系数p改进了算法公式,解决了常规伪影与噪点伪影的问题,并运用形态学腐蚀算法得到更清晰的成像效果。由表1可以看出,本文算法相较于原算法也较大程度上缩短了时间,从原本的30s左右缩短到3s左右,且成像效果最佳。
3 结语
本文主要工作是对光照不均条件下的文本图像进行二值化处理,提出一种基于Niblack算法改进的局部阈值法,对Niblack算法伪影产生的原因进行讨论,并根据相关原因对公式进行改进,从而消除了伪影。针对之前改进Niblack算法在光照不均条件下,文本图像暗区域在进行二值化处理后,依然存在相机噪点形成的伪影不能消除的问题,通过分析噪点、非噪点灰度值与八邻域点灰度值的差异,对计算公式再次进行改进,添加了动态调节系数,使阈值能够根据像素点与八邻域点灰度值的差值大小(若差值较大则视为噪点)进行自适应调节,消除了在光照不均时暗区域相机噪点产生的伪影; 通过分析算法计算过程,发现重复求和计算影响计算效率的问题,因此采用积分图法避免了重复求和计算,提高了运算速度;最后对图像进行形态学腐蚀处理,以增强成像效果,使文字信息更加清晰。从实验结果可以看出,本文提出的改进算法消除噪声的效果优于传统算法,运算速度也得到了大幅提升,可广泛运用于光照不均条件下文本图像的二值化处理。
为了尽量消除噪声,本文虽然利用形态学方法进行了效果增强,但仍不可避免地会丢失少量字符信息,影响后续识别效果。因此,在尽可能消除噪声的前提下,如何保留更多文字信息,是下一步需要研究的方向。
参考文献:
[1] NATARAJAN J,SREEDEVI I. Enhancement of ancient manuscript images by log based binarization technique[J]. AEU-International Journal of Electronics and Communications, 2017, 75: 15-22.
[2] SU B, LU S, TAN C L. Robust document image binarization technique for degraded document images[J]. IEEE Transactions on Image Processing, 2013, 22(4):1408.
[3] WANG Y S. A new image threshold segmentation based on fuzzy entropy and improved intelligent optimization algorithm[J]. Journal of Multimedia,2014.
[4] KITTLER J,ILLINGWORTH J. On threshold selection using clustering criteria[J]. Systems Man & Cybernetics IEEE Transactions on, 1985(5): 652-655.
[5] NTIROGIANNIS K,GATOS B,PRATIKAKIS I. A combined approach for the binarization of handwritten document images[M]. Elsevier Science Inc,2014.
[6] WAGDY M,FAYE I,ROHAYA D. Fast and efficient document image clean up and binarization based on retinex theory[C]. IEEE, International Colloquium on Signal Processing and ITS Applications. IEEE, 2013:58-62.
[7] SMITH P,REID D B,ENVIRONMENT C,et al. A threshold selection method from gray-level histograms[J]. Systems Man & Cybernetics IEEE Transactions on, 1979, 9(1): 62-66.
[8] THEPADE S,DAS R,GHOSH S. A novel feature extraction technique using binarization of bit planes for content based image classification[J]. Journal of Engineering, 2014.
[9] HEMA S K. To detect the text stroke in degraded document images using canny's map, binarization technique[J]. International Journal of Engineering Sciences & Research Technology, 2014.
[10] SAUVOLA J,PIETIK?INEN M. Adaptive document image binarization[J]. Pattern Recognition, 2000,33(2):225-236.
[11] BLAYVAS I,BRUCKSTEIN A,KIMMEL R. Efficient computation of adaptive threshold surfaces for image binarization[J]. Pattern Recognition, 2006, 39(1): 89-101.
[12] NIBLACK W. An introduction to digital image processing[C]. Advances in Computer Graphics Vi, Images: Synthesis, Analysis, and Interaction. Springer-Verlag, 1986: 205-267.
[13] 赵天雪,孙光民,许爽. 视频文本图像增强算法研究[J]. 微计算机信息,2007(33): 193-194,179.
[14] 吴留生,陈家新,黎蔚. 基于Niblack的手掌静脉图像二值化技术研究[J]. 通信技术,2010,43(1): 112-114.
[15] 申森,李艾华,姚良,等. 基于小波包和Niblack法的枪号图像二值化算法[J]. 光子学报, 2013, 42(3): 354-358.
[16] 卜飞宇. 一种改进的文本图像二值化方法[J]. 电脑知识与技术,2014,10(12): 2822-2824,2840.
[17] 江明,刘辉,黄欢. 图像二值化技术的研究[J]. 软件导刊,2009(4):175-177.
[18] NANDY M, BANERJEE M. A comparative analysis of application of Niblack and Sauvola binarization to retinal vessel segmentation[C].International Conference on Computational Intelligence and Networks,IEEE Computer Society, 2017:105-109.
[19] LI L Y,ZHANG X W,LI W T,et al. Visual inspection method of ceramic bottle surface defects based on Niblack optimization[J]. Computer Science and Engineering,2017.
[20] BATAINEH B,ABDULLAH S N H S,OMAR K. An adaptive local binarization method for document images based on a novel thresholding method and dynamic Windows[J]. Pattern Recognition Letters, 2011, 32(14):1805-1813.
[21] 李倩. 文檔图像的二值化算法综述[J]. 中国传媒大学学报:自然科学版,2008,15(4): 66-70.
[22] 黄文杰, 陈斌. 一种快速图像处理的积分图方法[J]. 计算机应用,2005(S1): 266-268.
[23] 童立靖,陈侃,付晓玲,等. 文档图像二值化算法VFCM[J]. 计算机工程与设计,2009,30(13):3216-3218,3243.
(责任编辑:黄 健)