数字碑帖图像的二值化算法研究
2022-07-19马永力黄志开
马永力,曾 瑄,黄志开
(南昌工程学院 电气工程学院,江西 南昌 330099)
中国古代书法碑帖图像具有独特的表现形式、高度的艺术成就和深厚的文化内涵。然而,很多碑帖由于各种原因存在纸质表面脏污、碑文残破、图像字迹损毁和残缺等问题,采用一般的处理方法难以实现图像分割。借助图像处理、模式识别等技术进行二值化处理,可以使汉字笔画、字体等的分析处理更加方便,分割识别更加准确,为数字拓片提供了精确、完整的汉字模型,对修复损毁、残缺的书法作品,重现中国古代碑帖文物的艺术、文化和历史价值具有重要意义。
图像的二值化就是把人们感兴趣的区域从背景中分离出来,即图像分割,主要有阈值法[1-2]、数学形态学[3]、边缘检测法[4-5]、聚类法[6]等方法。随着科研人员不断探索,一些新的算法被应用于图像分割,如模糊聚类[7-8]、遗传算法、支持向量机、超像素算法、神经网络算法等。其中,聚类和支持向量机适用于多类别的分类,神经网络算法的用时较长,通常需要综合运用多种方法才能获得较理想的图像分割效果。对于碑帖图像的分割,阈值法会更适合,但是单纯的阈值法并不能达到较好的分割效果。因此,本文建立基于阈值分割和形态学相结合的二值化复原算法,对数字碑帖图像进行合理分割,旨在更好地重现其艺术价值。
1 碑帖图像特征提取
特征提取是指使用计算机技术提取数字图像信息,判断数字图像上的每个点是否具有某种特征,并将其分为不同的子集。特征提取在计算机视觉和图像处理中具有非常重要的作用。为了加快处理进度,碑帖图像特征提取得到二值化图形后,通常将彩色图像转换成灰度图像再做进一步处理。灰度(Gray)的转换公式为:
Gray=0.299R+0.587G+0.114B
(1)
式(1)中,R为红色亮度值;G为绿色亮度值;B为蓝色亮度值。
碑帖图像特征提取如图1所示。运算结果四舍五入后,灰度图像的亮度范围在(0~255)间。如果灰度图像的直方图显示为2个波峰,那么二值化分割阈值就是这2个波峰中间的某个灰度值。
(a) 红色直方图 (b) 绿色直方图 (c) 蓝色直方图 (d) 灰度直方图
2 阈值分割算法
图像阈值化分割是一种最常见、最基本、应用最广的传统图像分割方法,特别适用于目标和背景占据明显不同灰度级范围的图像,可以极大地压缩数据量,简化分析和处理步骤,具有计算简单、运算效率高的优点,是对图像进行进一步分析、特征提取与模式识别前必要的图像预处理过程。根据碑帖图像的特点,本文初始二值化采用阈值分割算法。
2.1 迭代阈值分割
迭代阈值分割是改进的双峰算法,采用基于逼近的算法思想,便于寻优,具体步骤如下。
1)求出图像中最小灰度值Zmin和最大灰度值Zmax,设阈值分割的初始值为T0,则T0=(Zmin+Zmax)/2。
2)根据已知阈值将图像分成目标A和背景B,分别求出其平均灰度值:
(2)
(3)
3)求出新阈值Tk+1=(ZA+ZB)/2。
4)如果Tk=Tk+1,则运算结束;否则,k+1→k,转到歩骤2。
5)歩骤4结束后,Tk即为最佳阈值。
光照均匀和光照不均匀图像分割结果分别如图2和图3所示。对比图2和图3可以看出,对于光照均匀、前景与背景区别较大的图像,分割效果较好,多数情况下都能满足要求;但光照不均匀的图像,采用单一的阈值分割明显不能满足需求。
(a) 原始图像 (b) 基本阈值分割 (c) 迭代阈值分割
(a) 原始图像 (b) 基本阈值分割 (c) 迭代阈值分割
2.2 Otsu算法
Otsu即最大类间方差法,是基于图像所有灰度值的一种全局阈值选取法。针对碑帖图像的特殊性,采用基于Otsu的初始二值化算法,在此基础上进行后续去噪处理,复原图像[9-10]。
(4)
(5)
(6)
(7)
2类之间的数学期望为:
μ=μ0ω0+μ1ω1
(8)
于是,可得类间方差σ2(k)为:
(9)
2.3 自适应阈值算法
阈值分割法是全局阈值,当图像中存在阴影、光照不均匀、背景灰度变化较大等情况时,如果仅用1个固定的全局阈值对整幅图像进行分割,效果不理想。为此,可以采用与像素值位置相关的1组阈值,把图像分成若干个区域后分别进行二值化,避免部分区域无法分割的情况。这种方法就是自适应阈值算法,其优点是抗噪声能力强,对于不能使用全局阈值分割的图像效果较好,缺点是算法处理时间较长。Otsu算法与自适应阈值算法的分割效果如图4所示。从图4可以看出,Otsu算法分割时,由于光照不均匀,较暗处的图像被分割为背景;而自适应阈值算法的分割效果有很大提升,即使是光线较暗,也能分出前景和背景。
(a) 原始图像 (b) Otsu算法 (c) 自适应阈值算法
3 碑帖图像二值化算法
中国古代碑帖图像的书写材料、保存方法及保护方式不同,造成的残缺、污损程度也不同,因此没有统一的二值化方法能够适应所有的图像。对于光照不均匀的图像,可以采用自适应阈值进行分割;对于文字与背景差别较大、容易区分的碑帖图像,直接使用Otsu算法就能取得不错的分割效果。由于碑帖图像的特殊性,经过Otsu算法分割的图像通常存在大量的噪声,且文字本身存在很多的漏洞。因此,数字碑帖图像二值化复原的研究工作就主要集中在去除噪声方面,如:消除图像上的噪声,对碑帖图像进行平滑处理,以消除文字内部的“小洞”。均值滤波器是以均方误差为准则的最优线性滤波器,但其在消除图像噪声的同时也会使目标边缘模糊,弱化文字的细节,不利于文字的精确提取。选择不同尺度的非线性滤波器(形态学或中值滤波),可以去除文档图像的椒盐噪声,但是,在使用大的结构元素时,形态学操作可能会损害文本和图形组件的边缘完整性,也会导致边缘特征退化。因此,噪声去除首先需要提取图像的特征信息,再采取适当的方法进行初始二值化。
数学形态学是一门建立在严格数学理论基础上的科学,是一种应用于图像处理和模式识别领域的新方法,其基本运算有膨胀和腐蚀:腐蚀的作用是去除图像中多余的毛刺,膨胀是腐蚀的反操作,可以去除图像中轻微的缺损,两者都是图像去噪的一种手段。
对形态学操作进行数学描述,用E表示欧拉距离,用A表示E中的二值图像,如果用B表示结构元素,则B对A的腐蚀可以定义为:
AΘB={z∈E|Bz⊆A}
(10)
式(10)中,Bz是向量z对B的平移,即Bz={b+z|b∈E},∀z∈E。
当结构元素B具有一个中心,且这个中心位于E的原点时,B对A腐蚀就可以理解为:随着B在A中的任意移动,B的中心所能达到的区域。
B对A的膨胀可以定义为:
A⊕B={z∈E|(BS)z∩A≠φ}
(11)
式(11)中,BS是B的对称集合,即BS={x∈E|-x∈B} 。
若是B以原点为中心,那么B对A膨胀就可以理解为:随着B的中心在A中的任意移动,B上的任意一点所能达到的区域。
先腐蚀后膨胀为开运算,一般能平滑图像的轮廓,削弱狭窄的部分,去掉细的突出。B对A的开操作,即先对A进行腐蚀操作,然后再进行膨胀操作:
A∘B=(AΘB)⊕B
(12)
先膨胀后腐蚀为闭运算,也能平滑图像的轮廓。与开运算相反,它一般融合窄的缺口,去掉小洞,填补轮廓上的缝隙。B对A的闭操作,即先对A进行膨胀操作,然后再进行腐蚀操作:
A·B=(A⊕B)ΘB
(13)
考虑到要保留文字的笔画信息,采用形态学的开运算,既能去除大量椒盐噪声,又能保留图像边缘,为接下来进行连通域滤波做准备。笔画较粗和笔画较细的形态学滤波处理结果分别如图5和图6所示。从图5和图6可以看出,对于笔画较粗、噪声较小的图像,形态学处理效果还是不错的。对于文字笔画较细的图像,如果仅使用形态学滤波,反而出现了新的噪声,因此需要综合运用多种算法(结合连通域、均值滤波),以进一步修复文字信息。
(a) 原始图像 (b) 二值处理 (c) 形态学处理
(a) 原始图像 (b) 二值处理 (c) 形态学处理
考虑到噪声的面积一般小于正常笔画,可以采用连通域的方法进行滤波。连通区域标记通过对二值图像中白色像素(目标)进行标记,让每个单独的连通区域形成一个被标识的块,然后获取这些块的轮廓、外接矩形、质心、不变矩等几何参数。连通区域滤波步骤为:①计算图像连通域的面积;②计算图像连通域的数目;③寻找滤波阈值Ti(针对噪声较多的碑帖图像,一般可设为连通域平均面积的1/2),低于阈值的连通域像素设置为0;④滤波后的图像进行5×5的均值滤波,进一步去除毛刺;⑤输出图像。
4 实验结果
在MATLAB 2019a上测试算法,测试结果如图7所示。由于碑帖图像并没有标准的图形库来验证分割的准确率,通过肉眼分辨,从图7可以看出本文综合算法对于复杂的图像有很好的分割效果,几乎去除了所有噪声,且保留了文字边缘,明显优于其他方法。
(a) 原始图像 (b) Otsu算法 (c) 均值滤波 (d) 形态学滤波 (e) 综合算法
5 结论
以基于阈值的分割方法为基础,结合连通域与形态学,建立了数字碑帖图像二值化综合算法,并在MATLAB 2019a上进行算法测试。测试结果表明,对噪声严重的数字碑帖图像进行二值化分割,不仅能够将图中大量的背景噪声滤去除掉,还能够填充笔画中的小洞,保留图像的边缘,尽可能全面恢复碑帖图像的原始面貌。该算法在处理复杂、含有大面积噪声的图像时分割效果非常理想。