APP下载

基于数学形态学的甲骨拓片字形复原方法

2018-12-20顾绍通

计算机技术与发展 2018年12期
关键词:拓片甲骨形态学

顾绍通

(江苏师范大学 语言科学学院,江苏 徐州 221009)

1 概 述

人们在获取图像的过程中,由于受到器件、环境、图像载体本身等多种因素的影响,导致图像的质量不能达到理想要求,图像质量下降,甚至有些图像十分模糊,掩盖了所要的信息。这样的图像需要经过处理达到要求之后才能使用。图像复原技术可以满足人们对高质量图像的要求。图像复原技术在文物修复、遥感图像处理等方面具有广泛的应用。

甲骨文是刻写在龟甲和兽骨上的文字,流行于两千多年前的商朝。由于刻写材料是龟甲和兽骨,深埋地下数千年,已腐蚀严重,加上发掘出土后的损坏,字形已经非常模糊,字形笔划的边缘污染严重,无法直接使用。目前,获取高质量的甲骨文字形一般有两种途径,第一种途径是由著名甲骨文学者描摹书写,这样的甲骨文字形由于出自甲骨文专家之手,一般来说,字形逼真度很高,如郭沫若、罗振玉、董作宾、王国维等甲骨文四大家不仅在甲骨文研究上功力深厚,而且在甲骨文书法艺术上也有很高的造诣。他们的作品不仅保持了甲骨文字体风格的原貌,同时具有很高的书法艺术价值。但是由于甲骨文四大家流传下来的作品有限,加之有些字形在甲骨文书法艺术作品中很难找到,于是不得不从甲骨拓片中获取。第二种途径是直接从原始甲骨拓片中获取字形,但是由于一般的甲骨拓片污染严重,因而通过这种途径获取的字形需要经过复杂的处理才能使用。由于字形污染严重,对甲骨文字形的识读和研究带来很大不便,需要对甲骨拓片上的字形进行修复处理。目前的图像修复算法,大体可以分为偏微分方程的方法、纹理合成的方法、稀疏表示的方法。典型的偏微分方程的方法有基于整体变分的方法[1]、基于曲率的扩散模型[2]、非局部整体变分方法[3]等。典型的纹理合成的方法有基于纹理的修复方法[4]、基于分形的修复算法[5]、图像块匹配置换算法[6]、小波变换与纹理合成结合的方法[7]、区域分割和扩散相结合的方法[8]、权重变分的方法[9]。典型的基于稀疏表示的方法有稀疏形态成分分解模型[10]、在线字典学习算法[11],李民等[12]采用非局部自相似图像块统一进行联合稀疏表示,从而训练高效的字典,提高了算法的性能;Sahoo[13]等运用局部图像块的稀疏近似来解决图像修复问题;李志丹等提出基于Curvelet方向特征的稀疏表示修复方法[14]。

上述图像修复方法都能在某种程度上较好地修复图像,但也都存在不足之处。基于偏微分方程的修复方法的思想是扩散机制,使图像待修复区域周围的信息扩散至待修复区域,因而其主要适用于划痕等小区域的处理,当修复区域较大时会出现区域模糊,修复效果不佳。基于纹理合成的修复方法原理是分析整幅图像的纹理特征,选取与待修复区域最近似的图像区块来填补待修复区域,从而修复图像。该方法弥补了偏微分方程方法的不足之处,可以有效处理图像修复区域较大的情况,但对待修复图像的纹理特征有一定要求,对于纹理特征不明显的图像修复效果较差,计算效率低。基于稀疏表示的方法通常是基于固定字典或者是字典学习的方法来修复图像破损区域。该方法通常假定图像的稀疏系数是随机分布的,并没有考虑稀疏系数的内在联系以及其他相关样本图像的信息,应用范围有限。

针对出土甲骨拓片上字形的特点,文中采用基于数学形态学的方法对甲骨拓片上的字形进行计算机辅助复原。通过对甲骨拓片上字形图像的膨胀与腐蚀操作,平滑字形图像边缘的凹凸形态。

2 基于数学形态学的复原方法

2.1 数学形态学原理

数学形态学建立在集合代数基础上,是分析几何结构和形状的数学方法。数学形态学采用集合论的方法定量地描述几何结构和形状。数学形态学由一组形态学的代数运算子组成。通过这些算子及其组合来进行图像结构的分析和处理,具体包括图像分割、特征抽取、边缘检测和轮廓追踪等。膨胀和腐蚀是数学形态学中两种最基本的运算。膨胀和腐蚀操作的主要作用是去除图像结构中多余的部分,保留感兴趣的部分,同时保持图像原有的内部结构不变。腐蚀和膨胀的组合运用构成开运算和闭运算。

具体来说,数学形态学中的膨胀操作可以使图像中的目标区域“生长”或“变粗”。膨胀操作的定义是:把结构元素B平移s后得到Bs,若Bs击中A,则对这个s点作标记,满足上述条件的所有s点组成的集合称作A被B膨胀的结果。用公式可以表示为:D(A)={s|Bs↑A}=A⊕B。在执行膨胀操作时,输出的像素值是输入的图像相应像素邻域内所有像素中的最大值。以二进制图像为例,假设任何像素值为1,那么对应的输出像素值就是1。

数学形态学中的腐蚀操作可以使图像中的目标“收缩”或“细化”,和膨胀操作相同,腐蚀操作也由结构元素控制,是将结构元素B平移a后得到Ba,若Ba包含于A,则对这个a点作标记,满足上述条件的所有a点组成的集合称作A被B腐蚀的结果。可以用公式表示为:E(A)={a|Ba∈A}=AΘB。在腐蚀操作中,输出的像素值是输入图像中相应像素邻域内所有像素的最小值。同样以二进制图像为例,若任输入图像中任意一个像素值均为0,那么对应的输出像素值也为0。

在数学形态学中,开运算和闭运算是两个最为重要的组合运算。开运算和闭运算可以通过腐蚀操作和膨胀操作的组合来定义。对几何形状先进行腐蚀操作再进行膨胀操作称为开运算,可表示为OPEN(X)=D(E(X))。开运算的作用在于可以消除散点和毛刺,利用这一特性对图像进行平滑。对几何形状先进行膨胀操作再进行腐蚀操作称为闭运算,可以表示为CLOSE(X)=E(D(X))。闭运算的作用在于可以使目标区域扩大,因而可以利用这一特性,通过选择适当的元素结构通过闭运算将两个邻近的目标区域连接起来。

从上面对开运算和闭运算的描述可以看出,开运算可以使目标区域变小,闭运算则可以使目标区域增大。开运算和闭运算有一个共同的特点,一次滤波就可以把所有特定于结构元素的噪声滤除干净,重复运算则不会再有效果。

2.2 复原方法

由于甲骨文是刻写在龟甲和兽骨上,龟甲和兽骨本身并非光滑如纸,因而刻写在上面的文字笔划并非光滑圆润。经过两千多年的地下埋藏被发掘出来后,字形边缘已非常模糊。

图1为原始甲骨拓片及字形图像。

图1 原始甲骨拓片及字形

从图像上看,字形边缘非常粗糙,锯齿状非常明显。以竖直方向为例,在字形边缘上,有的地方向外突起,有的地方则向内凹陷。因此,在执行膨胀操作时,需要具体分析。在向外突起的地方,由于本身已突起,是图像上噪声引起的,如果再执行膨胀操作,则会使原来突起的地方更加尖锐。因此,对于本身已突起的地方,就不再需要执行膨胀操作了。对于如何判定突起的地方,作如下处理:扫描图像边缘,对于那些符合条件的点判定为特征点,即突起的点,可以通过一个点与相邻的两点夹角θ计算出来。夹角θ计算如下:

设M是夹角θ的阈值,如果θ≤M,系统就认为点Pi是突起点。采用这种方式可以把所有的突起点都提取出来,方法如图2所示。图3是提取到的字形图像上的突起点。

图2 突起点的提取方法

图3 提取到的突起点

水平方向上的突起点的提取与竖直方向上突起点的提取方法类似。这里就不再重复。对于斜线上的突起点,也可以仿此建立坐标系,分别处理。

综上所述,甲骨文字分形配准算法如下:

Step1:对输入字形图像进行去噪处理,得到二值图像;

Step2:对竖直方向的笔划边缘进行数学形态学操作;

Step3:对水平方向的笔划边缘进行数学形态学操作;

Step4:对斜线方向的笔划边缘进行数学形态学操作;

Step5:输出处理后的字形图像。

3 实验结果与分析

在Windows环境下主频3.30 GHz的双处理器计算机上,利用Visual C++ 2010和OpenCV2.4实现了以上算法,设计并实现了基于数学形态学的甲骨拓片字形复原系统。图4和图5分别展示了复原前和复原后的字形图像。从图上可以看出,复原处理前的字形图像边缘非常粗糙,有很多突出的细小毛刺。经过高斯滤波后复原的字形图像,边缘平滑了很多。

(a)甲骨文原始字形 (b)复原处理后的字形

从实验结果可以看出,经过形态学操作后,图像边缘得到了一定程度的平滑。随着平滑操作的继续进行,图像边缘在得到平滑的同时,边缘特征的信息也会相应退化。因此,在执行形态学操作后,需要选择合适的阈值,从而得到预期的结果。

4 结束语

在分析甲骨拓片字形特点的基础上,提出了一种基于数学形态学的甲骨拓片字形图像复原方法。首先介绍了数学形态学的基本原理,并针对甲骨拓片字形的特点,运用数学形态学对字形图像进行一系列运算,进而对甲骨拓片字形图像边缘进行平滑。实验结果表明,该方法对甲骨拓片字形图像的复原有一定的效果。

猜你喜欢

拓片甲骨形态学
临床检验中血细胞形态学观察与分析
音乐科学研究中的思想实验——以音乐形态学研究中的四个重大发现为例
颅内后交通动脉瘤破裂出血的临床特征和形态学的危险因素
《韦洽墓志》拓片
五代南汉李纾墓志拓片
字溯甲骨∙文承龙韵
北宋《曲行殷墓志》拓片
拓片制作中的用墨技巧
说甲骨新缀所见的“南孟”与“奠子方”
甲骨释字四则