APP下载

计算机拼接甲骨碎片图像技术简论

2020-11-16刘成林

殷都学刊 2020年3期
关键词:拓片甲骨轮廓

张 展,高 峰,刘成林

(1.安阳师范学院, 甲骨文信息处理教育部重点实验室, 河南 安阳 455000;2.中国科学院自动化研究所, 模式识别国家重点实验室, 北京 100190)

引言

对于甲骨人工拼接,甲骨学者提出了不同的方法:郑慧生等在《甲骨缀合八法小议—<甲骨文合集>缀合笔记》提到8法[1]。白玉峥等在《读甲骨缀合新编暨补编略论甲骨缀合》中提出5法[1]。黄天树等归纳总结了4法[2,3],根据字体、残字、碴口、同文等信息拼接甲骨。以上皆是甲骨学专家提出的人工拼接甲骨的方法,为计算机拼接甲骨提供了思路。

一、计算机拼接方法

1.1 编码数字化拼接法

如图1所示,根据龟甲的生理结构[4],周鸿翔等将龟甲分为左右对称的两部分,每部分分为首甲、前甲、后甲和尾甲,中甲C。首甲、尾甲细分为3个部分,前甲和后甲细分为4个部分,用于编码甲骨字出现的位置。甲骨的尺寸被分为小、中和大3种。文字被分为非常细、正常和像头发3种。依次根据甲骨碎片在乙编中的编号、甲骨碎片在乌龟生理的位置、甲骨的尺寸、甲骨刻画文字的字体、以及甲骨碎片上刻画的位置等信息,对甲骨碎片进行编码。童恩正等增加了用于编码的甲骨信息,并进行甲骨编码拼接数字化[5],此处的数字化改进了编码拼接方法。其采用的编码信息有6项,包括时代、字迹、骨板、碎片、卜辞和边缘等。根据确定碎片属于哪一部分,可以参考甲骨的边缘、纹理、卜辞走向、卜辞等确定拼接规则。

图1 甲骨碎片信息编码

1.2 边角拼接法

文献《如何利用电脑影像处理技术整理甲骨拓片重片》中,将二维的封闭图形放大、旋转、平移后产生一个一维的特征值,尽量准确地描述图形的物理特征,以便分类,从而找出重片。该论文首次采用计算机图像技术处理甲骨片,其本质是比较图像,不是进行甲骨的计算机拼接,但对甲骨拼接有借鉴意义。

台湾清华大学林雅婷等[6, 10],提出边缘长度比值法。其关键技术路线是:甲骨边缘提取、边缘向量化和多边形调整等预处理技术,向量化的特征依序将各点X、Y、Z坐标和所属轮廓线编号分列存成文字档。在甲骨彩色图像拼接时,提出基于边缘凹角与凸角的拼接技术,具体包括单一角的比较、连续多角的比较、以及三个角综合360度三种情况。

具体的思路如图2所示,为计算机拼接甲骨碎片三种情况的思路。在边角近似相同的情况下,如图2a中,计算拟拼接甲骨碎片图像两边线段的比值,若比值的平方和约等于2,则认为两者可以拼接;如图2c中连续的角的边的比值平方和约等于边的个数;如图2e中,360度角相应边的比值平方和约等于3。此处的比值平方和,被称为拼接得分,对应的比例分别如下公式1、公式2和公式3所示。

图2 凹凸角拼接

公式(1)

公式(2)

公式(3)

1.3 边缘特征拼接法

刘永革等[7]根据提取甲骨拓片图像轮廓的序列点,每三个近邻序列点连线构成向量的夹角角度,并在多尺度的情况下,计算轮廓序列点连线组成的角度序列,将此角度序列作为甲骨碎片拓片图像特征,据此进行甲骨碎片拓片图像匹配。如果某一尺度下,源轮廓角度特征序列的第i个角度与目标轮廓角度序列特征的第j个角度,满足公式(4),则认为两者在此尺度下匹配。

|aiT-bjT|<ε

公式(4)

王爱民等对甲骨图像二值化后,跟踪甲骨图像轮廓结合轮廓旋转角度,提取轮廓链码、傅里叶描述子等特征,并计算待拼接轮廓特征向量Fs与数据库中的特征向量Fd的欧氏距离,若此距离小于阈值则认为两者可能拼接。因为选定阈值困难,所以计算两向量的相似度作为评分标准,如公式(5)所示:

公式(5)

1.4 形状拼接法

张长青等根据甲骨图像边界匹配等,进行甲骨拼接[8, 9]。主要技术包括边界增补、边界提取等。在拼接形状时,把源边界平移与旋转到目标边界上,将边界匹配长度与匹配边界缝隙面积比值作为相似度s的计算,并定义了匹配度Sm,如公式(6)和公式(7)所示,选取最大匹配相似度对应的匹配边界对应的甲骨,作为可拼接甲骨碎片。

公式(6)

Sm=a*s +(1-a)*s

公式(7)

二、边缘坐标拼接方法

为了有效拼接甲骨碎片图像,本文提出两种甲骨图像拼接方法:等像素拼接法和等距离拼接法。如图3所示,粉红曲线是乙编3337号甲骨拓片图像边缘(与水平直线相交的曲线),即源甲骨碎片图像边缘,绿色曲线是乙编2556号甲骨拓片图像边缘,即目标甲骨碎片图像边缘。

图3 两种算法的步长

针对甲骨碎片图像边缘坐标匹配,提出等像素拼接和等距离拼接两种方法。等像素拼接方法,如图3a所示,将源甲骨碎片图像边缘的一段,旋转平移到目标甲骨碎片图像边缘的位置,每隔固定数目的像素采样一个像素点(红色点),计算此段采样点与目标甲骨碎片图像边缘相应采样点的距离和,并作为不相似度,将不相似度小于阈值的甲骨碎片图像组,作为边缘坐标匹配甲骨碎片图像,如公式(8)所示,Sj是粉红采样点,Di是绿色采样点,Sdi是等像素拼接算法采样点距离和。等距离拼接方法,如图3b所示,在源甲骨碎片图像边缘旋转平移到目标甲骨碎片图像边缘后,使用半径依次等距离增加的圆形,将甲骨碎片图像边缘分多个小段进行采样,计算源甲骨碎片图像与目标甲骨碎片图像边缘采样点之间的距离和,作为不相似度处理,如公式(9)所示,SRj是粉红采样点,DRi是绿色采样点,SdRi是等距离拼接算法采样点的距离和。等像素拼接法的计算量小,等距离拼接法的适应性好。

公式(8)

公式(9)

三、实验

实验使用Windows平台,VS2017开发环境,OpenCV图像处理函数库。实验使用中历藏1920幅图像库。打开797号甲骨图像,提取甲骨边缘,选择甲骨边缘的一部分,让程序搜索从1到1920号甲骨拓片图像的匹配边缘,并保存搜索到的满足阈值的图像。

如图4举例说明甲骨碎片图像边缘等距离拼接法,图4a左侧为社科院历史所编号为797号甲骨,图4a右侧为社科院历史所编号为799号甲骨,左侧甲骨局部边缘(绿色曲线)旋转平移到右侧甲骨局部边缘后,计算两甲骨对应局部边缘(红色平行线之间)采样点坐标的距离和,若满足设定阈值,则保存下来,作为边缘坐标匹配甲骨碎片图像。甲骨碎片图像边缘坐标拼接时,甲骨拓片图像比甲骨彩色图像边缘坐标拼接更加准确,因为甲骨拓片图像的边缘更加清晰(图4b所示),而甲骨彩图往往会拍摄到甲骨碎片断口(图4a右图),但是甲骨拓片在甲骨盾纹部分呈白色,提取其边缘会有偏差(图4b右图粉红色轮廓),甲骨碎片图像边缘等距离拼接法就是为了解决这两个问题。

图4 中历藏797与799号的甲骨拼接

如图5所示,使用本文算法发现的可拼接被认证的第一组甲骨图像,中历藏1003号与1242号甲骨。

图5 中历藏1003与1242号甲骨缀合

四、小结

计算机拼接甲骨图像的前期,使用的编码拼接法、数字化拼接法,大多需要甲骨专家事先统计甲骨的位置,字数等信息,并且正确率不够高,这两种方法虽然没有使用数字图像处理与计算机视觉,但使用了计算机进行甲骨拼接,对后来的甲骨碎片图像拼接具有参考意义。

猜你喜欢

拓片甲骨轮廓
基于造字机理的甲骨字生成技术研究
21世纪以来的甲骨缀合
字溯甲骨∙文承龙韵
垣曲北白鹅墓地出土青铜夺簋铭文
跟踪导练(三)
拓片
你读过历史,有没有见过历史的影子
刻在甲骨上的爱情
儿童筒笔画
创造早秋新轮廓