书法文字骨架提取技术的研究
2018-09-05潘索菲章宇澄刘玉立鲍康胜王睿
潘索菲 章宇澄 刘玉立 鲍康胜 王睿
【摘要】提取书法文字的骨架是通过计算机对书法作品进行评价的前提和基础,骨架是一种重要的图像目标几何特征,如何快速地获得二值图像的非畸变骨架,是进行图像目标的形状分析、信息压缩、特征提取、模式识别等应用的前提。书法汉字的骨架保留了大部分的字体信息形状、特征等,而形状特征的提取作为描述图像目标高层视觉特性的方法,更是当前研究的热点,本文采用二值图像细化算法来进行骨架提取,以期获得较好的书法汉字评价效果。
【关键词】书法汉字 骨架提取 二值图像细化算法 轮廓提取
【中图分类号】G633 【文献标识码】A 【文章编号】2095-3089(2018)07-0236-01
汉字书法艺术是中国古老且不断传承的汉文化精髓,汉字书法集文学性与艺术性于一体,练习汉字书法既可培养艺术爱好又可陶冶情操,应为现代国人所推崇与重视。汉字书法练习方式相对古老传统没有现代科技感,无法引起青少年的兴趣也很难使他们坚持练习。本文依托于移动端APP,辅助书法爱好者更好地进行书法练习。该APP可直接调用移动端摄像头拍照获取手写汉字,或直接调用图片库中图片进行分析。根据书法练习的特点,设计单体汉字识别算法,成功拾取整篇作品中每个汉字。进而对每个汉字进行架构分析,计算所选取的关键量化数据。本文采用二值图像细化算法来进行书法文字的骨架提取,将字体图像进行细化处理,在一定程度上简化了提取难度。
一、书法图像细化算法
首先对字体图像进行细化,去除多余的像素点。同时为了保持骨架的连通性,该算法在细化过程中保留了图像的难点、突出部分以及图像中绝对不能被删除的特殊点如交叉点、拐角点等。其次,由于书法作品本身笔画边界粗糙,所以得到的字体骨架图像中必然存在着一些多余的枝杈。为了获得光滑的图像骨架,需要将骨架图像上的毛刺进行删除。最后,为保证骨架的单像素,再去掉多余的像素点。
二、文字轮廓提取
图像的轮廓或边缘是图像最基本的特征,所谓边缘是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。提取边缘的目的是为了突出图像的边缘信息,加强图像的轮廓特征,以便于人眼和机器识别。获取书法作品中字体的边缘轮廓信息也是进行笔划提取和变形的必要前提。
常见的边缘大概分为三种,第一种是阶梯形边缘,其两边的像素灰度值有着明显的不同。第二种是屋顶型边缘,其位于灰度值从增加到减少的变化的转折点。还有一种是线性边缘,其灰度变化有一个明显的跳跃。
另一种获取图像外部轮廓信息的方法是轮廓跟踪。在对书法作品二值图像的处理过程中,为了获取字体轮廓——字体图像边界点坐标的集合,轮廓跟踪的方法被广泛使用。
三、单字切分
单字图像的分割是计算机进行书法学习、模拟必不可少的一环。目前,专门针对碑帖书法作品的单字图像分割研究不多。各項研究主要集中于手写数字、汉字的分割。我们结合汉字字符的分割方法和书法作品的特点做了这方面的尝试。
(一)基于统计方法的切分
基于统计方法的切分,是根据字符的总体统计分布特征,来确定字符之间的界线。判别时以字符的平均字宽作辅助判别,统计分布特征的代表性和稳定性对切分的正确性及收敛性起很重要的影响。这种方法适用于字符宽度比较大,且相差不大的场合。
(二)基于结构的切分
基于结构的切分,即从字与字之间以及汉字本身的结构入手,综合分析、寻找切分的规则。常用的基于结构的切分方法有滴水算法和LDP算法。
(三)基于识别的切分方法
即在实际切分前,对各种可能存在的切分结果进行识别,通过对识别结果的判别来选择最终的切分点。常用的基于识别的切分方法有递归切分算法和基于隐马尔可夫模型的算法。
四、总结
本文结合书法汉字轮廓结构的特点,描述了一种基于字体轮廓特征的笔划提取算法。这种算法对书写工整,结构清晰的书法字显现出一定的效果。对轮廓特征的提取依赖于轮廓的质量,因此轮廓点的离散性质和其中的“噪声”会极大的影响算法的有效性。另外,仅仅根据轮廓特征也不能完全确定笔划信息,需要结合骨架的特征一同进行笔画信息的判断。因此,将字体骨架特征融合到算法中是下一步研究的重点。
参考文献:
[1]程志君,杨德强.基于数学形态学的汉字骨架提取算法[J].山西电子技术,2008,(3):23-24.
[2]邓茜芸,周明全,武仲科,等.面向瓦当文字识别的改进水平集骨架提取[J].中国图象图形学报,2014,19(9):1324-1331.
[3]赵琪.书法碑帖文字的笔划提取技术及其实现[D].华东师范大学.
作者简介:
潘索菲(2002-),女,汉族,安徽合肥人,高中生。
章宇澄(2002-),男,汉族,安徽合肥人,高中生。
刘玉立(2001-),女,汉族,安徽合肥人,高中生。
鲍康胜(1978-),男,汉族,安徽池州人,硕士,中学高级教师,研究方向:青少年科创竞赛。
王睿(1994-),男,汉族,安徽合肥人,硕士研究生,研究方向:计算机软件技术。