APP下载

BP神经网络下的毛笔字帖字符切分方法研究

2021-11-19朱训龙袁国良

计算机仿真 2021年10期
关键词:曲线拟合字段毛笔字

朱训龙,袁国良,周 鹏

(上海海事大学信息工程学院,上海 201306)

1 引言

智能手机因其不可比拟的先天优势,成为人们生活中不可替代的一部分,利用智能手机练习毛笔字,是一种加强精神文明建设的一种方式。然而由于毛笔字大多都是手写,随意性大,字体种类繁多,字体间存在重叠、粘连等情况。因此,如何在智能手机拍摄的照片上,切分手写毛笔字是具有非常重要的研究意义。

目前,对汉字的切分方法[1]主要有:投影法[2-5]、像素跟踪法[6]、维特比算法[7-9]以及基于识别的分割方法[10],[11]等等。针对传统投影切分方法在毛笔字帖字符切分中的不足,提出了反向传播(BP)神经网络的毛笔字帖字符切分算法。文献[12]的基础上,通过设定滑动窗口来收集投影数据,从而设置训练集和测试集去训练和测试BP网络,由BP神经网络确认切分点,最终得到准确的单列毛笔字。文献[13]的基础上,通过曲线拟合来寻找曲线的局部极小值点,结合决定系数判定该区域极小值点是否保留,从而来确定区域极小值点,进而提取投影数据特征,由BP神经网络确认切分点,最终的得到一个完整的单个字符。该算法切分毛笔字帖中的字体有更高的准确率。

2 算法流程

算法的流程图如图1所示。

图1 算法流程图

算法首先获取原图像进行图像预处理,在图像X轴方向上投影提取投影数据。将投影数据分为训练集和测试集两部分,使用训练集训练 BP神经网络模型,并用测试集进行识别分类。在图像的Y轴方向上的投影并提取投影数据,将投影数据分为训练集和测试集两部分,使用训练集训练 BP神经网络模型,并用测试集进行识别分类,最后输出切分后的字符图像。

3 图像特征提取

对已预处理后的字帖图像在X轴方向进行投影,获得像素点的统计直方图。图2表示字帖的竖直投影图。图3表示一列汉字的水平投影图。以汉字的投影直方图为依据,将相邻的两个零灰度值之间的区域作为一个字段。在图2中,可计算出每个字段的宽度,然后求取所有字段的截尾平均数。截尾平均数的公式如下

(1)

式中:α表示截尾系数,α=m/n,n表示数据总个数,m表示被截去数据个数。假设竖直投影的截尾平均数为c。于是,设置一个滑动窗口长度为c,步长为1。在如图2上的投影直方图上,提取投影特征作为数据集。

图2 竖直投影图 图3 水平投影图

从图3的灰度投影直方图,可以看出手写字体的高度变化多样,采取固定高度提取投影特征作为数据集已经不可能。根据这一特点,本文在文献[13]的基础上,结合决定系数(R-square)进行字段的划分。决定系数又称拟合优度[14],其表达式为

(2)

式中,SST(total sum of squares)为总平方和,SSR(regression sum of squares)为回归平方和,SSE(error sum of squares)为残差平方和。其表达式如下

(3)

(4)

(5)

SST=SSR+SSE

(6)

对图3的投影直方图曲线拟合,如图4所示。在图4中,非粘连区域的投影值都有零像素区域,粘连区域的拟合曲线的拟合值在真实值上下浮动。可用极小值点所在区域的拟合曲线与真实数据的积分比值S为判据

图4 投影直方图的曲线拟合图

(7)

(8)

其中,将极小值点i所在区域设为[a,b],α=R2,(x)为拟合曲线函数,f(x)为真实的数据值两两之间的线段。

设阈值θ,判别粘连区域与非粘连区域的准则

(9)

根据式(9)判断极小值是否保留,如图4。为了能获得固定长度的数据,需用临近插值处理两个极小值之间的数据,等间隔的获取区间内的数据。于是,获得了字符区域的投影特征数据。

4 BP神经网络

BP(Back Propagation)神经网络是Rumelhart和McClelland为首的科学家在1986年提出的概念,是一种多层前馈神经网络,通过迭代误差更新参数训练模型[15]。本研究采用的BP神经网络是基于python3的Tensorflow框架下搭建的,一共包含6层主要由输入层(Input Layer),4个隐藏层(Hidden Layer),输出层(Output Layer)。每一层中的w参数,使用标准正态分布进行初始化,方差设定为0.01。为了增加模型的非线性拟合能力,在每层神经网络后面加入了Relu激活函数。并在第一层后面和第五层后面加入了Dropout来防止网络出现过拟合,设置通过率为0.5。模型设置迭代次数为700次,学习率设置为0.001,优化函数设置为AdamOptimizer。模型的结构如表1所示。

表1 BP神经网络模型结构

将投影特征数据集分成三部分:训练集,验证集以及测试集。训练结果:如图5所示。

图5 神经网络的loss和accuracy曲线

5 列切分

由于毛笔字帖是采用纵向书写的格式,所以首先要对毛笔字图像进行列切分。然而,手机拍摄的毛笔字帖图像大多质量较差,存在模糊,光线不均,图像分辨率过高,且由于手持拍摄等的因素使得图像存在不同程度的倾斜。根据毛笔字帖图像的这些缺点在进行列切分之前首先要进行图像的预处理。为了提高列切分的准确性,本文采用基于BP神经网络的毛笔字帖切分方法进行列切分。

5.1 基于BP神经网络的毛笔字帖切分方法

令I表示原图像,I(x,y)为(x,y)点的像素值,Ip表示原始图像预处理后的二值化图像,Ip(x,y)为处理后的二值图像在(x,y)点的像素值,DX表示Ip在X轴方向投影得到的投影直方图,DX(x)为投影图像在x这一列的像素统计值。在整个过程中涉及到的其它参数定义如下:

1)BP神经网络判定阈值;

2)BP神经网络分类公式定义如下

(10)

式中:Output为BP神经网络输出结果;result为BP神经网络分类结果。

RJ版教科书的例题模块相对单一,以“例”“例1”“例2”来划分,例题一般按照从易到难,从基础到应用的顺序排列.

3)将S数组作为BP神经网络的Input输入,得到Output。通过式(10)得到分类结果,然后对分类结果进行聚类,选取每个聚类结果中Output值最大的统计投影段作为最优的切分段;

4)利用Step 3中得到的最优的切分段,得到每一列切分的开始坐标和结束坐标;

5)结束。

6 字切分

字切分包括相离字和粘连字的切分。首先,对投影数据曲线拟合得到曲线所有的局部最小值,然后,在对局部极小值点进行区分获得相离字和粘连字段的开始位置和结束位置,采用BP神经网络进行分类完成切分。

首先,对每一列进行Y轴方向上的投影,得到投影数组Pr,然后对Pr进行曲线拟合得到Pr的拟合曲线f(y)。求得f(y)中所有局部极小值点yi,i为所有极小值点个数。式(9)可以将yi区分为切分点和非切分点,将两个切分点之间的区域称为字段Z,并记录每个字段的开始位置和结束位置。

1)对一列图像进行Y轴方向上的投影,得到投影数组Pr,对Pr进行曲线拟合得到Pr的拟合曲线f(y);

2)求取f(y)中的所有局部极小值点yi,利用式(7),(9)得到切分点,将两个切分点之间的区域称为字段Z,并记录开始位置和结束位置;

3)假设BP神经网络的输入层尺寸为Minput,对Pr进行邻近插值后得到Pn,在Z内等间隔的取Minput个点作为这个字段的投影特征,并存入数组R中,R数组的长度为字段Z的个数;

4)将R数组作为BP神经网络的Input输入,得到Output。记录式(10)的分类结果,保留结果为1的字段Z作为最优的切分段;

5)利用4)中得到的最优的切分段,得到每一列切分的开始坐标和结束坐标;

6)结束。

7 实验结果与分析

实验的运行环境如下:①硬件环境,AMD R5 2600X/3.6GHZ/RAM16GB;②软件开发环境PYTHON编程语言。实验数据主要来自中州古籍出版社的《历代名家碑帖临习技法精解》系列图书的拍摄图片,因《历代名家碑帖临习技法精解》有很多不同名人写的字。这些数据作为实验数据也能够充分说明不同风格的字体对实验的成功率具有一定的影响。

评价切分结果的优劣,不但要考虑实际的字被正确切分出来的比例,也要考虑算法正确切分出来的字占总切分字数的比例。这两个标准可以分别用召回率和准确率[16]来表示:

首先,通过BP神经网络进行投影数据的分类从而确定切分点,对于楷书和行书两种字体切分简单高效,但对于草书字体会出现些许误差,而对于草书字体的连笔字,在确定极小值点时,由式(9)来判别是否保留极小值点。对于行书的楷书这类比较规整的样本,本算法的切分效果十分理想,而对于草书的样本,本算法的优势也十分的明显。如图6,图7所示是针对草字样本,文献[13]和本文的算法进行切分的最终结果。通过两者的对比分析见表2,可见本文算法在字体大小不一和连笔字的切分上有很大的优势。

图6 文献[13]算法对样本切分的最终结果

图7 本文算法对样本切分的最终结果

表2 两种算法对样本分分割结果

8 结语

较高的毛笔字的切分效率对后期识别的准确率十分关键,双向投影汉字切分算法和基于极小阈值和曲线拟合的垂直投影汉字切分算法对规整的汉字切分简单快捷,但以上两种方法在对非规整的文本进行切分时,容易出现误切,尤其是对于草书大小不一和连笔的字体,无法确认区域极小值点是否是切分点,切分错误率高。因此,本文提出一种基于反向传播神经网络的毛笔字帖字符切分算法,该算法利用BP神经网络和决定系数等方法,来克服传统方法的不足,并取得了较好的切分效果。

猜你喜欢

曲线拟合字段毛笔字
带钩或不带钩选择方框批量自动换
基于MATLAB 和1stOpt 的非线性曲线拟合比较
毛笔字的《体育课教案》
我的课余生活
毛笔字,我的好朋友
曲线拟合的方法
应用曲线拟合法优化油井合理沉没度
无正题名文献著录方法评述
无正题名文献著录方法评述
个性毛笔字签名 就这么简单