利用Matlab对甲骨文视频输入材料预处理研究

2014-09-14陈荣赏开金宇

哈尔滨商业大学学报（自然科学版） 2014年3期

陈荣赏，开金宇，冯杰

(1.厦门理工学院计算机与信息工程学院，福建厦门 361024；2.安阳师范学院计算机与信息工程学院，河南安阳 455002)

把纸质材料的甲骨文文献资料输入到计算机中保存处理是甲骨文信息处理的基础和前提，计算机文字输入方法有人工输入和自动输入两种[1]，人工输入是通过键盘来输入，人工输入包括音码输入法和形码输入法，如，拼音输入法、笔画输入法；自动输入法包括扫描输入和语音识别输入法，常见的方法包括手写输入法或语音识别输入法.目前，针对甲骨文输入法有拼音输入法、笔画输入法、手写输入法，这些输入法都存在一定的缺陷.

音码输入法：有的甲骨文字，确实有这个甲骨字，但因为这个甲骨字还未被考释出来，更别提读音，因此，使用拼音输入法无法输入所需的甲骨文字.同样，甲骨文语音识别输入法也会存在这样的问题.

形码输入法：甲骨文字属于契刻文字，与我们现在所用方格汉字不同，现代的方格字讲求横平竖直，而甲骨文字就不一样了，在甲骨文中，横平竖直的字太少了，即使简体字是横平竖直的，对应的甲骨文也不是横平竖直的；有的简体字很简单，但对应的甲骨文却非常复杂.表1任意列举了8个甲骨文字例子.

表1 甲骨文字示例

由表1可以看出，有时看着一个甲骨字却很难直观地看出它的笔画是什么，因此，使用形码输入法也有些不现实.

手写输入法：手写输入法也存在与形码输入法一样的缺陷，甲骨文字属于契刻文字，即使专业书写甲骨文的专家也要研究上若干年才有可能临摹出一些甲骨文字，对于没有一点甲骨文书写功底的普通人，要写出来一个一个的甲骨字，也不是一件容易的事情.因此，使用手写输入法也是不现实的.

1 甲骨文视频输入识别系统的可行性研究

使用甲骨文视频输入识别系统有如下原因.

1.1 要输入的甲骨文内容比较固定，不灵活

甲骨文的内容与现代汉语内容不同，现在汉语由于其作为现代人与人的沟通媒介，内容是千变万化的，因此，当计算机处理现代汉语语言内容信息时，输入的内容是千变万化的.甲骨文由于其时代的局限性，甲骨文不再作为人与人沟通的媒介，也不再作为记载语言内容的载体，对甲骨文的学习、研究仅锁定在甲骨学这一特定研究领域范围之内，而对甲骨学的研究，不是今人使用甲骨文字创作的新的语言内容，而是主要集中在对甲骨拓片对应的甲骨刻辞内容的研究上，这些甲骨刻辞在甲骨学研究领域已经有了成熟的纸质印刷版；可能存在一些甲骨文书法爱好者即兴抒情写出的甲骨短句，这些甲骨文书法爱好者写出来的甲骨短句，其内容也是先记载到纸质材料上，因此，甲骨文内容的纸质版本材料确定了视频输入法要输入的内容.

1.2 物理条件具备

数码产品的发展，使得视频工具触手可及，现在几乎所有的手机都有视频摄像头，用手机数据线与计算机相连就完成视频输入的物理连接.操作简单，快捷，方便.

1.3 现代信息处理图形图像技术的支持

通过视频输入甲骨文字材料，实际上，是将甲骨文字以图片的形式传输给甲骨文视频输入识别系统中，系统中的图片处理子模块，对甲骨文字图片进行处理，提取甲骨字信息，与甲骨文字体库中的字模进行比对，找到相应的甲骨字，以字的形式读入计算机文字处理程序，等待其他处理，这即为甲骨文视频输入识别系统的工作过程.计算机图形图像学的发展以及矩阵计算工具Matlab的强大功能，为图片处理，提取甲骨文字这项工作提供了技术支持.

甲骨文视频输入识别系统具有一系列的好处：1)在一定程度上，可以完成甲骨文视频输入的工作；2)无需手动输入，省时，省力；3)无需专注于甲骨文的精细模样，省精力；4)视频是直接对甲骨字的拍照，将其转化为甲骨字由系统来处理，保证原始数据的完整性和正确性.

综上分析，设计甲骨文视频输入识别系统在理论上具有可行性.

2 甲骨文视频输入识别系统的系统组成与相关技术方法

甲骨文视频输入识别系统是将甲骨文文稿通过视频工具拍摄后形成图像信息输入到计算机中，通过相应的识别方法提取甲骨文字信息.

2.1 甲骨文视频输入识别系统的组成

甲骨文视频输入识别系统大致可由4个部分组成，包括甲骨文文稿图像获取、图像处理、文字识别和识别结果.其中图像处理涉及到一系列处理方法和技术，主要技术有归一化、灰度转换、对比度增强、去噪、二值化、细化.归一化主要采取的方法有Bilinear插值方法，灰度转换主要采用颜色信息转化，对比度增强采用非线性对比度增强方法，去噪采用滤波去噪方法，二值化采用分析直方图取阈值，其中大于阈值像素的为背景，小于阈值的像素就置为文字，而细化主要就是对骨架进行处理的过程.

2.2 甲骨文视频输入识别系统组成模块说明

甲骨文文稿图像获取：用数据线与计算机连接即可将视频获取的甲骨文文稿以图片信息的形式传输入到计算机中等待处理.

图像处理：首先需要对图片进行归一化处理，将图片的大小缩放到统一的尺寸，以便在字符识别处理过程中，与字符模板库中的字符进行匹配.对图片进行归一化处理，可以通过多种算法来实现，如邻近插值，双线性插值，卷积插值，二元三点插值，二元全区间插值等，效果是越来越好,但是计算量是越来越大，考虑到文字图片在颜色、图像等方面复杂度相对弱和运算量问题，在本系统中，采用双线性插值图像缩放Bilinear插值法对图片进行缩放.

对图片进行归一化处理之后，由于所拍摄的文字图片，主要表现为黑白图像，对图像的颜色转换处理，将会有效地剔除文字识别时大量颜色信息的运算量，而且也能较好地去除噪声点.

图像处理还包括图片的对比度增强，通过对图像的对比度增强提高图片中文字与背景的对比度，本文采用一种非线性对比度增强的方法，这种方法能将图像中有边缘的部分两端的对比度拉开.图像中的文字是边缘密集的部分，因此，把这种方法用在文字图像上正好能起到增强文字与背景的对比度的作用.

二值化：对颜色转换处理后的图片中像素的灰度值进行统计，得到窗口内像素灰度值的直方图，然后用Otsu方法分析直方图取阈值，大于阈值的像素置为背景，小于阈值的像素置为文字.

利用“骨架法”对分割后的字符进行处理，使得字符的笔画变细，最终成为线宽为一个像素的笔画中心线，构成字符的骨架，除去冗余的部分.字符的细化可以减少字符识别运算量.

文字识别，通过模板匹配方法对甲骨文字进行识别.然后将识别出来的文字存储显示出来，就完成了整个系统的功能.

3 甲骨文视频输入识别系统关键技术研究

从上可以看出甲骨文视频输入识别系统从大的方面可以分为两个部分，其中图像获取、图像处理属于甲骨文字视频输入识别前处理，文字识别和显示结果属于甲骨文字视频输入识别后处理.

本文主要从下面5个方面研究了甲骨文视频输入识别前处理的关键技术[2-4].

3.1 采用Bilinear插值方法进行归一化处理

采用双线性插值图象缩放算法Bilinear的插值方法来缩放图片对图片进行归一化处理[5-6]，如公式(1)所示：A是原图，B是缩放之后的图像，R是缩放的比例，B(x,y)是在缩放之后的图片B中像素点(x,y)的灰度值，B(x,y)由公式(1)计算.

(1)

其中:

在Matlab中可以通过调用imresize函数来实现，其实现语法格式为：

B=imresize(A,[mrows ncols],’Bilinear’)

3.2 灰度转换

由于文字只需要黑白两种颜色即可，所以可以将前面处理的图像转换为灰度图像进行处理，应用Matlab中的函数(RGB2GRAY)可以实现.

3.3 非线性对比度增强进行对比度增强处理

采用非线性对比度增强处理对比度增强，其具体算法描述如下：

1)假设原图为A，首先用四个方向的改进Sobel算法求得原图对应的边缘图B；

2)对于原图A的第一个像素A(X,Y)用公式(2)求得值G，其中NX,Y是A(X,Y)的邻域，E(K,L)是在边缘图E上像素(K,L)的灰度值；

(2)

3)用公式(3)求得一个新的灰度值B(X,Y)赋值给像素A(X,Y).

(3)

3.4 Otsu方法统计分析直方图进行文字分割处理

对二值化后图片中像素的灰度值进行统计，得到窗口内像素灰度值的直方图，然后用Otsu方法分析直方图取阈值，大于阈值的像素置为背景，小于阈值的像素置为文字.[7]

3.5 骨架法进行细化处理

利用“骨架法”对分割后的字符进行处理，使得字符的笔画变细[8]，最终成为线宽为一个像素的笔画中心线，构成字符的骨架，除去冗余的部分.可以通过Matlab中bwmorph函数实现.B=Bwmorph(A,’thin’,inf)

4 仿真实验

4.1 实验过程及结果

本系统分别针对印刷稿、手写体稿、拓片在Matlab中做了下面三组仿真实验.所涉及到的主要函数列举如下.

A=imread('E:zhen.jpg')

imshow(A)

A3= imresize(A,[72 40],'bilinear') %双线性归一

imshow(A3)

A4=RGB2Gray(A3) 灰度变换

imshow(A4)

A5=imadjust(A4, [0.3,0.7],[]) 对比度增强

imshow(A5)

A7=im2BW(A5) %二值化

imshow(A7)

A8=Bwmorph(A7,'thin',inf) %骨架处理

imshow(A8)

A9=medfilt2(A5) %对对比度增强的图片进行椒盐滤噪

imshow(A9)

表2以甲骨文拓片材料为例列出了利用Matlab对甲骨文字材料视频输入识别前进行图片预处理的各阶段的效果图.表中所示图形为原图大小的50%.

4.2 实验分析

对实验结果进行分析，并与其他实现方式[5]相同效果进行比较，可知：

1)使用Matlab对甲骨文字材料视频输入识别前进行图片预处理比其他处理方式方便、快捷、灵活、高效.

2)对于印刷体、手写体和拓片三种介质上的甲骨文字，其中印刷体和手写体的处理相对简单，而拓片由于介质是动物骨头加上契刻文字多年在地下深藏，出土后，图片存在的噪声比较多，因此，拓片在识别前需要做的处理工作相对较多.

3)对于文字图像信息，对比度增强与二值化效果相当，可以不做对比度增强处理.

4)通过去噪可以很好地消除图片的模糊信息，提高图片文字的识别度.

但是如果拓片部分文字图片像素信息缺失，可能会导致文字笔画不连通，图片文字处理还存在连通性处理的不好的问题.

表2 利用Matlab对甲骨文拓片视频输入识别前进行图片预处理的各阶段的效果图

5 结语

本文重点对甲骨文视频输入法中的图文处理提取文字信息进行了研究，为甲骨文文稿视频输入文字识别做了准备工作.实验表明，在图形图像学技术的支持下，可以实现由图片提取文字信息，但是如前文所说，在提取文字的笔画连通信息方面还有待进一步提高.并可形成规范[9].

参考文献：

[1] 丁龙, 陆俞. 汉字OCR的原理、方法与应用[J].高师理科学刊, 1998, 18(2): 19-22 .

[2] 王嘉梅, 文永华. 基于图像分割的古彝文字识别系统研究[J]. 云南民族大学学报：自然科学版, 2008, 17(1): 76-79.

[3] 易剑, 彭宇新. 一种图片文字分割的方法[C]//全国网络与信息安全技术研讨会, 北京, 2007.

[4] 包艳花, 图格木勒. 多字体印刷蒙古文识别后处理研究[C]//中文信息处理前沿进展——中国中文信息学会二十五周年学术会议, 北京, 2006.

[5] 史立新, 朱思洪. 基于Matlab的平面度误差最小区域法评定[J]. 组合机床与自动化加工技术, 2005(9): 58-59.

[6] 贾鹏, 李永奎, 赵萍. 基于 Matlab 图像处理的谷物颗粒计数方法研究[J]. 农机化研究, 2009 , 31(1): 152-156.

[7] OCR文字识别软件. MiniOcr[EB/OL]

[8] 黄昌宁, 赵海. 中文分词十年回顾[J]. 中文信息学报, 2007, 21(3): 9-19.

[9] 俞士坟, 段慧明, 朱学锋, 等. 北京大学现代汉语语料库基本加工规范[J]. 中文信息学报, 2002, 16(5): 51-64.

猜你喜欢