结构化局部边缘模式下的文档图像分类处理研究
2014-06-20邢方方
邢方方
摘 要:现代科学技术的快速发展,在一定程度上推动了文档图像分类处理工作的进步。结构化的局部边缘处理模式在文档图像处理工作方面得到了普遍的推广,该算法能够将邻域中的空间分布结构精确的描述出来,提高了图形文档的区分能力。本文通过试验的方式和HOG进行了对比,并对四种文档类型特征进行了分类,探究了结构化局部边缘模式下的文档图像分类处理。
关键词:结构化局部边缘模式;文档图像;模式分类
目前,文档图像具有很多种模式形态,其分类方法也多种多样。在过去,人们比较常用的分类方法是光学字符识别系统,该系统主要根据文本特征、结构特征、混合特征三种方法对文档进行识别分类,但是该分类方法的分类速度比较慢,对所处理图像解析度的要求比较高。因此,该方法逐渐被结构化局部边缘模式分类方法所替代。
1 结构化局部边缘模式下处理图像分类的预备知识
文本管理工作主要包括:压缩、管理、归档、文本分析等,在进行文档工作处理的时候,相对准确的文档类型信息能够有效的提高文本检索的速度以及工作人员的工作效率。文档具有多种模式形态,每种形态都有自己的独特性以及形态之间的相似性。结构化局部边缘模式的使用,不仅可以实现对图像分割模式的自由调节,还能够有效的提高文档图像特征提取的准确性,在使用结构化局部边缘模式进行文档图像特征提取的时候,采用的是图像区块之间重叠的方法,通过这种方式有效的确保图像分割区域特征本身的连贯型性。
2 采用结构化局部边缘模式下,文档图像分类特征的提取
本文在对结构化局部边缘模式下文档图像分类处理的研究中,进行分类对比采用的是HOG。结构化局部边缘系统通过LEP特征,根据图像像素邻域的边缘方向进行了相关的编码。文档图像本身特征就比较明显,例如影像图片的像素数值变化比较大;一般学术论文的格式比较规整且字数比较多;灰度图像之相似性比较大,没有明显的规律可循;表格文件的特征性比较明显,横线和竖线比较多;PPT幻灯片的图像、文字等变化性比较明显,但是在排版方面具有一定的规律可以遵循,为了方便结构化局部边缘模式在处理文档图像方面的研究工作,上述几种图像类型的边缘信息都比较明显。
3 结构化局部边缘模式和HOG的主要特征
3.1 模式分类框架
文中在进行结构化局部边缘模式下,文档图像的分类处理研究中,还没有形成一一个完整通用的基准数据库进行相关的实验研究,并且受其它因素的限制也比较明显。所以,本文在进行处理研究的时候,通过综合对比研究选取了含有5000张图像并具有四种文档图像类别,每种类型都包含1250张图像,类型包括:影像图片、学术论文、PPT幻灯影片以及含有表格的文件。另外,在进行文档图像处理研究时,图片都是随机获取的。
3.2 结构化局部边缘模式的特征描述
结构化局部边缘模式主要是利用计算机模拟技术对对视觉、图像等进行处理,在使用的过程中,根据图片中重复出现的不同pixel,并将其按照不同的方向延伸成九宫格的形状作为参考的重点。在模式计算的过程中,首先要获取到原始的边缘图像,并建立一个3*3的邻域窗口,在这一过程中,文本会被分为比较小的空间区块,其计算方式为:结构化局部边缘模式(SLEP)=Ni/N,i=0,1,2,…31,其中结构化边缘模式的变化范围是在0到31之间,Ni中的i代表的是pixel的数目,n代表的是piexl的总数目。
3.3 HOG的特征描述
HOG特征是目前人们比较常用的图像特征提取方法,该方法在计算的时候选取的是320*256的图像区域,在此基础上,把区块的大小划分为32*32,其中九宫格的大小为16*16,将九宫格的每一格作为最基本地计算单元,然后进行相关的串联计算。方法步骤如下。第一,可以对图像进行卷积处理,目的是了解图像中像素的梯度以及方向变化,一般将范围值控制在[-1,0,1]或者是[1,0,-1]。第二,对每个格子进行量化处理,角度量化的范围值是[0,180],然后根据每个像素的模建立九维方向角直方图。第三,把区块内部各格子之间的直方图进行串联处理,然后组成36维直方图的特征向量。第四,把所有的特征向量串联在一起,就会形成最后的直方图特征向量。
4 结构化局部边缘模式的处理分析
在对上述四种类型的图像特征进行信息提取研究以后,了解到在进行图像分析的过程中,图像的解析度分别为:80*64,160*128,这组数据说明和HOG相比,结构化局部边缘模式在运用过程中性能效果比较好,分辨率也比较高。这说明结构化局部边缘系统在不适用OCR系統的条件下,也具有高质量的文档图像分辨率。当图像大小为80*64,文档图像的类别为影像照片以及规范化的学术论文的时候,SLEP测试效果要比HOG高0.1到1.6个百分点,但是当进行表格文件处理的时候,百分点就会比HOG的百分点低,当进行PPT幻灯片测试的时候,百分点又会比HOG高,这表明,结构化局部边缘模式在文档图像处理的时候,使用整体效能比较高。当图像大小逐渐变大的时候,除表格文件的测试百分点比较低之外,其余也呈现逐渐增高的现象。上述研究表明,当图像文档比较混乱的时候,梯度方向呈现混乱的状态,进行文档图像、影片特征分类会比较方便,但是在进行表格文档处理的时候,使用HOG取得的效果会更加的明显。
[参考文献]
[1]康勤,邱开金,肖国强.基于块边缘模式的图像内容描述符[J].计算机科学,2010(5).
[2]朱庆生,张敏.一种优化的文档图像分割方法[J].计算机科学,2009(4).