APP下载

计算机模式识别技术在图书资料数字化中的应用

2017-03-17赵登攀刘娟

电子技术与软件工程 2016年16期
关键词:图书馆

赵登攀+刘娟

摘 要

随着时代的发展,人们对于数字化的图书资源需求越来越多,图书馆对于图书进行了数字化的处理,但是在进行数字化图书资源管理的时候,不可避免的会出现资料数据受损现象。计算机技术的出现,有效地改善了这一问题,可以利用其局部二值化技术对于图书资料进行还原,很好地达到了图书修复的目的。

【关键词】图书馆 计算机模式 识别技术

计算机模式识别技术在上世纪二十年代就已经出现,并且模式识别在很多领域中的应用都取得了不错的效果,在很大程度上推动了人工智能的发展。对于图像资料进行处理,是计算机模式识别技术的一个重要的研究方向,在图书馆中应用计算机模式识别技术,可以有效地修复图书馆藏资料,对于图书资源管理维护具有重要意义。

1 图书馆图书资料数字化现状分析

1.1 图书馆图书资料数字化发展

二十一世纪,电子产品迅速发展,带动了经济的进步,也促使了各种电子产品的出现,生活中人们开始习惯数字化的生活方式,对于纸质书籍的需求越来越少,图书馆为了顺应时代发展,逐渐将书籍进行电子化的收录,满足了人们足不出户进行书籍查阅的需求,并且提高了图书资源的利用率。

1.2 图书馆数字化图书资料修复需求

随着图书馆的数字化发展,在数字化电子书籍的管理过程中,由于计算机数据传输和存储的特殊性,很可能在传输中出现失真问题,所以如果想要保证人们的数字化图书阅读体验,就要更好的确保数字化图书的质量。但是由于数字化图书资料很容易在存储以及传输中出现模糊现象,所以为了减少这种现象对于人们阅读以及图书馆造成影响,对于图书馆数字化图书资料进行修复也就成为了图书馆发展的主要需求。

1.3 图书馆数字化图书资料修复存在的问题

由于传统二值化修复方法对于图书资料的图像提取并不准确,很可能在提取中造成图像的二次損失。并且在传统二值化修复方式进行数字化图书资料的采集时,很多采集的图像在计算机中是以灰度图像进行现实的,严重影响了计算机对于资料的识别效果。这些现象的存在都会导致识别的图像出现模糊现象,最后就造成了对于信息进行提取的难度。

2 计算机传统二值化修复模式

2.1 图像二值化

图像二值化的方式是数字化图书资料的修复处理中,传统的修复方式,这种方式主要是应用二十四位的灰度图像,通过对于图书资料设定灰度值来实现对于图书资料的识别和还原。在实际的应用中,主要是对于图书资料进行数值的设定,亮度大的点以0进行表示,较暗的点则用1表示,这样就可以将图像转变为只有黑白两种颜色的二值化图像,从而将图书缺失的字符寻找出来。

2.2 图像亮度值的计算

在数字化的图书资料中,一般是应用浅颜色作为背景,以深颜色作为字体的主要颜色,大多数的文字是以黑色进行设定,背景则多为白色。所以在进行二值化的操作的时候,可以选择图书资料的亮度来进行灰度等级的设定。从而实现对于亮度值的计算。

2.3 图像二值化存在的问题

传统的二值化修复模式,在应用的过程中,如果有图像资料的局部区域颜色较淡,就会造成二值化识别的失误,也就会造成修复资料的过程中出现资料的缺失,并不能很好地实现对于图书资料的修复工作。

3 模式识别局部二值化应用原理

3.1 模式识别概述

模式识别是对于事物表面进行数字识别、逻辑运算、数据处理的过程,在这个环节中,可以更好的对于事物进行分辩和判定,从而完成数据提取或者是分类的工作。模式识别是依赖计算机技术存在的,其对于数据的处理能力更强,并且此技术可以很好地实现对于数字、图像、字符以及线条的识别。其在图书馆的数字化数字资料修复上,也展现出了极大的优势,可以为图书馆的图像资料维持稳定整体性,提供很好地技术支持。

3.2 局部二值化原理

局部二值化就是讲一个大的图像分割为一个个的小模块,从而进行分区域二值化处理的识别方式,并且将每个区域识别出的信息再按照模块结构进行重组,以完成对于数字资料的识别和修复过程。这种方式有效地改善了二值化存在的问题,可以更好的实现信息的识别效果。及时需要修复的图像局部区域颜色不一致,也不会出现识别失误的问题。

3.3 分割原则

在进行局部二值化操作的时候,最主要的一种工作就是对于图像资料进行分割,合理的进行分割,可以更好的区分出图书资料的明暗度,并且可以很好地实现二值化数据处理的效果。在进行分割的时候,不是越小越好,太小的模块会造成噪音太多,影响处理效果。

4 图书馆中计算机模式识别技术的应用

4.1 图像资料预处理

在进行图书资料的修复的时候,要首先对于图像资料进行预处理操作。在进行处理的时候,要对于图书资料进行不同方向,不同区域的扫描,以减少光照以及其他因素对于图像识别的干扰。现阶段进行图像资料预处理的过程总,主要应用灰度变换或者是平滑滤波两种方式。可以让处理过的图像画面更加均匀。

4.2 提取数字资料字符数据

在进行数字图像资料字符处理的时候,主要是对于图像进行转换,以形成黑白的二值图像。通过对于图像的黑白处理,就可以将图像中的信息显示出来。从而进行图像信息的识别,还原图像资料的数据。

4.3 图像资料二值化二次处理

对于图像资料进行二值化二次处理,主要是为了避免小部分的颜色不均影响整体图像资料的识别效果,但是在进行处理的过程中也会产生一些噪音,所以有必要在进行图像资料充足之前对于噪音进行去除工作。以保证图像资料的修复效果。

5 结论

社会的进步带动了经济的发展,也提高了人们对于生活的需求。随着计算机的出现,人们对于电子化的产品越来越热衷,在图书的选择上,纸质的书籍逐渐走出了人们视野,越来越多的人开始习惯电子版的书籍阅读模式。数字化图书的时代,对于计算机模式识别技术的发展及其有利,其图像资料识别技术在数字化图书中的应用前景广阔,有效地确保了图书馆资料的完整性,为图书馆稳定发展奠定了稳固的基础。

参考文献

[1]李鹏.数字图书馆内容管理开源软件应用与评价研究[D].长春:吉林大学,2012.

[2]陆颖隽.虚拟现实技术在数字图书馆的应用研究[D].武汉:武汉大学,2013.

作者简介

赵登攀(1975-),男,陕西省渭南市人。大学本科学历。现为陕西交通职业技术学院工程师。研究方向为计算机技术。

作者单位

1.陕西交通职业技术学院 陕西省西安市 710018

2.西安职业中等专业学校 陕西省西安市 710005

猜你喜欢

图书馆
去图书馆坐坐
图书馆
图书馆里送流年
夜间的图书馆
图书馆里的小惊喜
图书馆 Library
图书馆