图书馆馆藏纸质文献数字化之我见
2015-05-12史建忠
史建忠
摘 要:本文以内蒙古财经大学图书馆馆藏纸质文献数字化为例阐述了图书馆馆藏纸质文献数字化的意义,数字化过程中应注意的问题以及数字化后对本馆所将带来的影响。
关键词:图书馆;馆藏文献;文献数字化
馆藏纸质文献数字化是我校图书馆内涵改造的一个项目,作为整个项目的具体实施人员,笔者对图书馆馆藏数字化建设提出了几点自己的看法。
1 图书馆馆藏文献数字化的意义
数字图书馆就是以数字形式存储和处理信息的图书馆。馆藏文献数字化一般有两个含义:一是图书馆从外部通过电子图书的购买、网络资源的下载等方式获取数字化文献或信息,增强馆藏数字化程度;二是在图书馆内部将非数字化馆藏文献数字化。在传统的图书馆中,文献形式主要是印刷品,工作人员对这些文献很少加工甚至不做加工,而在数字图书馆中,馆藏文献通过数字化这种深度加工,形成了更为有序的信息资源,使文献的资源价值更加显著和突出。
1.1 有利于保护馆藏文献
通过馆藏文献的数字化可以降低原件丢失和损坏的风险。也可以扩大原始文献的利用范围。
1.2 有利于提高文献的利用率
馆藏文献数字化可以满足用对文献的多种需求。馆藏文献数字化后对用户的存取最为有利,它允许用户对某些文献或文献的某些章节进行快速阅读,按需浏览并保持随机存取;它允许用户自己查找、检索、研究与处理资料;它能满足用户共享资源与及时存取资料。
1.3 有利于图书馆和用户的研究工作
图书馆既是一个信息服务场所,也是一个科学研究的重要地方。而馆藏文献的数字化可以产生较原件可靠而功能性更强的数字资料,这样就有利于图书馆和用户从事文献研究或科学研究,从而扩大研究对象和研究范围。
1.4 有利于图书馆的科学管理
馆藏文献数字化可以提升图书馆的科学管理的效率和水平,为读者和用户提供更好的信息服务。馆藏文献数字化拷贝可以支持传统图书馆的多种需求,为开展特色服务创造条件;图书馆既能够用较低的费用和风险对馆藏文献进行拷贝,也可以更有效地开展馆际互借等活动。
2 图书馆馆藏纸质文献数字化的基本技术
2.1 录入技术
这是最常见的馆藏文献数字化的方法和技术,即通过各种录入方式将书刊转化为文本后,用HTML语言编辑上网。文本格式主要有PDF、TXT、DOC、RTF、WDL、CHM和HTML格式等。
2.2 扫描技术
这是最常用用的能够快速将大量印刷型资料数字化的技术,是目前国内图书馆馆藏文献数字经的主要来源。扫描技术具有节省空间和便于网络传送的优点,但制作速度慢,成本比较高。
2.3 压缩技术
馆藏数字化文献通常以压缩形式存储,特别是对于所需存储空间巨大的图像文件、视频和音频动态文件,压缩技术显得尤为重要。通用的图像压缩标准和格式包括CCITT G4-TIFF、JPEG和JPEG2000等。
2.4 光学字符识别(OCR)技术
利用计算机软件把扫描的图像文献转换成字符文本的一种信息传述,即将一份文献的数字图输入计算机,计算机取出每个文字和图像,并将其转换为文字编码,从而将传统文献转换为数字文本文件。转换成文本文件的最大好处是能够全文检索,否则只能通过对图像文件进行标引达到检索的目的,标引工作往往需要专门的人员甚至专家进行。
3 馆藏文献数字化中对著作权需要注意的两点问题
3.1 文献数字化的著者的版权问题
中华人民共和国2010年(最新)颁布实施的著作权法第四十八条第一款规定“未经著作权人许可,复制、发行、表演、放映、广播、汇编、通过信息网络向公众传播其作品的,本法另有规定的除外”。我们与提供电子图书和数字加工的公司签订合同时明确提出,由对方解决版权问题,如果出现了版权纠纷由对方完全解决。
3.2 合理的使用法律赋予图书馆文献数字的权利
2013年最新修订的《信息网络传播权保护条例》第七条规定“图书馆、档案馆、纪念馆、博物馆、美术馆等可以不经著作权人许可,通过信息网络向本馆馆舍内服务对象提供本馆收藏的合法出版的数字作品和依法为陈列或者保存版本的需要以数字化形式复制的作品,不向其支付报酬,但不得直接或者间接获得经济利益。当事人另有约定的除外。前款规定的为陈列或者保存版本需要以数字化形式复制的作品,应当是已经损毁或者濒临损毁、丢失或者失窃,或者其存储格式已经过时,并且在市场上无法购买或者只能以明显高于标定的价格购买的作品。”由此可见,图书馆可以合理的利用法律赋予的权利,在一定范围内,是可以数字化已经购买的文献的。而且,笔者认为文献被数字化后的目的是为了师生的教学和科研使用,是可以使用的。
4 选择数据商与图书馆合作的模式及几点优势
我校图书馆在项目具实施过程中是采用数据商外包的模式,这样的模式有以下几点优势。
4.1 图书保护优势
现在与我校图书馆合作的超星公司有二十年的加工历程,并有非常丰富的图书保护经验。在图书加工过程,将在书籍扫描前予以检查,并根据图书的具体规格与形式采取拆装或不拆装的扫描方法,有效的减少了图书在加工过程中产生的损伤。同时,每一个扫描人员都经过专业的培训,防止图书在加工过程中受到损伤。
4.2 数据质量优势
冷光源扫描,保证馆藏数据的原版原貌;完善的图像处理流程,对扫描数据中存在的污渍、偏斜、黑色边框等进行处理,保证图像的清晰度;多重检查工序,保证图书在顺序、大小、整齐度上均达到统一标准。
4.3 过硬技术优势
扫描数据采用标准PDG格式;在保证数据质量的同时,通过压缩的方式减小数据的存储容量,使网络数据的传输速度,阅览体验都能够达到较高的水平;同时提供一套电子书管理和发布平台,方便图书馆管理和使用。
5 数据商在纸质文献数字化中的执行的相关标准
5.1 总体标准
符合国家标准《纸质档案数字化技术规范》。确保在扫描过程中不对文献原件造成二次损伤。保证文献扫描图像与原件一致、整洁、清晰。
5.2 元数据著录标准
依据CNmarc规范,元数据内容包含题名、责任者、出版单位、日期、ISBN(ISSN)号、中图分类号、页数、定价、版次、开本、主题词(关键词)等要素。要求元数据信息与扫描数据信息正确对应,无错乱现象。
5.3 扫描标准
支持对文献资源进行不拆装扫描。可以拆装的图书,遵循尽可能保持文献原貌的原则,对扫描后的文献进行装订。扫描图像要求完整、整洁、无歪斜、无黑边、浏览及打印清晰。根据文献情况,采用最为可靠的扫描设备和扫描方式完成文献扫描,避免纸张褶皱、撕裂、破损等情况的发生。扫描图像无缺页、多页、压页现象
6 我校图书馆中文图书数字化后的成果
我校的馆藏文献数字化后的“成果”,是以两个数据库平台呈现的,一个是数据商本身出售的以前加工好的电子图书,另一个是与我馆书目查重没有的数字化的,后来单独数字化的一个平台。数据供应商可以将两个平台的电子图书建立索引这后,利用检索引擎“读秀”就以完成一站式检索。
截止2012年底,图书馆有中文图书22.9万种,114万册,2014年5月数据库公司已经对馆藏中文纸质图书完成了数字化安装。实际完成数字化的图书有215278种(其中与超星公司以前购买的电子图书对比上的有111352种,与书生公司对比上的有2523种,超星公司本次数字化安装的图书有101403种),有14145种未完成数字化,具体原因如表1分析所示。
7 我校图书馆图书数字化的优势
图书馆馆藏数字化可以降低购书成本、增加购书的品种。以我校图书馆2014年纸质图书支出情况为例:2014年购买新书约8000种,16000册(每种图书两个复本),合计码洋约79万元。如果按往年的采购计划(每种图书4个复本),本年度的图书购置款将是158万元。而将图书数字化的成本是每本平均90元(每页0.3元×300页),全年数字化费用是72万元,加上以上的纸质图书款,合计151万元,有形成本可节省7万元。另外,同样的经费购置的图书品种是往年的两倍。
可以有效的解决我校老师在开设选修课时几个班,上百甚至几班学生集中到图书馆“抢借书”,无功而返的尴尬。学生可以在已数字化的图书中任意下载,不受复本的限制。并可以选择重要的章节打印出来。
一些线装书,孤本,善本。在数字化后,师生可以不受读者级别的限制在线或是下载阅读。
将纸质图书的MARC数据的相应字段录入数字化后的电子图书的链接地址。这样师生在查询馆藏纸质图书的同时也就可以知道电子图书的所在,为借阅电子图书节省了时间。
8 结束语
馆藏文献的数字化是我校图书馆自2012年内涵改造的一个项目,于2014年上半年完成了第一阶段的任务。随着我校图书馆每年的藏书品种的增加,数字化的工作是一个连续的过程。以后不仅是中文图书,还会涉及到外文图书和非纸质文献等。作为图书馆的一员,笔者会继续对这项工作进行研究并做出自己的贡献。
参考文献
[1] 王淑云. 浅析图书馆文献数字化的法律保护[J]. 中国科技信息 ,2010 (20):175-176.
[2] 陈洁薇,陈锦波. 图书馆馆藏文献全文数字化建设探究[J]. 高校图书馆工作,2012(1):65-67.