数字环境下的图书馆古籍整理及其保护浅谈
2021-04-14周家宏
周家宏
(安徽中医药大学,安徽 合肥 230012)
在图书馆馆藏之中,古籍占据着十分重要的地位,直接反映出图书馆的整体馆藏质量。新时代下,图书馆作为重要的文化服务机构,必须认识到自身所承担的文化传承与文化创新职能,认识古籍作为中华文明传承重要载体之一的内在价值,重视加强古籍保护管理工作,力求提升古籍保护管理水平,进而带动整体管理水平提升。为此,图书馆应深入认识古籍保护管理工作的重要性,充分把握有效开展古籍保护管理工作的科学策略,注意古籍保护管理的各方面细节,重视在保护管理实践中落实好相应要点,通过保护管理最大限度地实现古籍内在教育与文化价值。在当前信息化飞速发展的时代,民众们对于古籍文献的关注与日剧增,图书馆的任务也越来越重,图书馆要将古籍保护及整理工作做好,充分利用互联网资源,对相关文化进行发扬传承,让更多民众了解这些优秀文化。
1 图书馆古籍整理需要关注的要点
1.1 古籍的数字化转化
将古籍文献数字化需凭借当前数字化技术对古籍中的文献进行全面的数字化处理,将其储存于云空间,同时不断完善排版,形成一个面向广大社会读者的一个古籍文献数据库,具备让读者搜索、下载、阅读、讨论,引用等功能。古籍的数字化能够给予读者们一个感受中国古典文化的机会,让他们能够探索其中蕴含的文化奥秘,提升自己的文化底蕴。
1.2 创建古籍文献数据库
图书馆古籍借阅时会受到外部干扰因素的影响(诸如环境温度、湿度、光照、虫害等),图书馆要摆脱这些影响需采取相应措施。比如,通过改善古籍存放环境来对古籍加以保护;再生性保护则是指借助信息技术与数字化技术,将古籍中所包含的文字与图像信息进行数字化处理,做好相应数字备份,以此为相关研究工作提供便利,同时减少古籍原件的流通,从而有效避免古籍原件这唯一性和不可再生性的重要文献资料因流通过程中的各方面外部因素而出现损毁甚至丢失的情况。图书馆进行扫描时会遇到古籍页面上大面积腐蚀污染的情况,或者一些完成扫描的文字虽然可以满足读者在线借阅,但是没有进行字符识别不能满足下载引用。图书馆要及时全面的高效率的全文扫描,使其成为统一格式文本。
建设古籍数据库的方法主要有两类,第一种方法就是在键盘上一字一句的输入,这类方法准确性较高,缺点就是速度较慢,北京大学图书馆就是采用了这种方式。第二种是利用科技手段文字识别系统的自动化识别,速度较快,将古籍内容扫描成图像,再加入标点,制成完善的系统。制成完善的古籍系统后就可以很方便的对其中各文字段落进行编辑。
1.3 引导模组完善
图书馆要想完美利用古籍资源,一定要从读者的需求出发,最先要做好的就是目录引导部分,让读者方便快捷的找出自己即将阅读的书籍,好的引导模块的建立对于古籍系统的完善有着重大意义。随着数字化技术的飞速发展,关于电脑读书目录编制系统越来越受到各地图书馆的青睐,其也逐渐转变为不可或缺的系统之一。
1.4 网络古籍资源的组合和检索
图书馆进行全文查找来获取读者想获取的古籍文献需要借用到元数据组织体系的检查搜素功能。元数据就是对馆藏资料的简述内容,有助于分类管理,元数据的作用就是让图书馆管理员能够方便的对古籍内容进行分类管理,对于古籍系统有着不可或缺的作用。在传统图书馆中的元数据主要是借助在书架或者花册上的标记来体现的,主要作用是方便读者和管理员快速辨识和查找,同时也有编辑收录功能。数字化的古籍系统中的元数据拥有定位搜索功能,还有文档编辑等多重功能,这是图书馆古籍文献整理不可或缺的重要工具。
2 数字化古籍保护的相关建议
古籍代表着中国古代先人的智慧,蕴含着优秀的中华民族传统文化,具有很高的研究价值,随着时间的打磨,岁月的洗礼,这些大多为纸质的文献,保存能力不强,很容易因为环境因素被腐蚀,被人为因素所破坏,最终导致古籍资源不断减少最终消失,这就需要图书馆来履行自己的社会职责,采取古籍数字化的方式开发可靠的安全的具备古籍搜索功能和保护系统的保护措施。
2.1 提高古籍数字化标准
图书馆为了进一步提高古籍资源的保护标准,需要在当前开发古籍数字化资源库时对于其中重要环节提升至严格的标准。虽然古籍数字保护与其他文献系统有着很多相似之处,不过还是各有其各的特色,古籍数字化期间要对其内容全面再现的同时还要进行人工重组。在此基础上,图书馆在进行古籍数字化系统创建时要严格遵循系统的开放、实用、创新、拓展的要求。从客观上来看在进行古籍数字化系统创建过程中必然会遇到标准较多,创建系统困难,比如说在图像采集创建中在有着不同分析度的基础上对于单色调和多色调的储存格式,例如上海图书馆使用TIFF、JPGE格式来分别存储单色调图像和多色调图像,在此基础上对于单色和多色调的解析度也分别设置为200~300dpi、100~150dpi。
到目前为止,我国进行古籍数字化影像采集期间还面临着中文识别系统、媒体储存系统、影像采集分析处理等技术的瓶颈,这些技术中特别是中文识别系统,这个技术关系到整个古籍数字化建设的效率和完成水平。因此,各图书馆要尽快开发出集合辨认多种字体的系统还有高真率压缩比高的影像识别技术,更重要的是在影像分析上对于古籍各方面特征进行全面兼顾。
2.2 提高古籍数字化系统的实用性
古籍整理和数字化系统建设要求的提升,就需要图书馆方面及时研究出同时具备数字化处理、文字字体识别、编辑文件分析及精准搜索的功能的古籍数据库。只有研发出更加先进亲民的系统才可以提高古籍数字化工作的效率,让古籍内容准确生动的呈现在用户面前。在开发更先进的系统同时要注意到古籍文献由于年代久远,字体与现代字体有很大差异,存在通假或者异体字,而且同一个字的意义与现代稍有不同,这就给读者检索时造成很多困难,会遇到多、漏、错检等问题。但如今受技术因素影响,还不能达到对于古籍中众多书文载体上快速识别,需要尽快开发出理想化影像文字识别和古籍文献分类方案,不在拘泥于本馆藏或当地馆藏,需要延伸至全国范畴。图书馆方面可以征集社会学术人群的帮助,像研究人员、高校教授、商业机构,鼓励这些方面贡献出自己的一份力,对于古籍数字化进程有着重要促进作用,克服数字化进程道路上的种种困难,促进古籍资源全国共享。
2.3 互相协作促进数字化进程
古籍数字化进程不是一个地区的事情,是整个国家的事情,每个在进行古籍数字化进程的图书馆都不是一座孤岛,都应合作起来这才能形成合力,对于图书馆古籍数字化系统建设来说有着重大益处。标准的设置和整合规范是对于创建古籍数字化系统来讲是巨大保障,合作编目方式对于现代图书馆古籍书目数据库创建来讲大有裨益,而在正式合作共建古籍数目数据库时需要注意两个要点,分别是建档和书目资料的整合和有关规范的设置,其中后者更是创建中国古籍数目数据库的基础保障。总而言之,古籍数字化编录工作中注意的问题很多,其中包括古籍文献类型、收录标准、古籍文献分类、标题等等细节文题,若要将他们全面处理就要借助多方面的帮助,来共同制定标准。例如当前的CALIS古籍数字化编目数据库,就具备统一的设置标准、著录规范、文献格式、标准分类,这对全国正在开展古籍数字化工作的单位无疑是标准示范,不过仍有进一步发展的空间。
2.4 制定合理可行的数据化标准
在当前时代书籍数字化工程建设中,关键内容是古籍文献,这就需要相关馆方针对古籍方面开发更加理想的搜检功能,这对于古籍数字化进程推进十分重要。元数据就是对馆藏资料的简述内容,有助于分类管理,元数据的作用就是让图书馆管理员能够方便的对古籍内容进行分类管理,对于古籍系统有着不可或缺的作用。由此可见,在跟进当前数字化和网络化进程改进中,不仅要只专注古籍数字化进程,还要注意到以元数据为基础进行开发,来提供更加实用快捷的搜检系统。当前北京大学图书馆的古籍数字化进程中就使用更先进的互联网技术和适用面更广的数据传输方式(XML)制出更全面的元数据标准,从而形成一种无需其他应用辅助就能让用户轻松使用的完善功能,实现对于图片文字处理方面的自由性,体现的更加流畅,贯彻引导模组、影像模块、文献文本,对于MARC格式内部字段令界面更加整洁,让检索模块与实际收录著作更加切合等。
2.5 着重于数据库标准统一
首先,古籍数字化进程中的管理方面。在确认标准时进行数据库数据规范化,特别注意对古籍中的部分文字相关注释或标识,与此同时依照国内外通用标准,数据记录方法、数据标注、数据指引、标准设置等条列给予系统组织。对于相关内容的标准可以细化为通讯、字符、元数据、搜索标准、风险评估等标准。通过这些措施,不仅让数据互通,促进古籍数字化进程,还可以节约用户时间,在提升检索效率的同时,还可以实现古籍信息共享的新目标。
其次,古籍数字化数据内容的标准。第一要严格精准的筛选古籍内容,进行系统的加工处理,加入未被选用的新型信息,给读者进行相关钻研时一个便捷的途径;第二是要对于古籍内容一些有讨论研究价值的地方进行标注,例如文献中的年号、相关人物、发生的事件、起因、经过、结果等,都要有一定的引言,为读者日后可以更加方便全面的理解古籍文献的意义,从多个角度获取自己要获取的信息。相关馆方对于一些重名书籍,要明确书籍的作者、年代、著作时间来进行细致分类,来方便读者进行查阅参考。要注意参考相关权威进行分类。例如再添加著作时期时的年号、地点、公元纪年、家族、人文等。再有就是定制古籍文献的标准,使标准统一化,倘若古籍文献格式多样,会对读者阅读时造成困难。图书馆要对古籍数据设置统一格式,为读者进行阅览时提供便利,从而提升读者对相关内容的兴趣。
3 结语
在当今数字互联网飞速发展的时代,公共图书馆服务也应跟进时代步伐,向数字化转变,再给予读者参阅方便的同时还能对中华传统文化进行传承发扬。各地图书馆要把握机遇积极开发出理想化数据库,设立严格标准,迎合当下数字环境特征,大幅提升图书馆古籍整理保护水平。