数字环境下图书馆的古籍整理与保护研究
2020-04-16赵娜
【摘要】图书馆想要更加全面和有效地履行其社会职能,对我国古籍文献资源进行深度保护与可持续传承发展,就需要结合最新的技术手法来针对古籍资源予以数字化处理,同时开发更加富有针对性的古籍文献检索系统,推进古籍编目。本文在阐述图书馆古籍整理需要注意的要点的基础上,结合实际探讨数字环境下图书馆加强古籍整理和保护的有效策略。
【关键词】数字环境;图书馆;古籍整理;保护策略
【中图分类号】G255.1 【文献标识码】A
古籍的类型繁多,透过宏观角度观察,包括甲骨文拓本、青铜器铭文、唐宋雕版印刷品等;微观层面理解,则强调在有雕版印刷过后我国1911年前出现的种种印本和写本。经过互联网和信息化等技术蓬勃发展之后,民众对于历史文化开始愈来愈关注,而图书馆保留的历史文献则是进行数字化处理的主要对象。所以说,各地图书馆应该更加细致地完成古籍整理、组织、应用等工作,进一步透过互联网实时性的传播,引导更多民众去了解和传承有关的传统文化。
一、图书馆古籍整理需要关注的要点
(一)古籍的数字化转化和存储
所谓古籍的数字化转化,就是凭借计算机等技术来针对古籍文献予以批量化的加工处理,进一步形成完善的数目数据库和古典全文数据库,在方便读者检索、下载、阅读、应用的同时,使他们快速发掘当中蕴藏的各类文化要素,从而满足自身不断提升的精神文化需求,提升综合素养。
(二)古籍全文数据库的创建
在进行古籍内容数字化转化过程中,经常会触碰到相关文字过小或是篇幅被大面积虫蛀等消极状况,再就是一些扫描完毕的书籍,尽管说能够方便读者在线即时阅览,却因为没有经过光学字符识别而难以被全文检索、编辑或是下载存储。为了确保今后可以更加高效率和高水平地应用古籍文献,进一步为我国传统文化保护、传承、发展提供不竭的推动力,就需要及时将古籍全文扫描并转化为统一格式的电子文本。
古籍全文数据库的表现形式则主要包含两类:一是古籍文字的键盘输入;二是文字识别系统的自动化识别、分析、索引、阅览等。北京大学图书馆就沿用了第一种形式,在将藏书资源扫描成为图像之余,将有关内容完整地输入到文档之中并添加标点,制作成时代所需的全文检索系统。通常状况下,古籍系统能够同时发挥出文件原貌呈现、全文检索和阅览等功能;再就是方便进行各类颜色的文件处理,在无需打字或是校对的前提下,即可完成文件的数字化转化任务。
(三)索引模块的编制
图书馆要更加有效率地整理古籍资源,进一步为读者提供贴心的借阅和指导服务,就必须要预先编制清晰实用的书目和索引。而随着计算机信息技术的普及,有关电脑编制机读书目开始受到各地图书馆关注,慢慢地转化成为馆际甚至国际间不可或缺的合作系统,至于索引模块的开发进度则稍慢一些。实际上,现阶段全文检索系统已然替代了传统的逐字检索模式,只要输入和馆藏古籍相关的信息,包括书名、人名、地名、事物名等,即可在计算机系统中快速获取,从而快速了解诸如方志和类书等鲜有的古籍著作。
(四)网络古籍资源的组合和检索
要透过图书馆内的全文检索等系统来获取想要的古籍资源,就需要依靠元数据的组织和检索功能。所谓元数据,即对馆藏资料属性的描述内容,其存在意义则是方便馆员精细化地检索、管理与分析。纵观传统的图书馆,有关元数据主要凭借目录卡片或是网络公用目录中的机读编目形式出现,同时兼备著录功能,目的就是方便馆员、读者群体等快速辨识和应用资料。归纳起来,元数据拥有数字资源定位和探索、文件记录与评估等多重功能,是图书馆古籍整理中不可缺少的工具。
二、数字环境下图书馆古籍保护的有效策略
古籍可以说是图书馆馆藏中的精品,具备较高的收藏和学术研究价值,与此同时,这些古籍都经过岁月的洗礼,且大都是纸质形式,不方便保存。为了避免这些稀缺的古籍资源被人慢慢忽略和粗暴对待而不断减少甚至消失,就需要图书馆积极履行自身职能,采用数字化加工处理等方式,开发出更加专业可靠的古籍检索和保护管理系统。久而久之,使更多的读者可以随时检索和了解相关古籍内容,对传统文化和知识进行可持续传承和发展。
(一)设置严格的数字加工处理标准
概括起来,就是在开发实用的古籍数字资源库前提下,针对一些重要的加工环节设置严格的规范标准并督促各地图书馆严格遵循,进一步提升古籍整理和保护的水平。尽管说和其余类型文献相互对比,古籍资源的数字化整理和保护有许多共同特征,不过却也存在明显的特色,即需要针对当中内容进行全面再现和适度重组。基于此,图书馆在进行古籍数字化标准体系创建期间,要严格贯彻开放性、系统性、实用性和拓展性等要求。客观地讲,在组织古籍数字化加工活动中,难免会遭遇到标准繁多的状况,诸如要求在图像制作中呈现出不同的解析度基础上,分别针对黑白和彩色图像设置不同的存储格式。就好比是上海图书馆,现阶段主要沿用TIFF、JPGE格式来分别存储黑白和彩色图像,与此同时,黑白和彩色扫描的解析度分别设置为200~300dpi、100~150dpi。
截至目前,我国在进行古籍影像数据库建设期间,主要面临着中文文字辨识系统、存储媒体、文件影像分析处理等技术瓶颈,尤其是中文文字辨识系统,直接决定着整个古籍保护工作的进行效率和质量。所以说,各地图书馆要尽快开发出可以同时、准确辨读不同字形与字体,还有失真率低且压缩比高的影像压缩等技术,再就是在影像分析处理层面上,要更加全面地兼顾古籍的特征。相信今后古籍影像资料的制作工作量还会急速增加,为了确保方便后续予以统一性管理和及時性共享,还应该针对其存储格式、媒体环境等设置严格的规范标准。
(二)开发实用的古籍检索和管理系统
为了更好地迎合古籍整理和保护工作的最新要求,就需要及时开发出兼备数字处理、文件分析、文字识别以及容错性检索等实用功能的古籍全文数据库。唯有如此,才可以更加高效率加工重组各类古籍的全文内容,确保在不失真的前提下予以生动重现,并且方便用户随时进行全文检索。需要注意的是,因为古籍中有很多的通假字与异体字,加上语义切分和别称等现实问题交织,导致读者检索期间难免会出现多检或是漏检等不良状况,而以现阶段各个图书馆的技术实力来讲,还无法做到针对手写或是木刻的古籍文字进行快速、准确辨识。
为了更好地处理上述挑战问题,希望各个图书馆能够抓紧开发一套理想化的古籍影像制作和全文数据库创建方案,在挣脱馆藏壁垒束缚的基础上,促成全国范畴内古籍全文的精准检索和有序管理。如透过图书馆、研究所、高校、商业机构等进行资源整合,鼓励这些主体合作来创建专门的数据库,赋予图书馆古籍资源检索功能急需的便捷性和兼容性,进一步清除古籍数字化发展道路中的种种障碍,促成古籍信息资源的可持续保护与全方位共享。
(三)彼此合力来加快古籍的编目进度
合作编目方式对于现代图书馆古籍书目数据库创建来讲大有裨益,而在正式合作共建中文古籍数目数据库时需要注意两个要点,分别是建档书目资料的整合和有关规范的设置,其中后者更是创建中国古籍数目数据库的基础保障。具体来讲,古籍合作编目活动中要同时关注收录范畴和类型、著录规则、分类和标题模式、建档格式、中文内码等细节性问题,而要将它们及时而全面地处理就需要依靠各方力量和智慧去设置合理的规范标准。就好比是当前的CALIS古籍联机编目数据库,沿用了统一的编目客户端、著录标准、数据格式、分类法,对于国内古籍联合目录的创建有着较强的示范功效,不过仍需持续增加成员馆,特别是要吸入一些古籍馆藏较为丰富的单位。
(四)结合实际制订适合古籍的元数据标准
在现代数字化图书馆建设工程当中,比较关键的内容莫过于古典文献,选择针对其开发完善的检索功能显得更为重要。而所谓元数据,实际上就是针对古籍属性的一种描述形式,其存在意义就是方便用户借助专门的数据库来即时性检索、管理和分析有关古籍资源。因此,今后在加快图书馆古籍数字化和网络化改建进程中,不单单要针对古籍资源予以数字化转化,还要创建和组织适当规模的数目信息,基于元数据来开发和提供更加便捷的检索模式。如北京大学数字图书馆就借助高端化的互联网技术和通用XML网络传输语言来制订古籍资源专属的元数据标准,确保用户在不用安装各类程序的前提下就可以轻松登录web界面并体验联机编目功能,从而实现对图文的自由性管理,表现为流畅性衔接目录、图像和全文,简化MARC格式内部的定长字段并令编目界面变得更加生动简洁,使著录和检索模块更为紧凑地融合等。
(五)兼顾古籍数据库的标准化
首先,数据库管理系统方面。在进行图书馆古籍数据库规范性和标准化创建过程中,特别要关注描述和标引语言,同时配合国内外通用的数据著录、数据格式、数据标引、规范控制等协议予以逻辑化和系统化地组织。至于对应的标准可以依次细化为通信、字符编码、元数据、检索语言、安全等标准。这样一来,不但能够促成相关图书馆数据库间的灵活转换、紧密互联、适当互访,还能夠节约用户检索古籍所耗费的时间和金钱,即在大幅度提升检索效率的基础上,达成古籍信息实时性共建共享的目标。
其次,数据库数据著录的标准化。一方面要精细化筛选古籍版本,之后再统一进行数字化处理,并加入一些未被选用的版本信息,方便读者进行钻研和拓展;另一方面就是深度标引古籍当中的内容,尤其是那些保留特定学术价值的词汇,诸如文献中多次出现的官阶、地点、年号、典故、体制、族属、人名等,要制成特定的索引,确保今后读者可以透过任何角度来准确检索所需的信息,如果说发现一些同书异名、同名异书、相同作者不同称谓的部分,要结合传统文献整序中的名称和主题规范档、权威档等予以规范处理。好比是添加年号和公元纪年对照表、家族世系表、地名沿革表、人名字号表等。还有一方面则是维持古籍数字文件格式的标准化,毕竟文献全文检索格式包含txt、doc、html、pdf等诸多类型,且分别要用专门的阅读器方可以阅览,彼此间又难以兼容。所以,图书馆要保证做好版权保护工作的同时,针对古籍数字文件设置普遍的格式并提供在线阅览功能,使读者及时关注和筛选比较感兴趣的文件,并有针对性地检索、下载、收录、整合、分析、应用。
三、结语
综上所述,在互联网等高端信息飞速发展的过程中,涉及公共图书馆的服务也朝着数字化方向转变。为了确保在古籍阅览方面提供给读者更加便利的服务和指导,进一步发挥对传统文化的可持续传承和发展功用,各地的图书馆须紧紧把握机遇,开发出更加可靠的数据库,提供严格的规范标准,提供详细的著录信息等。长此以往,才能更好地迎合数字环境特征,大幅度提升图书馆古籍的整理和保护水平。
参考文献:
[1]周琼芳.惠州市古籍普查与保护工作研究——以惠州市古籍公藏单位为例[J].图书馆学研究,2014,29(3):166-171.
[2]李明杰.数字环境下古籍整理范式的传承与拓新[J].中国图书馆学报,2015,26(5):126-128.
[3]张文玥.数字化背景下古籍整理展望[J].唐山师范学院学报,2016,23(1):71-75.
[4]姜妮.国内古籍数字化之解析与探讨[J].四川图书馆学报,2016,23(1):114-119.
作者简介:赵娜(1979-),女,汉族,河南西华县,本科,馆员,研究方向:图书馆学。