APP下载

我国古籍数字化标准体系现状及应对策略研究*

2016-04-05张文亮薄丽辉

新世纪图书馆 2016年2期
关键词:古籍数字化标准

张文亮薄丽辉



我国古籍数字化标准体系现状及应对策略研究*

张文亮薄丽辉

摘要随着古籍数字化研究热度的提升,古籍数字化标准体系的制定显得尤为重要。我国尚未形成完善的古籍数字化标准体系,以供各图书馆、博物馆和档案馆统一使用。这种现状同样不利于我国与国外其他国家进行古籍数字化的合作、开发和利用。因此,有必要完善现有古籍数字化的标准体系,并成立配套的部门机构协助该体系的实施。同时,国家应该颁布相应的政策,培养相应的人才,以此来保证古籍数字化的顺利进行。

关键词古籍数字化标准体系策略

分类号G255.1

DOI10.16810/j.cnki.1672-514x.2016.02.009

*本文系国家社会科学基金委托项目“中国古籍数字化工程研究”(项目编号:12@ZH016)的研究成果之一。

Study on Standard System of Ancient Books Digitalization and the Implement Strategies in China

Zhang Wenliang,Bo Lihui

Abstract Along with the research about digitization of ancient books becoming more and more, ancient books digitization standards system is particularly important.At present, there isn’t a standard system of ancient books digitization to provide a unified use of libraries, museums and archives in our country.This situation is bad for our country’s cooperation with foreign countries in ancient books digitization, also not conducive to the development and utilization of ancient books.Therefore, it is necessary to establish the standard system of ancient books digitization , and to set up a supporting department to assist the system’s implement.At the same time, state should enact the corresponding policies to train the corresponding talents, in order to ensure the smooth progress of ancient books digitization.

Key words Ancient books digitization.Standards system.Strategy.

0 引言

卷帙浩繁的古籍是我国文化遗产的重要组成部分,在研究中国古代社会面貌和科学发展方面具有十分重要的作用。由于古籍的文化价值与普通图书不同,其流通范围受到限制,无法像普通书籍一样被广泛使用,降低了古籍的使用价值,而借助现代信息技术将古籍数字化既可以很好地保存现有的古籍资源,也可以深入挖掘古籍中所蕴含的知识,为古籍的开发、利用奠定了良好的基础。

从我国已完成的古籍数字化成果来看,由于最初各馆采用的标准和规范不一,造成所开发的古籍数据库在著录格式、数据格式、文字编码等方面存在诸多差异,且互不开放,致使很多数字化后的古籍无法实现资源共享[1]。同时,无统一发布平台、重复建设严重、缺乏统一标准等问题在推动古籍进行数字化的过程中显得越来越突出。因此,为我国古籍数字化建立国家标准体系是进行古籍数字化的重中之重,是保障我国古籍数字化有序合理进行的重要举措。古籍数字化标准体系是以科学、技术和经验的综合成果为基础,各方协商一致制定并通过公认机构批准的所共同遵守的规范化文件,对于古籍数字化工程的整体规划和稳步发展具有重要意义。古籍数字化不仅需要完善的标准体系,更需要我国古籍数字化机构对其做到准确理解和把握,并在使用过程中严格遵守,只有这样才能保证我国古籍数字化有序进行。本文针对当前我国古籍数字化标准缺乏系统性和全面性的现状,结合国际上发达国家的先进成果,为我国古籍数字化标准体系的实施提出建议。

1 我国现行标准体系现状

我国古籍数字化标准体系主要由三部分构成:技术标准、管理标准和工作标准(见表1)。技术标准是古籍数字化标准体系的核心,是实现古籍数字资源库高质量的重要保证,其他标准都要围绕着技术标准进行,并为技术标准服务。管理标准是在古籍数字化流程中实施技术标准的重要措施,它将数字化项目开发过程中的各个方面以及相关机构、环节有机地结合起来,统一到古籍数字化业务处理的管理上,以获得最大的开发效益。工作标准是开发高质量古籍资源数据库、提高加工效率、实现各项技术标准的重要保证[2]。

表1 我国古籍数字化标准体系

如表1所示,我国古籍数字化标准体系还很不完善。就技术标准来讲,应该囊括开展古籍数字化的一切技术条件,如元数据标准、加工标准、检索标准、古籍版本选择标准等等。目前,国内虽然隶属于技术标准体系下的标准很多,但是主要集中在元数据标准方面,古籍著录方面的标准只有《古籍著录规则》。这一标准虽然使国内古籍著录有了统一的可执行的标准,但该标准只是一个为手工著录而编订的著录标准,与国际通用的计算机识别兼容的著录规则还存在一定差距[3]。古籍著录的标准化是文献资源共享的基础,统一且行之有效的国家著录标准是建立古籍数字资源数据库的根本条件。然而目前,我国尚没有一项与国际接轨的且为各机构通用的标准,极大地阻碍了我国古籍数字化的进程,不利于我国与其他国家进行该领域的交流合作。另外,我国在管理标准和工作标准方面的标准更是少之又少。可见我国古籍数字化标准体系发展不协调、不全面,有必要制定古籍数字化的国家标准体系,保证我国古籍数字化从技术标准到管理标准再到工作标准三者协调发展,使古籍数字化的整个流程都有章可循,从而保障我国古籍数字化工作的顺利进行。

2 我国古籍数字化标准建设应对策略

2.1重点领域与优先事项分析

2.1.1古籍项目规划标准

项目规划标准包括项目选题标准、审题流程标准和项目监督标准。项目规划标准对古籍数字化的整个生命周期中涉及的监督方式与方法进行了规范。笔者认为,项目规划的重中之重就是选题标准。目前,我国古籍数字化呈现各自为政的局面,虽然数量不少,但关注的焦点过于集中,并且多数都带有商业色彩或者追求规模与宣传效应,致使古籍的数字化集中于“少数”常用,特别是丛书类的古籍,而一些学术界需要的古籍鲜有顾及[4]。鉴于我国古籍数字化的现状,应该首先从源头上进行规范,对项目选题制定出明确的可行标准,以此保证数字化古籍的质量。

2.1.2古籍版本选择标准

古籍版本选择标准是在项目定题并审批后,对数字化项目中使用的版本进行选择的标准。该标准包括版本类型标准和版本细节标准两部分。由于我国古籍是人工抄录的,存在很多手工抄录造成的错误,且古汉语的通假字存在同字不同义、同义不同字等现象,因此我们在对古籍进行数字化时,应选择一个较为完善和被学者认知较广的版本。

在进行数字化的过程中,对于古籍版刻工艺、用纸、字体、装帧、墨色等等细节做出的规定就是版本细节标准。该标准力图避免数字化成果中可能出现的脱文、衍文和残阙等现象。

笔者认为,版本类型选择标准应优先制定和重点研究。因为古籍的年代久远,后人对其的解说更是众说纷纭,怎样选择一个正确率最高的和最为学者认可的版本进行数字化是保证古籍数字化质量的重要一步。如果不加选择地数字化,不仅浪费了人力、物力、财力,且数字化后的古籍质量不高,对于学习借鉴并无大用。因此,有必要根据学者对版本的研究成果总结形成标准条文,指导古籍版本的选择,保证古籍数字化的质量。

2.1.3古籍数字资源发布标准

古籍数字资源发布标准是对古籍数字资源检索、共享和维护的规范,主要包括发布网站的建设标准、检索标准、数字资源维护标准三部分。检索标准是数字资源发布的关键性标准,检索技术的先进性对古籍数字资源的使用体验有着重要影响。

制订标准化的数字化全文检索系统,有助于读者的检索和使用。创建标准化检索系统时,应邀请古籍文献整理专业学者参与其中,研究讨论关键词检索、模糊检索、逻辑检索、条件检索、组配检索等方面的制定,并对相关古籍文献中的官职、人名、地名、特定词汇等提供符合学科特点的建议。如果涉及到专业问题检索,应该由专业学者首先对准备导入数据库的文献进行深度加工,以便加强检索系统的通用性和准确性。

2.1.4古籍数字资源生产标准

古籍数字资源生产标准是对所选择的古籍版本进行数字化生产过程的规范,依照这一过程中每个环节的成果,将标准具体分为数码扫描标准、古籍原书图像数据库标准、文字抓取标准和数字化产品校对标准四部分。该标准的主要目的就是保证古籍数字化产品的质量,通过规定扫描设备、扫描方式、图像大小和清晰度等保证数字化后的产品质量。

目前,我国有关生产标准有:缩微摄影技术在16mn卷片上拍摄古籍的规定(GB/T 7517-2004)、缩微摄影技术在35mn卷片上拍摄古籍的规定(GB/T 7518-2005)、图书馆馆藏资源数字化加工规范第2部分——文本资源(GB/T31219.2-2014)等等。就古籍数字资源生产而言,所有相关标准均应尽快同时制定,对于古籍的标准化加工至关重要。

2.1.5古籍数字资源保存标准

古籍数字资源保存标准包括两部分:古籍数字资源描述和组织。古籍资源描述部分,包括古籍元数据著录规则、古籍描述元数据规范、古籍书目机读格式等标准,为古籍数字资源的著录提供统一模式。古籍资源组织部分,主要包括古籍分类标引标准、古籍主题标引标准、数字化古籍图像分类标准等等,这些标准的建立能够促进古籍资源跨数据库的共享和一站式检索。古籍数字资源保存标准为我国建立古籍书目数据提供了统一规范,有利于古籍阅读软件的推广和开发;为古籍数字化过程中如何著录、标引、采用何种元数据提供了可行标准,保证了古籍数字化的统一。

其中元数据标准尤为重要。元数据是国际公认的解决数字文献管理的最有效途径。以都柏林核心元数据为代表的元数据是适应网络信息资源描述的一种方式,在古籍数据库著录中也开始得到应用。如北京大学数字图书馆古籍元数据标准框架方案提出,古籍描述性元数据由核心元素、本馆核心元素、古籍个别元素等15个元素组成,其中12个元素与DC元数据对应[5]。与此同时,还有一些古籍数字化机构采用了机读格式转换成元数据的方式,并制定了古籍元数据与机读目录的对照表[6]。在现阶段,元数据的应用是一种趋势,但因其内容、标准尚不统一,因此首先应对古籍数字化核心元数据标准达成共识,才是一种比较现实的解决方案。

古籍数字化的过程中,应采用何种分类法也一直是图书馆界探讨的重要课题。学者们的观点有:沿用“四库法”、重编《古籍分类法》和改用《中图法》三大类,而在后期的讨论中,摒弃了原先只能选择一种分类法的前提,利用现代检索语言的优势,即多种检索语言(分类法)可以并存于一个检索系统,形成了将四库法和《中图法》相结合的观点,并被广为接受和推广[7]。

标准化建设能够推动古籍数字化行业在数据采集、加工等各个环节走上科学化、规范化的发展轨道,是推动古籍数字化工作可持续发展的内在动力。与普通图书相比,我国古籍数字化方面一直没有比较权威的标准以供遵循,因此加快我国古籍数字化标准的建设是保证我国古籍数字化顺利进行的重中之重。

2.2保障机制

2.2.1建立协调机制

图书馆、档案馆和博物馆(Library,Archive and-Museum,LAM)是现代社会最重要的三类公共文化服务机构,在历史上有着相同的渊源,但随着现代社会的建立和人类社会分工的日益精细,逐渐分化并各自发展成为三个独立的文化服务体系[8]。虽然三者在我国隶属于不同的行政体系,但是由于业务领域的交叉性和业务模式的相似性,使得三者的协作发展一直被相关行业高度关注和期望。数字时代的到来,不仅提高了三者的服务能力,同时为图书馆、档案馆和博物馆的协作创造了前所未有的机遇。

古籍由于其具有历史文物性质的特殊性,使其成为图书馆、档案馆和博物馆协调一致的先行军。借由古籍数字化标准体系建立的契机,应将三者有机统一起来,充分发挥各自优势,实行各自的诉求,实现1+1+1>1的可能。以古籍为例,由于以前的数字化工作都是各单位独自进行,导致数字化产品良莠不齐,且没有采用统一或可以互相转化的元数据,致使三馆之间一直都在进行一些重复的工作,浪费了大量的人力、物力、财力,且效果不显著。为了促进三者的协调,首先应当加强古籍数字化的选题审查,采用统一的标准化体系进行数字化;成立协调机制,对三馆进行统一管理、规划,避免三馆之间进行重复工作。

为了保障我国古籍数字化工作的顺利进行,不仅需要制定完善的标准体系,还需要相应的机构对其进行增补和修改。笔者建议,成立专门的常设机构,负责标准颁布后的相关工作:对使用过程中的用户问题进行及时的解答,对不符合现阶段情况的部分进行修改、完善,对使用者的反馈意见进行收集整理,并实时跟踪国外的最新进展,及时地对标准体系提出修订建议,以此保障古籍数字化标准体系的顺利实施。

2.2.2设立监督机构

由于我国一直缺乏统一的标准体系,致使个别数据公司或集团形成了信息垄断的局面。有些公司采取技术措施控制图书馆向其购买信息资源的访问期限,或者信息资源文档缺少通用格式,相应公司提供的数字化文档资源必须用对应的诸如超星、书生或方正Apabi格式阅读器才能读出来[9]。这一现状将会导致即使出台古籍数字化的标准体系,各数据公司也有可能仍然沿用各自的格式,不利于信息资源的共享。因此,笔者建议设立专门机构,引导各数据公司严格遵守古籍数字化标准体系,并对其进行监督管理,以保障标准体系得以顺利实施。

2.3借鉴国际化做法

由于历史原因,我国很多古籍流失到了国外,美国、英国、日本、韩国等国家都保存有我国大量古籍,各国也在积极地将古籍进行数字化,以便发挥其价值。其中,美国尤为重视中文古籍的收藏和利用,这也使得美国成为亚洲以外收藏中文古籍最多的地区。同时,中文古籍数字化的开发也是始于计算机发达的美国。美国人P ·J·Ivanhoe于1978 年,运用计算机编制了《朱熹中庸章句索引》《朱熹大学章句索引》《王阳明大学问索引》《戴震孟子字义疏证索引》《戴震原善索引》等[10]。美国普林斯顿大学图书馆以交换的方式和台湾的中央研究院合作将中医药方面的善本数字化,美国国会图书馆也与台北中央图书馆合作进行古籍数字化,并在努力建立一种元数据以期可以上载到世界数字图书馆[11]。除此之外,美国还有很多古籍数字化的项目,这些项目对中美文化的传播与交流起到了极大的推动作用,同时为我国古籍数字化工作提供了借鉴、参考[12]。

2.4政策调控

2.4.1选题控制

我国现在进行古籍数字化的机构很多,如高校、图书馆及商业机构都在积极进行古籍数字化工作,但是由于他们工作的孤立性和研究热点过于集中等原因,至使现阶段我国古籍数字化文献依然较少,且过度集中于某些热门古籍。同时,由于高校普遍与数字化技术公司合作进行古籍数字化,古籍数字化的选题主要以数据公司的需要为主,即按照哪种古籍有经济价值、文献资源拥有者的倡导和开发者的个人意愿等方面着手,导致我国古籍数字化的选题不合理。因此,在实施古籍数字化标准体系时,首要的就是统一管理选题,依据学术需要和社会需求顺序进行数字化,依据古籍的损坏程度进行数字化。只有确保进行数字化的古籍的合理性,才能顺利实施古籍数字化的标准体系,否则只能是空谈标准化。

2.4.2培养专业人才

古籍数字化依据的主要是文字,而不是文物。理想中的古籍数字化,应该是将古籍文献和出土文献以及学术研究成果有机结合起来,建立一套综合知识的服务体系,提供检索、类聚、信息链接、知识提示乃至跨学科跨领域的知识比对服务功能[13]。将古籍以照片的形式展现,仅仅是完成了数字化的第一步。如何对古籍进行校对,整理,转换为通俗易懂的文字是我国现今古籍数字化亟需解决的重要问题。而解决这一问题的基础就是要有大量专业的复合型人才。

具体的人才培养主要有两个方面。一方面是学术教育。国家应当注重培养专门从事古籍数字化的本科、硕士人才,在本科阶段开设古籍文献学、数字化技术、数据库设计等课程,在硕士阶段设立相关的研究方向,加强对古籍数字化的理论研究和技术研究,培养兼具理论知识和实践能力的人才。另一方面是职业培训。从事古籍数字化工作的人员必须接受岗前培训或在岗培训,通过培训掌握和提高必要技能,以便于从事具体的工作。古籍数字化的顺利进行,不仅仅需要一个完备的标准体系,更需要专业性人才按照标准严格实施,只有如此才能保证将古籍转换成可流通、易使用的文献资料。

2.4.3资金政策

从古籍保护、整理、建数据库到数字资源的管理、维护等各个环节,都需要一定资金的支持。为了保障我国古籍数字化的顺利进行,需要在国家宏观政策的调控下,统一协调政府和地方有关部门,使古籍数字化工程有充足的物质保障。公益性的古籍数字化工程可向上级主管部门申请专项经费和单位筹资的办法来保障足够经费投入。在政策允许的范围内,拥有丰富古籍资源的收藏单位还可拓展对外合作,与资金雄厚的商业机构进行联合开发,确保资金投入,以此形成一个资源共享与收益分享的良性循环的运行机制[14]。

2.4.4制度支撑

古籍数字化标准化工作是全国标准化改革的一部分,相关国家政策会产生极其重要的作用,国家应当加紧完善和修订标准化法案,制定有利于古籍数字化资源共享的法规,协同各标准化主管部门对现行的各类型标准加以复审和修订,优化标准立项和审批程序,开展标准实施效果评价,向新兴标准体系稳妥过渡,建成结构合理、衔接配套、覆盖全面、适应经济社会发展需求的新型标准体系,实现与国际接轨,促进古籍数字化资源的全球共享。

3 结语

古籍是前人思想的精髓,不应因其珍贵和稀少就被束之高阁,相反应该想办法让古籍流通起来,让古籍充分发挥其价值,为各国学者研究和学习。古籍数字化是让古籍实现其价值的主要手段,建立我国古籍数字化的标准体系并加以实施这一标准体系都是我国亟需解决的重要课题。标准体系的建立只是实现古籍数字化标准化的第一步,古籍数字化标准体系的实施还需要各部门的保障和管理。同时国家在政策、制度和人才培养等方面的支持也是必不可少的。

参考文献:

[1]葛怀东.古籍目录学与古籍数字资源库建设[J].情报探索,2014(3):75-77.

[2]葛怀东.论古籍数字化标准体系建设[J].图书馆学刊,2013(1):47-49.

[3]全国文献工作标准化技术委员会.GB3792.7-87古籍著录规则[S].北京:中国标准出版社,1987.

[4]陈力.中文古籍数字化方法之检讨[J].国家图书馆学刊,2005(3):11-16.

[5]徐清,王唯.近十年古籍书目数据库建设研究概述[J].图书情报知识,2006(113):37-41.

[6]周琳洁.我国古籍书目数据库建设标准规范探讨[J].图书馆建设,2010(2):47-50.

[7]朱震远.走出误区构建现代化古籍检索系统[J].图书馆理论与实践,1996(1):19-22.

[8]赵生辉,朱学芳.我国图书馆、档案馆、博物馆数字化协作框架D-LAM研究[J].情报资料工作,2013(4):57-61.

[9]陈得媛.古籍数字化工作统筹协调机制的构建[J].中国图书馆学报,2009,35(183):47-51.

[10]陈东辉.二十世纪古籍索引编制概述[J].文献,1998(2):65-78.

[11]KAREN T W.北美古籍文献资源建设与数字化的调查[EB/OL].(2013-05-24)[2015-06-02].http://wenku.baidu.com/link url=v8wxCXOcCpvH2f2dWajccW7vbK boSy3cfWzj4M0jj5_rWSnB6yPLucdNnu1XUjHdnplhE jo-GbJAace6tPiHxh_vDSHlhH1QSWPcnagYTP_.

[12]毛建军.美国中文古籍数字化概述[J].图书馆学研究, 2012(1):19-20.

[13]顾青.真正的古籍数字化是建立一套综合的知识服务体系[N/OL].新出版日报,2013-07-18[2015-06-11].http://www.cdpi.cn/xzx/chanyedongtai/fazhanqushi/201 30718/7441.html.

[14]郜丽红.试论古籍数字化的国家宏观政策体系[J].中州大学学报,2010,27(4):39-41.

张文亮辽宁师范大学管理学院讲师。辽宁大连,116029。
薄丽辉辽宁师范大学管理学院2013级硕士研究生。辽宁大连,116029。

收稿日期:(2015-07-16编校:方玮)

猜你喜欢

古籍数字化标准
2022 年3 月实施的工程建设标准
政治标准是发展党员的首要标准
中医古籍“疒”部俗字考辨举隅
家纺业亟待数字化赋能
西藏大批珍贵藏文古籍实现“云阅读”
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
忠诚的标准
美还是丑?