关于古籍出版数字化的思考
2016-06-22宋淑洁
宋淑洁
本文在阐述古籍出版数字化现实意义、发展必要性的基础上,分析古籍出版数字化需遵循的原则和标准,进而提出如何进行古籍数字化。
古籍是记录文化历史遗产的介质,现今的古籍由于历史的变迁存留的数量已经不多了。信息化技术发展很快,古籍数字化已经比较常见,运用科技技术将古籍保存在计算机系统中,更好地保护了古籍的完整性。
一、古籍数字化的意义
古籍整理是一个细致化和学术化的过程,在古籍数字化之前,古籍的整理出版受时间和空间的限制,也受到保存条件的限制,使得古籍出版的产出量跟不上时代的发展。古籍数字化对古籍原本的保护和内容的传承意义巨大。
古籍出版数字化利用古籍出版数字化系统能够充分挖掘出古籍载体的文化价值和史料价值,从而实现对古籍出版资料的有效利用。同时将古籍的藏与用的问题良好解决,运用数字化系统将古籍史料价值和文化价值实行有效的分离,充分显示出古籍资料的多样化价值。另外,古籍数字化也减少了人们和原古籍的直接接触,在很大程度上减少了人们对原古籍的破坏,更好地实现原古籍的长期保持目标。
二、古籍数字化的原则和标准
古籍数字化的工作是非常系统化的,要在一定的基层原则指导下,再进行有效的系统工作。
其一,要按照古籍的整理原则进行古籍数字化的工作。其二,将有效保护和充分利用相结合来进行古籍数字化的工作。古籍的文化价值和史料价值的分离可以通过数字化来实现。运用数字化可以提高古籍的使用率,这样符合古籍的利用条件;运用数字化传播古籍内容避免接触古籍原版,减少了古籍的破坏率,这也符合古籍的保护条件。其三,严格遵循统一规划系统开发的原则进行古籍数字化工作。在对古籍数字资料管理的同时要充分调动各个部门之间的关系,实现协调化的古籍管理,在最大程度上避免古籍资料浪费情况的发生。同时,还可以建立有关小组对古籍资料进行统一化的分类、整理。其四,必须坚持统一著录标准的原则进行古籍数字化工作。古籍数字化资源共享的基础和古籍机读目录的建设就是编制标准的古籍目录,只有进行深入地标记引入和严格规范控制的数据库才能拥有良好的资源再生,现实的知识是通过再生资源的有效筛选和编排发现的知识。
三、如何进行古籍数字化
从全球范围来说,古籍数字化是大势所趋,如欧美Gale、Adam Mathew等电子文献出版公司已经专门研发了大型电子古籍数据库,他们既有EEBO(15至17世纪珍本英语文献全文线上资料库)、ECCO(18世纪英文古典文献全文线上资料库)等大型的综合型数据库,也有很多专业化细分的资料库。对比而言,我国的古籍数字化需要做的工作还很多,总的来说需要从下面几个大的方面入手。
(一)注重古籍数字化与传统出版结合的复合出版模式
古籍数字化作为保护古籍原本和利用内容的新途径,是目前大势所趋,但是古籍数字化也具有小众化、专业性的特点,因此古籍数字出版需建立在与传统纸质出版彼此结合的出版模式上,即数字出版推动传统出版的多品种开发,传统纸质出版为数字出版提供内容,这两种出版模式都有成功案例,《中华书局古籍语料库系统》和《汉达文库》是这两种模式的代表。
1.传统出版为数字出版提供内容。中华书局开发的古籍数字出版项目《中华书局古籍语料库系统》就是其中的代表性案例。这项古籍数字出版项目建立在该社已经出版过的古籍出版资源进行数字化加工,从而建成中华古籍语料库。《中华书局古籍语料库系统》整个项目大致分成数据采集子系统、原始语料预处理子系统、专家标注子系统、浏览笺注子系统等六大系统。它是目前质量最高的古籍数字资源,已经应用到中华书局经典古籍的再版制作与文本自动化处理中,是传统出版与数字出版相结合的复合型出版模式的成功探索。
2.数字出版推动传统出版的产品开发。《汉达文库》是香港中文大学刘殿爵中国古籍研究中心开发的中国古代传世文献及出土文献综合全文数据库,这个数据库共包括先秦两汉南北朝一切的传世文献,并不断扩充数据库内容。《汉达文库》按文献性质提供各种简介说明及检索方式,甲骨、简帛、金文还附有图版影像,在此数据库平台基础上,出版了系列古籍丛书《汉达古籍研究丛书》《先秦两汉古籍逐字索引丛刊》《魏晋南北朝古籍逐字索引丛刊》。
《汉达文库》古籍数字化出版平台真正实现了传统出版与数字出版的相互对接,互为利润增长点。
(二)注重古籍数字化的特色和专业化
我国历史悠久,有浩瀚的古籍资源,由于各种原因,这些古籍被保存在许多不同地方、不同部门。每个保存单位都会有一些自己特有的专题类型,因此,在做古籍数字化的时候,应该仔细研究精读自己的所藏内容,分类整理,首选突出自己特色的内容来做,避免重复化。同时也应该仔细选取数字化所用底本,最好选择善本来做底本,并且在开发过程中,由专业的文献学学者全程参与,对古籍中出现的相关名词加以必要的标注,对古籍文本的复杂性要有清楚地认识,尽可能要精通古籍整理的专业学者和数字化相关技术专家通力合作,并采取标准化、规范化的程序来进行古籍数字化选题的开发、运作。
(三)共同开发,资源共享
古籍数字化开发目前有不少成果出现,各种数字化产品中,内容大量重复。这种重复不仅存在于一些小规模带有普及性的电子书制作上,同样也存在于一些大型的数字化工程中。最明显的例子是《二十五史》,几乎称得上数字化项目的产品都全部或部分包含了它们。这种重复在人力和财力上都是一种浪费,它提高了开发成本,相应减少了对其他可开发项目的投入。造成这种重复的原因,除了有些文献本身属于基本的典籍,制作单位需要利用它们获得基本的用户外,资源共享上的隔膜恐怕也是一个重要原因。特别是在电子文献资源、技术资源和信息资源上的共享上,这种隔膜对更多更好项目的开发是相当不利的。这方面的例子可以列出许多,如《四库全书》原文图像版就有两种,超星图书馆和国家图书馆及其他公共图书馆在图书内容上都有大量重复。
港台地区古籍数字化成果中有许多系统都能提供全文检索,部分可获得免费检索,而且大多数系统也都支持高级检索。港台和大陆缺乏沟通与合作,双方都有许多资源的重复开发,又同时存在许多古籍信息孤岛,浪费了巨额人力、物力和财力。大陆具有资源优势,港台地区则有数字化技术优势和经验,两者互为补充,可充分发挥数字化成果的价值。近年来,港台地区的古籍数字化底本逐渐采用了大陆出版的标点和校勘成果,这也有力地显示了合作的重要性。
伴随数字化古籍在学术研究和文化建设中愈来愈广泛的应用,古籍数字化本身所涉及的诸多问题也引起IT界和传统文史研究界极大关注。古籍数字化只有凝聚这两个领域有识之士的共同智慧,才能得到健康、顺利的发展。为此,这两个领域的学者和关心古籍数字化的人士,有必要就传统古籍数字化所涉及的各种问题,如技术标准、发展方向、选题设置、学科应用等问题予以深入地探讨。
(四)留意人才队伍建设,培养专业的复合型人才
古籍数字化多数项目的开发以计算机技术和图书馆人员为主,技术公司和图书馆之间的合作,更多的是因为图书馆拥有原始文献资源。而图书馆本身对馆藏图书的数字化,多数采取图片存储格式。在这一点上,现在的一些项目的开发与用户的需求之间还有相当的距离。
应该说,在队伍组织和项目规划方面,目前并非没有比较成功的范例可以借鉴。“台湾中央研究院”的系列电子化项目、元智大学的“网路展书读”、汉文化联盟的《汉文化资料库》采取的都是专业研究专家与技术人员、图书馆三方合作的方式,开发的项目能够满足用户(尤其是专业研究者)的实际需求。北京大学的《中国基本古籍库》在设计思路上也采取了这种方式。古籍数字化的关键之一是要有能利用技术来驾驭古籍文字并对古籍有很好理解的专业人才。专家与技术公司合作虽然是目前通行的做法,但培养复合型人才却是发展的方向。通晓计算机技术的人才不难找,但是同时又精通古籍文献知识的人才却不多,所以,培养复合型人才需要对古籍整理方面的专业人才进行培训,在做古籍整理培训的同时,能够在计算机技术方面有培训。
伴随文献出版信息载体的数字化、网络化发展趋势,古籍出版也一定会以一种新的载体形态来替代传统的文献介质,古籍出版数字化是时代发展要求的一种新方式,是一种必然的发展趋向。
(作者单位系社会科学文献出版社)