试论我国古籍数字化建设的机制创新
2010-03-22杨琳瑜邢继光
杨琳瑜,邢继光
(中共漯河市委党校,河南 漯河 462000)
中华民族在五千多年的发展历程中创造的辉煌浩瀚的文献典籍,是中华民族宝贵的财富,是我国悠久文化的历史见证和民族精神的重要根脉.保护好、研究好、利用好这些古籍是功在当代,利在千秋的大事,是我国文化建设的一项重要战略性工作,是落实科学发展观、促进社会主义和谐社会建设的重要举措,对传承中华文化,增进民族情感,弘扬民族精神,加强爱国主义教育,维护国家统一具有重要意义[1].随着文献信息载体向数字化、网络化发展,古籍也必须以新的载体形态取代传统的文献介质.事实上,古籍在几千年的流传过程中,其载体的更新正是这些文献得以永久保存的主要手段[2].古籍数字化就是利用现代信息技术,将古籍转化为电子媒体的形式,通过光盘、网络等介质保存和传播[3].对此问题的研究在解决我国古籍保护与利用的同时,也对世界文化遗产保护有重要的借鉴作用.
1 科学认识我国古籍数字化建设
1.1 古籍数字化工作是一项系统工程
古籍数字化是古籍整理的新发展,除了自身具有的独特特点外,还秉承了古籍整理的根本特性.古籍整理不仅是对古籍的文字进行整理,它更是对古代文化的整理.因而,古籍数字化实际上是利用计算机技术对中华民族传统文化进行的一次整理.但这一任务又不是仅仅依靠计算机技术就能完成的,它是一项跨多学科的人文科学与自然科学互融互动的系统工程,其跨度之大、对综合运用知识能力的要求程度之高都是非常罕见的.这就要求参与中文古籍数字化研究和实践的人员应当秉承科学创新的精神,在人文科学和自然科学之间搭起一座交流融通的桥梁,在技术上和理论上进行创新.
1.2 做好古籍数字化具有重要意义
(1)古籍数字化有利于对古籍文献的延续.古籍是一种对保存条件要求很高的文献,在中国文献史上,战乱、水火、气候、虫鼠等都可能使古籍遭到损害乃至毁灭.除此之外,现存的破损古籍也急需妥善处理,对古籍的保护除了改善藏书环境、原本脱酸、原样修复外,数字化处理无疑是一条最便捷的途径.
(2)古籍数字化有利于解决古籍藏与用的矛盾.如何有效的保存好这些珍贵文献,又不影响其正常使用是收藏古籍的图书馆所面临的迫切需要解决的问题.对于图书馆来说,保存和延续人类文化是其重要职责,各图书馆出于对古籍文献的珍爱,对古籍文献的利用作出种种限制事出有因.但是,图书馆并不是藏书楼,它同时具有保护、开发和利用文献的职能.因此,对古籍文献既要做到很好保护,又要充分开发和利用,古籍数字化便是解决这一矛盾的重要方法[4].
(3)古籍数字化有利于古籍文献的检索与利用.古籍数量大,文字繁杂,分类方法、编排样式、检索手段不同,利用率也不高.用传统的手工检索方式对古籍进行检索,速度慢而且查全及查准率低.只有利用计算机技术在资料的储存、整理、检索、数据统计以及索引编制等方面的优越性,加快古籍文献数字化进程,才能使更多更有价值的古籍文献焕发出新的生命力[5].
2 我国古籍数字化建设存在的障碍
我国包括图书馆在内的古籍保存机构近年来积极进行古籍数字化的开发,在古籍书目数据库和古籍全文数据库建设中取得了不少成果,古籍数字化的巨大市场需求正日益显现.但是,古籍数字化毕竟是一个新兴事物,发展进程中存在诸多障碍,同时带来了新的问题.
2.1 古籍数字化进程中的观念障碍
珍贵的古籍是许多保存机构的镇馆之宝,大多都不愿把它们向公众开放,保存的目的只在于炫耀其价值,而不是被有效利用.古代藏书楼重藏轻用的传统延续下来也影响了现代图书馆对古籍的态度,以致于图书馆对待古籍的观念也是保守的.许多图书馆古籍阅览室都防范森严,严格限制读者对象,阅读方式、时间也有着严格的规定.对待古籍的这种保守的态度就决定了图书馆在古籍数字化中瞻前顾后、犹豫不决,也可能不愿意让自己独特的藏书资源拿出来共享,这就造成了在古籍数字化过程中,各个图书馆都有所保留,以致于数字化不能系统和完整.
2.2 古籍数字化进程中的技术障碍
(1)古籍的外在特征所造成的数字障碍.古籍的用字是繁体字,还包括异体字、通假字等等,与现代的简化字大相径庭,在古籍数字化过程中键盘录入难以统一标准.另外,许多古字在计算机字库中却难以找到以致无法保留古籍原貌,影响其数字化进程.古籍的装帧与排版形式也给数字化工作带来困难.与现有的精装或平装书籍尺寸统一、形式固定的特点相比,古籍大都没有固定的装帧标准,在做机读目录时难以形成各个图书馆一致的标准.古籍的排版是竖版式且不加句逗,无论是键盘录入还是影印,操作者必须有渊博的古汉语知识,这实际上是提高了对古籍数字化人员素质的要求,也加大了数字化的难度.古籍年代湮远,纸质较脆,进行数字化工作时要极力避免灰尘、人为破坏等加速古籍老化的因素,古籍特殊的材料构成和文物价值使得在使用数字化手段时不得不变得小心谨慎,间接地阻碍了数字化工作的进展.许多古籍在流传过程中出现亡佚现象,也会因为时代久远而残缺、破损,数字化工作不能系统和完整;(2)古籍的内容特征所造成的数字化障碍.古籍中的语境与我们今天的语境差别很大,文字和语义的不同使得人们对古籍内容的理解有一定难度,另外还有一些专业书籍内容晦涩,因此在数字录入等过程中速度就会自然减缓;(3)数字化进程中的标准问题.规范、统一的数据库形式是数据库的生命所在.目前的古籍数字化可谓是“繁花似锦”,太多的机构参与了古籍的数字化工作,造成文件的格式不统一,大多都需要自己单独的阅读器才能使用.从文件格式上看,目前的古籍数字化除常见的txt、doc和html以外,还有pdf、exe、wdl、pdg、edk和edb等[6].这样古籍数据库无法进行交换,也无法真正实现资源共享,极不利于古籍数字化的发展.
2.3 缺乏宏观调控导致市场、共享障碍
(1)数字化文献重复,致使资源浪费.参与数字化工程的各主体,无一例外地都会考虑其社会效益和经济效益问题.因此,社会影响大、读者面广、市场需求量大的题目自然是首选.由于缺乏统一管理,一个被市场看好的选题往往被数家公司选中并且开发.这种重复不但在人力和财力上是一种浪费,也无形中减少了对其他可开发项目的投入.
(2)数字化古籍质量参差不齐,令人担忧.古籍数字化工程建设的技术实力和素质、制作动机和目的是决定古籍数字化产品质量的重要因素.在目前的古籍数字化市场中,不乏以盈利为目的的出版商,他们在所开发的项目上,竭力以最小的成本甚至偷工减料来牟取最大利润,所生产出来的产品自然粗制滥造,主要表现在:不注重版本的选择、不注重著录用字的识别和检索,其结果只能是影响数字古籍的质量.
(3)数字古籍盗版猖獗,影响古籍数字化项目的正常发展.古籍数字化是一项科技含量很高的工作,不但前期投资成本高,而且投资风险也很大.尤其是当今社会没有彻底解决盗版问题,盗版产品虽然质量粗劣,但价格便宜诱人.对于投资巨大的正规数字古籍出版物来说,通过降价与盗版产品进行低价竞争几乎是不可能的事情.这种情况对正版开发单位以至整个产业的冲击是极大的,直接影响了古籍数字化的正常发展.
2.4 人才和经费问题
古籍资料数字化是传统学术方法与现代科学技术的结合,它需要一批既具备古籍整理知识又能熟练应用现代信息技术的复合型人才.目前却是古籍整理专业人员不懂电子技术,计算机技术人员缺少古籍知识.古籍数字化多数项目的开发属于单一人员或机构的个体行为,缺乏有效的人力资源的组织与控制,这种状况需要通过古籍管理体制和人才培养体制改革加以改变.[7]另外,古籍建设中面临的一个问题就是经费问题.因为缺少经费,虽拥有丰富的文献资料和文献整理经验,但无法购置必需的设备和软件,这样使得古籍数字化工作无法开展起来.
3 我国古籍数字化建设的机制创新
3.1 更新古籍管理理念,克服功利心理,遵循科学的研究方法
图书馆在古籍数字化过程中必须进行良好的协作与分工,各有侧重,避免重复劳动.当代的图书馆人应当转变观念,以一种博大的胸怀迎接现代意义上古籍管理的嬗变,认识到数字化是古籍全方位开放和利用的出路,并且以实际行动为古籍数字化开辟一条道路.中国图书馆学会在《图书馆服务宣言(2008)》指出,图书馆开展信息资源共建共享.各地区、各类型图书馆加强协调与合作,促进全社会信息资源的有效利用[8].
作为多种学科兼而有之的系统工程,古籍数字化的发展规律是这些学科发展规律的集成.它的研究方法要符合所涉及的各学科的研究方法和规律.古籍数字化的这一特点要求我们要始终以科学的方法进行研究,不能有任何功利心理,来不得半点马虎,不能拘泥于形式,在方法和技术上生搬硬套,更不能急功近利、哗众取宠.
3.2 加快技术研发与应用,提升古籍数字化质量
(1)建立适用于古籍的计算机汉字编码字符集.汉字作为一种古老而延续的文字体系,呈现出很强的独特性和因数千年历史积淀造成的复杂性,当前计算机汉字信息处理的状况对于古籍来说,已成为其数字化进程的一个瓶颈.计算机信息处理应加强汉字学理论建设,探索进行针对古籍的汉字编码字符集建设,避免出现收字和字形上的疏漏,使古籍的数据库录入的工作顺利进行.
(2)采用数字式照相技术.数字照相机的拍摄方式不受幅面限制,可以考虑数字式照相技术取代扫描输入.古籍文本输入中一般采用的扫描技术,因其扫描速度较慢,识别率低,且受幅面限制,有的不能保持古籍的原貌,一些特殊规格的古籍,只能通过其它技术处理后再转换扫描,阻碍了古籍数字化进程.
(3)实现古籍数字化的标准化和规范化.要制定规范的著录条例、数据库格式、编目软件使用字库和统一的古籍分类法,协调由图书情报界、信息产业界、软件开发商、古籍整理的专业人员共同参与古籍数字化建设,为读者提供一个共享古籍文献的统一平台.
(4)建立全国统一标准的古籍数据库.以国家图书馆为中心,联合全国各大图书馆及古籍收藏机构,成立古籍数字化建设领导小组.发挥整体人才优势,开展横向协作,进行有效的古籍文献开发利用及相关学术研究,共同制定总体规划和分期规划,统一标准、统一方案、统一技术,避免重复投资和人力资源的浪费,建立全国统一标准的古籍数据库.
3.3 由国家设立专门机构,统筹管理,以避免产品重复和资源浪费
目前的古籍数字化工作还没有一个全国性的权威机构进行统一管理和协调,各制作者基本上是独立开发、各自为政,同一项目重复制作的现象几乎难以避免.由于各自设计思路不同,相互之间不能兼容,已经妨碍到数据库的进一步发展.因此,国家设立专门机构,加强宏观调控和指导无疑将会避免产品重复问题、资源浪费问题、不兼容问题等.
3.4 进行联合开发,走社会化、国际化之路
古籍数字化产品是专业知识与资金、技术结合打造的产物,是一项系统性的工程,社会化、国际化是它必然的发展趋势.在古籍数字化进程中,图书馆要想上水平、上规模,必须摒弃“等、靠、要”的思想和小作坊式的运作模式.各图书馆应当在横向联合的基础上,利用资源优势,与高科技公司、投资者开展多方位的合作,建立项目研发联合体,走社会化发展之路,走资源与收益共享之路.在这个过程中,需要各方面加强协调,精心策划、精心编辑、精心制作,共同树立高瞻远瞩的品牌意识,使产品品牌化.还可以在此基础上进行系统化研发,生产出系列产品.另外,走出封闭,开展国际性合作,也将成为解决我国图书馆古籍数字化工作中资金和技术困难的有效途径.
3.5 培养复合型人才, 适应古籍数字化的技术与知识需求
古籍数字化是传统学术方法与现代科学技术的结合,需要一支学有专长,技术熟练,善于合作的技术队伍.这支队伍中的工作人员不仅要掌握古籍文献的版本鉴定、分类、编目,还要会编制数据库,懂得计算机网络、多媒体等现代技术,能开展研究和开发工作.对这些专门人才的培养,要通过调整高校相关专业人才培养目标和培养方案得到解决,还可以通过组织各种形式的业务培训班,或选派工作人员进修等方式来提高古籍整理研究人员的计算机知识水平,从而使当前图书馆古籍数字化工作中古籍整理专业人员不懂电子技术,而计算机技术人员缺少古籍知识的现状得到逐步改观,从而推动古籍数字化建设.
4 古籍数字化发展的趋势与展望
中央在《关于进一步加强古籍保护工作的意见》中要求,进一步加强古籍的整理、出版和研究利用.制订古籍数字化标准,规范古籍数字化工作,建立古籍数字资源库[9].不远的将来,古籍整理研究的手段、方法将有一个实质性的变化,具有全文检索等诸多功能的大型数据库的建设,以及投资商、技术开发公司、图书馆和专业研究机构合作开发更多、更专门的数字化产品,应该是古籍数字化发展的主要趋势.此外,随着汉语地位在世界上的逐步提高,数字化的古籍必将有着良好的发展前途.谋求国际合作,以多种方式将数字化产品推广出去,借以传播中国优秀之文化,也应当在考虑的范围之内.同时,应该知道,古籍数字化是一项长久而艰巨的任务,需要相关行业不懈努力,共同开创古籍数字化的美好明天.
参考文献:
[1]邢宇皓.陈至立强调加强古籍保护,传承中华文明[N].光明日报,2007-03-02(002).
[2]王发社.古籍数字化的几点思考[J].图书馆论坛,2006(6):121-122,170.
[3]陈阳.古籍数字化发展概述[J].电子出版, 2003(8):2-4.
[4]苏文珠.古籍数字化所面临的问题及对策[J].河北科技图苑,2007(3):19-21.
[5]赵霞.浅议网络环境下高校图书馆的古籍数字化[J].江西图书馆学刊,2007(2):115-117.
[6]牛惠萍,张琳.对我国古籍数字化相关问题的研究[J].当代图书馆,2006(1):39-42.
[7]王华伟,王莉.试谈网络环境下的古籍数字化[J].工会论坛,2008(4):160-161.
[8]中国图书馆学会.图书馆服务宣言(2008)[J].图书馆建设2008,(10):1.
[9]国务院办公厅《关于进一步加强古籍保护工作的意见》[N].2007-03-02(008).