古籍网络化整理与出版初探
2011-08-15徐力
徐力
(海天出版社 重大项目组,广东 深圳 518033)
古籍网络化整理与出版初探
徐力
(海天出版社 重大项目组,广东 深圳 518033)
古籍网络化整理与出版,是计算机网络环境下全新的古籍整理方法、思想和策略。在厘清相关基本概念的基础上,结合计算机网络的特点,对古籍网络化整理和出版的实现进行了探讨,涉及总体策略,基本过程和模式,管理与技术(如云计算),从古籍总体情况调查、目录及版本信息著录及可进行的“整理性”操作到对文字的关键词标注等宏观整理,对古籍文字进行校勘、标点等微观整理,古籍的网络化整理与古籍的网络化出版的关系,已有资源的保护和利用等方面。
古籍;古籍整理;古籍数字化;古籍网络化整理;古籍网络化出版;云计算
从上世纪八十年代将“计算机化”、“电子化”等概念引入“古籍领域”至今,对计算机及其网络的利用,在整理、研究、出版、利用古籍方面,可以说已经取得了令人欣喜的成果。[1]
一是一些图书馆将馆藏古籍书目信息上网,有的还通过数据交换建立了联合古籍目录,如中国国家图书馆的“中华古籍善本国际联合书目系统”。二是进行了一些大型的古籍“数字化”工程,比如“中国基本古籍光盘库”、“国学宝典”、“文渊阁四库全书”、“古今图书集成”、“全唐诗”,中国国家图书馆和上海等地方图书馆对馆藏善本进行的数字化等等。[2][3]三是相关理论研究得到重视,比如,已经于2007年、2009年举办了两届高水平的“中国古籍数字化国际学术研讨会”。[4]
但据笔者观察,古籍领域对于计算机及其网络的利用还有很大的潜力,还有很多事情要做。仅就古籍的整理与出版而论,到目前为止,我们还停留在“数字化”阶段,重视了对计算机的利用,而还未重视对计算机网络的利用。本文拟明确提出“古籍的网络化整理与出版”概念,并从整体上进行一些初步探讨。
需要预为说明的是,近年来备受关注的“古籍数字化”,是笔者所说的“古籍的网络化整理”的基础,但并非一回事。“古籍的网络出版”应当包含在近年来比“古籍数字化”更加热闹的“网络/数字出版”概念之中,但它是以“古籍的网络化整理”为前提的。而且,在“古籍的网络化整理”概念下,古籍的整理与出版,将是二而一的。
一、几个概念的基本界定
要讨论上面提出的问题,先得简略讨论一下“古籍”、“古籍整理”、“古籍出版”与“古籍数字化”等相关概念,这有助于理解本文提出的“古籍的网络化整理与出版”概念和一些技术表述的适用范围。
(一)古籍
古籍即古代的典籍。其中的“古代”是一个人为的断代问题。在一个人为给定的时间以前形成的典籍,可以称之为古籍。我国现定的时间为1912年之前。
典籍,大致地说,载有文图的简、帛、纸、叶、皮、骨、板等物,皆可称为典籍。但有些情形,比如碑刻、壁画、壁题、钟鼎、盘盏、钱币、瓦当之类,皆或有图或有文或图文皆备,却未必可称为典籍。我们需对典籍作一些限定:以承载图文为主要目的,以传达、传播图文所含意义为其基本而非附属、附带的使用功能。此界定能较准确地反映典籍的本质,比如,带字甲骨,有些碑刻如“石经”便在此界定之内,而题文绘图的扇子、屏风等却可视情形排除在外。
事实上,我国古代典籍现在所能见者,最主要的部分是纸质书籍;而且,在不作特别说明的情况下,古籍,许多人常常仅指我国古代的汉字典籍;本文也属于这种情况。
(二)古籍整理
我国的古代典籍,源远流长。在千百年的传布过程中,手抄版刻,难免产生错、漏、衍、乱、漫漶、虫噬、坏缺等等问题,比诸信息传播理论,就是信号在传播过程中产生了噪音、丢失、变形。古籍有了这些问题就会“失真”。清除“失真”,还原其本来面目,同时进行一些便于利用的工作,便是对古籍的整理。
古籍整理指的是对其所承载的图文的整理;而对于其“物”本身的处理,如修补、保护,虽与图文整理有关联但不应算在古籍整理之内,当可归于“文物整理”之中。
古籍中的图,整理相对简单,而且相对于文字其量也较少。所以,事实上,古籍整理主要是对古籍中文字的整理。
古籍整理最基本的目标是“还原”,虽然无论从理论还是事实上,绝对的“还原”都是无法做到的,但就像数学中对于“无穷大”“无穷小”的逼近一样,“还原”是必须确立的古籍整理的基本原则,否则整理古籍就失去了意义。这个“原”是古籍创生时在语言运用及意义表达方面的本来面目,而非其物理特性。为便于利用而对古籍进行的整理主要有:各种分类归集(包括编目、著录、分类、专集、辑佚、排序、索引、提要、辑录、汇辑等等),使之在整体“呈现”方面结构化、系统化;在还原(主要是进行文字校勘)的基础上对文字的形式规整(如异体处理、繁简转换)、标点,使之在文字上规范化。(严格地讲,将标点算作整理是值得讨论的,因为不同的标点可能形成截然不同的文本。注释、索隐和翻译之类,不能算作整理,而应该归于研究。)
我们可以将对古籍图文内容的“还原”和文字规范等看作微观整理,把对古籍在整体上进行的编目、分类、索引、辑录等等工作看作宏观整理。
(三)古籍出版
古籍出版包括古籍原本 (如影印)、整理本(如排印、拓印、校勘、标点、归集、索引)以及带注释、索隐、翻译等研究性内容的“解读本”的出版。从本质上讲,出版就是公之于众。整理古籍是为了更好地利用,为了能够利用古籍及对其整理的成果,就必然要将它们公之于众,所以古籍整理与古籍出版紧密相关。
(四)古籍数字化
古籍数字化是电子计算机引入后的概念,最初多称“计算机化”、“电子化”。分为两个层次:一是古籍文图的数字图像/影像化,一是古籍文字的数字编码化。通过电子扫描、数码照相等技术手段,可以将古籍的图文处理成用计算机能识别和处理的以“0”和“1”描述的图像/影像数字信息,进行保存、传输。对古籍图文数字图像/影像化后能够永续使用,可最大限度地保护古籍原件。字符在计算机中是以数字编码方式存在的。将古籍中的文字通过多种手段以字符方式输入计算机,就是对古籍作数字编码化处理。现在的普遍做法,是在古籍文图的数字图像/影像化基础上采用OCR (光学字符识别)技术,再辅以人工校对,使文字从整体的图像中分离出来,成为计算机能识别的独立字符。
古籍数字化后,利用计算机可对古籍作进一步整理、研究,进而予以更充分的利用。
二、利用网络整理古籍
现在,绝大部分计算机是通过网路联结在一起的,不光是信息可以在计算机之间进行交流,计算机的处理能力也能相互利用。“云计算”概念和应用已经越来越普及,计算机网络的功能更加强大、便捷、高效,应用更加丰富,成本却更加低廉。计算机网络有强大的存储、处理能力,可以随时在线,资源可以不断积累,并及时更新。古籍整理可以充分利用计算机网络的这些特点,在古籍数字化的前提下,进行网络化操作。
(一)古籍的宏观整理网络化
1.目录、版本信息的分布式著录与联网目录
宏观层次的古籍整理,从逻辑上讲,首先应该进行古籍调查,弄清其存在的状况。
虽然可以有新的古籍被发现,但不会再有新古籍被“创造”出来,所以古籍总体的客观存在是确定的。古籍的存在状态,无外乎“已为世所知”和“未为世所知”两种。已为世所知的古籍在藏地、所有权、保存状态、管理及利用规定等方面,都各不相同。如何能够将它们各种信息调查清楚并完整地著录在案?如何能让需要者了解到全面的情况?已为世所知的,由于各种原因可能消失,或者有可能最终被认定为不是古籍而被清除出列;同样,未为世所知的可能会被发现。实际上,“已为世所知”的古籍的外延在一定程度上是动态的。如何能及时更新?
传统(非网络化)的方法是有条件的收藏者做目录和版本登记,再出版或进行有限的交换。使用者需要购买目录或者去藏地查阅。由于显而易见的原因,已知古籍不可能尽被登记在册,而不同藏地的登记也很难统一整合,全面及最新情况也就很难为需要者所尽能知悉和利用。而且登记信息格式和项目各依己见,还可能会出现同一典籍被登记为不同典籍之类的混乱情况。
如果所有收藏者以统一标准和格式将各自的古籍目录与版本著录进网络,通过技术和管理手段联接在一起,需要者只要能联网,有权限,坐在家中便可以轻易获得全部信息。
笔者所主张的古籍整理的网络化,在调查与著录古籍信息方面的基本形式、要求和步骤应该是:
首先利用网络,按目录学与版本学原理研制出完善的著录标准和格式。
可以将已有的格式和标准比如北京图书馆提出的CNMARC格式、GB3792.7《古籍著录规则》等公布在网上,让大家讨论,这比起传统的大多限于“业内人士”的开会研讨来,可以最广泛地搜集意见,进行最充分的争论,达成最广泛的认同,因而确定的标准和格式也必定最完善、最具生命力。同时也是对全社会的动员和宣传。
这个标准与格式应该是尽可能完备又必须具备可扩展性、兼容性,既要能与现代一般图书并库处理又要能反映古籍特点,因为我们的认识和需要总是在发展变化,而先前的各种投入也需要尽可能保护,普适性和个性需要得到同样的重视,而古籍与现代典籍从文化史的发展角度看是同质的。很重要的一点,也是特别的一点,是要根据一些古籍名称不甚规范的特点,设立一些古籍本身并没有的相关性信息(知识)项目,如名称别名,著者别号等等,以备相关查询。比如,要查《红楼梦》的所有版本,在结果中如何能将《石头记》等也包括在内?
其次按标准格式进行分布式著录。
所谓分布式著录,是指按地区比如以省区为单位进行著录,数据保存于本地。(许多私人及小的收藏单位是没有条件进行网络著录的,因而应该相对集中。)这不光是因为网络本身是分布式的,更重要的是这比全国统一著录、保存、维护更有效率。分布式,再配合实行互为镜像,数据的安全性与效率也会更高。最关键的一点,是能基本吻合古籍实物收藏的基本格局,有利于后续工作的进行。当然分布著录需要统一验收,以保证著录的质量。
然后进行联网组合,在重要节点互作镜像,设立全国统一的管理网站,实行数据定期维护、更新及异地备份、统一备份机制,以确保数据能时刻为全社会提供正常服务。
2007年2月启动了首次全国古籍普查 (还拟进行海外中国古籍的调查),国家图书馆的“中国国家古籍保护中心”在网络上开通了“全国古籍普查平台”作为工作与发布平台,最终目的是要弄清全国古籍的数量与保存状态,建立全国性的古籍联合目录。(请注意,是“联合”而非“联网”。)此前国内外已经有许多古籍收藏者在传统的古籍调查结果基础上,进行了计算机著录,有的还上了网,比如前文提及的中国国家图书馆的“中华古籍善本国际联合书目系统”。本次普查充分考虑到了对以前的机录工作的利用,专门设置了对MARC数据、EXCEL数据、ACCESS数据等的导入口。
研究了相关资料后,笔者个人认为,虽然本次古籍普查利用了网络,却并不能认为开始了古籍的网络化整理。因为网络化是方法,更是观念,不是简单地通过网络将信息集中起来,而是要与后续工作,通过网络有机地联结在一起。[5]
网络化的普查、著录工程永远无法彻底完成,而应该是以全国普查为基础,为起点,将调查、著录、维护工作经常化、机制长效化。
2.分类等传统整理工作动态化
各地有关机构将本地古籍按统一标准、格式著录在案,再联网并在重要网络节点设置镜像,形成多个囊括全球古籍资源的虚拟古籍图书馆,并建立日常维护机制,按一定的规则提供给全社会使用。这只是最基础的一步。
接下来,有需要的使用者可以在自己的终端上,根据自己的需要对海量的数据进行各种形式的分类、筛选、排序等处理。这些在传统方式包括目前比较简单的计算机使用方式下很费事甚至无法完成的事情,可以利用计算机网络以云计算方式轻松做到,只要在著录的时候将有关信息输入进去。而且,通过后续的各种研究,将越来越多的相关信息按统一的标准和格式不断输入计算机,还能逐渐将古籍的内在关联进行各种树状梳理,进而建立各种专门主题的虚拟古籍库。最重要的是,做这些工作,几乎是随心所欲的,动态的,随时可以进行的,是由使用者进行的。可以说是以基本信息的不变而应各种需要的万变。(这就是我们强调著录标准要尽可能完备,要让大家充分讨论,要有可扩展性等的主要原因。)
这实际上是将传统方式下的这部分宏观整理工作,最终变成了使用者在网络方式下对古籍基本信息的利用过程。
相应地,全国统一的古籍整理管理网站一个重要的功能是保存使用者的各种分类、筛选、排序等操作结果,如此可在提高后续相同、相关查询效率的同时,分析出更多有价值的数据。
总之,涉及古籍目录、版本等的宏观整理的一切相关事项,都是在网络环境下,依赖网络,以网络运作方式进行的。与非网络方式相比,在观念与工作方式、效率、信息数量、信息结构等等方面,是有天壤之别的。
(二)古籍数字化过程的网络化
光有网络化的目录、版本等信息而无古籍具体内容,在一定程序上可以看作是一个美丽的外壳。在此基础上,必须进行的下一步就是古籍图文内容的数字化。这是又一基础性工程。有了它,古籍微观整理和目录、版本信息之外的宏观整理如分类汇辑、辑佚等等的网络化,才能进行。
上文提到古籍图文数字化有两个层次,第一个层次是古籍的原态转录,第二个层次是对其中的文字进行字符化。第一个层次是整体的、死的,第二个层次是解析的、活的。一些相关工作本身即属于整理的范畴,比如文字手写体改为印刷体,反差较小的图增加反差,污脏的去除。
原态转录的关键是物理指标的确定,如扫描或者照相精度、对比度,颜色体系、文档格式、存储介质等等,最终目标是一次成像永续使用。已经有不少的古籍完成了这方面的工作,但是存在文件格式不统一的问题,并且大多是以光盘单机、多机版(局域网)为使用方式而非全网络方式,目前只有中国国家图书馆有部分资源,对全网络公众开放。
应该按照一定的分级,逐渐将全部古籍,数字影像/图像化。这不是技术问题,也不是财力问题,而是观念问题。许多古籍被认为价值不大,其实可能是不方便利用,以前无人利用才没有显示出其价值。古籍是越为人知晓,越为人所用,其价值才越大的;不用就无用。
古籍文字字符化的关键是足够大的字符集的研制、管理。我国历史上出现过的汉字字符,有人说8万多,有人说大约在12万,还有人说要达到15万~16万,还没有一个确数;[6]比较确实的是中华书局和中国友谊出版公司出版的《中华字海》收字85568个。但不管如何,一定比我们的现行标准字符集要多不少。现在国际标准的汉字字汇和我国的GB18030已经扩充至70195个汉字[7],“国际标准超大字符集字体支持包5.4”已经可以支持75000个汉字,方正超大字库解决方案也可以支持7万多汉字。[8][9]大字符集的研制和使用,是耗费十分巨大的工程。现在的汉字编码空间可以达到150万,是足够的。可以考虑在已有标准系统之上增加不同频度的分级字库,并可动态管理:一方面可以向字符集中添加经过审查的新的字符,另一方面是能够向使用者动态传递非系统字符以及使用环境。
古籍大字符集研制的难点在于要真实反映古籍中的文字实态。这是一个在统一框架下逐渐完备的过程,需要统一工具(字符制作及管理软件)分布制作、集中审核、共享使用,还需要提供有效查询和比对,避免重复与混乱。(比如可以上传未确定的文字图像到字符管理中心,经过比对确实属于字符库中未有的字符后,分发到有资格进行字符制作的节点进行制作,经过审查再加入字符库,同时发布到OCR图文集和校对字符集中……)
在解决足够大字符集策略 (而非完整的大字符集)之后,便可以进行由图像向字符的转换。(可以通过必要的技术协议,充分利用已有的字符资源。)基本的程序是,可以先用OCR系统识别大部分,作为一个基础,再将原图像和OCR的结果同时发布在网络上,再进行网络化的有序的人工审校。这是巨大的工程,可以借鉴一些开放式百科网站的全球(网络)协作模式,加强审校管理。
这个过程与字符集的研制与管理,是交叉、双向的。
让操作系统支持能够满足古籍需要的超级大字库,是不现实的。只能采用“外挂”形式,而让每个有古籍需求的系统都安装超级大字库,成本也是相当高的。可以在不同的古籍信息传输单元内包含环境信息,在需要时将所需要的字符等资源传递过去,并后台调整终端的系统状态。
有关满足古籍需要的字符集的研制、管理与使用,古籍文字校对,都以网络环境为基础,进行网络化的处理。
(三)古籍内容的网络化整理
有了前两项工程的基础,古籍的微观整理和一些高级的宏观整理,便可利用网络进行。
网络中有了总体的目录、版本信息,有了原态转录的古籍图文影像/图像,有了经过字符化的原态古籍文字,可以查到同种古籍的不同版本,可以查到可引证的其他古籍,有各种工具书,便具备了校勘、标点等的条件。(工具书数字化是古籍整理的辅助工程,其中有些工具书本身就是古籍。)
可以通过一定的程序,选择底本,列出所有参校本、参考本、相关资料,再通过一定的程序确定初始整理者,后续整理者(完善者),再通过一定的程序确定审订者,同时通过技术手段自动记录校勘、标点过程,保存经过审核的有价值的不同意见,开放评论……,通过严格的权限管理,便可以网络环境下进行古籍的校勘、点校等工作。
当然,这需要相应的程序和管理支持。最关键的是古籍整理者的观念要转变,要有团队协作精神,在网络化整理方式下,一个项目不会是一个人从头做到尾的,整理工作可以根据不同的策略进行分解,而系统会将每个有贡献者忠实地记录在案。(可以匿名或者笔名,但后台注册是实名。)
可以对校勘、标点的古籍进行质量分级管理,对不同级别可以进行不同的操作。比如经过校勘、标点的古籍在通过最高级别的严格审订后,可以被视为“标准版本”(第一届和第二届“中国古籍数字化国际学术研讨会”提出了“古籍电子定本工程”概念)[10],虽然依然永久地处于不断优化之中,但可开放全部功能,提供给公众进行全面利用。
而过去进行的辑佚、分类汇集等等比较高级的古籍整理,只需通过网络预先申请关键词,通过审核后,整理者通过专用界面在古籍内容相应的地方进行关键词标注等操作就行了,而无需实际另行抄录。使用者需要某类资料,比如有关“徽州”的内容,只需简单地在关键词列表中查到“徽州”一词进行点击,而且可以进行条件精确限定,便能准确找到需要的资料。如果没有某关键词,可以进行申请,发布消息让全网络进行标注。在使用过程如果发现标注不当,可以通过一定的程序进行纠正。
整理者越多,使用者越多,被发掘出来的信息就越多,最终的质量就会越高。
统而言之,可以按照统一的规范,在互联网上建立古籍整理网络。对于古籍的一切整理活动,都可以在这个网络中通过一定的规程进行。这个网络有全面开放的前台界面和严格的后台管理。前台界面是人与古籍信息、古籍打交道,后台管理是对人和古籍及其相关信息进行管理,管理依据统一的规范和协议。人的行为有旁观,有议论或评论,有各级整理操作,有后台处理……而信息有:完善的古籍目录著录信息,有古籍图文的数字化影像/图像,有字符化的古籍原始文字,有处于正在校勘、标点过程中的古籍内容,有让大家审查的点校成果,有通过审查的古籍标准版本,有各种整理操作规程,有整理需要用到各种辅助资源,有各环节处理的历史信息……
将过去已经整理的古籍,重新发布到网络上,在这基础上进行网络化的完善。可以将过去的古籍整理成果纳入网络化的古籍整理体系之中。
(四)网络化的古籍出版
从上文我们可以发现,古籍的网络化整理,同时又是网络化的古籍出版。
具体来讲,涉及出版的有:总体的目录(相当于目录与版本著作),原始图文数字化影像/图像(相当于影印本),原始文字字符化文档(相当于原样排印本),经过审订的“标准”文档(相当于点校本),各种动态查询、筛选(相当于分类索引),各种关键词标注(相当于汇辑),各环节历史记录(相当于汇校汇评)……
发布到网络上的古籍,在前端的页面呈现方式上,与传统的纸质书的页面有许多不同的地方,比如它可以进行“超级连接”,可以折叠、浮现、缩放等等动态化处理等等。与传统出版相比有一个最大的不同是它还多出了个“后台”状态,也就是在计算机及网络的内部的状态。除了前面提到的它是电子/数字化的之外,其内部结构和相互关系,可以是十分复杂的,是由程序(计算机命令)控制的。而程序是由人预先编制,并可以提供界面由人进行操作的,由此可以实现传统纸质呈现方式根本无法拥有的功能,并且,在前端显示于一屏的内容,也许来自相距十万八千里的不同地方。还有许许多多的新特点,而最根本的是,网络状态下它既是“定”的又是“活”的,可以按一定的规则“成长”的,而传统的纸本是“死”的。
网络化的古籍整理过程,实际上也就是网络化的古籍出版过程。由于网络化的古籍整理是动态的、积累性的,网络化的古籍出版,也同样是动态的、积累性的。
(五)云计算与古籍整理、出版的网络化
古籍目录及版本等基本信息与海量的图文内容的数字化之间如何连接起来?数字化的图文与对它们的操作如何管理?所需要的各种软件如何配备?等等,这些都是网络构架的策略问题。这个问题也就是古籍的网络化整理在技术上如何实现的问题。
近年来的计算机网络及计算(处理)服务的概念中有个热词叫做“云计算”。[11]云计算的技术细节我们并不需要知道,我们只要知道它几乎可以无所不能地满足我们的任何存储、计算(处理)要求就够了。用云计算平台解决古籍数字化的巨量信息的存储与管理,整理过程以及整理后的利用所需要的巨量的计算(处理)能力,通用及专用软件的开发,全球访问所要求的无缝、无碍接入等等,几乎是唯一的最佳选择。我国的云计算从2008年开始迅猛发展,完全可以轻松满足古籍整理与出版网络化的各种需求。
在上文讨论普查信息登记、大字符集、关键词标注等问题时的策略等,也已经体现了云计算的一些思想。为大家津津乐道的一些数字化古籍文本的具体利用,像全文/全库搜索、模糊查询、频度统计等等,对于云计算,不过是十分基本的处理事务。
云计算只涉及深层的网络构架、技术应用策略等等问题,整理者只需要提出问题和要求,其余让技术人员在后台实现,并不需要改变终端个人的电脑使用方式。这是十分重要的。在云计算支持下的古籍网络化整理,整理者、使用者个人改变的只是整体的策略观念,而非具体的技术操作。对古籍整理而言,技术上也只是已有技术在新的策略下的重新组合而已。
现有古籍数字化下开发的技术,几乎无一例外地可以移植到古籍网络化整理与出版概念下,已有的资源可以得到最大限度地利用。
结语
计算机的最大特点是功能强大,计算机网络的最大特点是“网”,它的节点是分布式的又是相互联系的,而且是开放的,可以将全球各个角落的力量汇集起来。对于利用它进行古籍整理而言,可以说只有我们想不到的事,而没有它做不到的事。但是,每一个通过这张网参与古籍整理的人,如果各行其是,带来的将是一片空前的混乱而不是我们期望的空前的好处,甚至根本无法进行。在网络的背后需要强大的、权威的组织者、管理者,需要共同的理念,需要强大的技术支持,需要专家团队起中坚作用。所有人都需要遵守统一的标准和约定,对参与者,对古籍本身,对整理过程及其各阶段结果,都要有科学、严格的分级管理。而标准的制定,各项技术指标的开发也将是十分复杂的事情。同时,通过网络方式整理的古籍,它是“活”的,是成长的,随着时间的增加,对其修正、优化就越多,它就越完善。
通过网络进行古籍整理,相关信息空前公开,管理空前透明,可以消灭重复劳动,可以杜绝粗制滥造、越整理越乱的现象,网络环境中的大量协同使整理的速度会是空前快的,整理可以最大程度社会化、由小众的书斋进入大众的视野,可以充分地吸取其他专业的智慧与知识,整理成果可以不断完善,可以真正为公众使用而发挥更多更大的作用……。
古籍是全社会、全人类的共同财富,对其进行整理与出版应该是公益的。任何公益的事业,都是全社会的,任何全社会的事业,都应该是由政府或者其他能够代表公众意愿的组织进行组织、管理而让全社会参与和监督的。古籍整理和出版的网络化,应该由国家组织实施。国家对于古籍整理的规划和管理,将更加有效。由于很大程度上利用了公共资源而非专门资源,使得总体成本将大幅减少。社会公众参与度增加,全社会对我国传统文化的认识也必将大大深化。[12]
本文只是提出“古籍的网络化整理和出版”的概念,从大的框架、策略方面提出古籍网络化整理很粗略的设想,许多方面只是点到即止,其中已经及应该涉及的任何方面,都是十分复杂的课题,需要多方探讨,不是短时间之内能够完全实现的。但是,笔者坚信,这是一个必然的发展方向,而且现在就可以开始进行。
[1]耿元骊.三十年来中国古籍数字化研究综述 (1979-2009)[OL].[2009-08-18].http:∥www.guoxue.com/ wk/000652.htm.
[2]陈力.中国古籍数字化的现状与展望(上)[J].古籍整理出版情况简报,2004(4);中国古籍数字化的现状与展望(下)[J].古籍整理出版情况简报,2004(5).
[3]蓝永.论古籍整理的新方式[D].山东大学,2007.
[4]国学网.第二届中国古籍数字化国际学术研讨会隆重开幕[EB].[2009-8-18].http:∥www.guoxue.com/zt/gjszh02/.
[5]中国国家古籍保护中心.“全国古籍普查平台”使用说明(试用本)[N/OL].[2010-05-25].http:∥www.nlc.gov.cn/ service/others/gujibhw/download/gjpc-11.pdf.
[6]daofu.方正宋体S-超大字符集的使用问题[EB/OL].[2011-3-25].http:∥www.pkucn.com/viewthread.php?tid=267029.
[7]代红.我国汉字编码标准的发展过程 [J].中国标准化,2008(7).[2008-12-9].http:∥www.cesi.ac.cn/cesi/fuwu/ hangyedongtai/2008/1229/4366.html.
[8]汉典网.如何显示和输入七万多汉字?[OB/OL].[2009-03-15].http:∥www.zdic.net/appendix/f18.htm.
[9]北大方正电子有限公司.方正超大字库解决方案 [OB/ OL].[2009-05-11].http:∥www.foundertype.com/index/ oldbooks.html.
[10]杨琳.理想电子古籍的标准[J/OL].中国典籍与文化,2009(4).[2009-08-18].http:∥www.guoxue.com/ wk/000649.htm.
[11]Michael Mille.云计算[M].姜进磊,孙瑞志,向勇,史美林,译.北京:机械工业出版社,2009.
[12]王立清,魏瑞敏.我国古籍数字化建设国家控制与管理政策探讨 [J/OL].情报资料工作,2009(2).[2009-08-18].http:∥www.guoxue.com/wk/000653.htm.
Z121
A
2095-0683(2011)04-0022-06
2011-06-27
徐力(1964-),男,四川渠县人,海天出版社重大项目组副编审。
责任编校 秋晨