中国近代工具书网络再版的价值与思路
2011-08-15于翠玲
于翠玲
(北京师范大学文学院,北京100875)
本文所说的中国近代工具书不同于中国传统的工具书,特指在晚清民国时期受到西学知识体系影响而编辑出版的新式工具书,包括专科辞书、百科全书、新式书目、年鉴等类型。这些工具书最初由传教士或海外留学生翻译引入中国,后来由中国学者及出版机构自行编辑出版,反映了当时社会西学东渐的文化思潮,也构成了中西知识交汇的桥梁。在当今媒介信息数字化、全球化的时代,这些工具书作为中西文化交流史的重要资料,再次引起了海内外多学科学者的关注,成为人们竞相搜集、整理、引用和研讨的对象。与此同时,伴随着数字出版技术的发展,中国工具书网络出版平台亟需囊括和开发多种多样的工具书资源。遗憾的是,技术开发公司对学术界的需求不甚了解,而学术界自行建设的专题数据库不仅规模有限且不能惠及广大受众。由于这是一个实用性的工具书数据库开发问题,出版界、学术界都没有给予特别关注。鉴于此,本文试图结合目前学术界的研究动态,论述利用工具书网络出版平台将中国近代编辑出版的工具书再版的学术价值和开发思路,为数字化出版创新提供参考。
一、中国近代工具书受到海内外多学科学者的关注
中国近代是社会转型的特殊时期,近代出版的各种新式工具书在当时就被看作考察“社会学术之消长”的一种尺度。1978年改革开放以来,伴随着中西文化交流的日益频繁、海外汉学的迅速发展,近代出版的新式辞书(包括双语辞书、专科词典)、百科全书由于翻译引入了大量新语词(新概念、新术语、外来词),不仅成为诸多学科温故知新的重要学术资源,也成为海内外学者对话的平台和多学科关注的热点。例如,2006年武汉大学举办了历史文化语义学国际学术研讨会,与会学者分析了民主、文明、科学、哲学、世界观等近代概念“在中西转换、对接中产生的各种纷繁复杂的现象及其所包含的丰富的历史文化内涵”。[1]2007年北京大学比较文学与文化研究所与日本的国际日本文化研究中心联合主办了“文化的往还——东亚近代诸概念的生成与发展”国际学术研讨会,日本与会学者介绍了“日本语汇研究文献数据库”——以研究19世纪中期以后在日本形成的新式词汇、概念和语义的文献为调查对象,其中也收录了中国学者关于近代来自日本的新语词、中日语词交流的研究成果。近年来,有关中国近代新语词、新概念、新观念、关键词进行追根溯源的研究已经有不少成果发表,更为凸显了学术界对近代工具书资源的检索需求。例如,已经有学者建立了“中国近代思想史研究专业数据库(1830—1930)”,以数据库方法研究中国近代观念的起源和演变,其中提到1918年周起予所编《新名词训纂》列举了当时流行的近800个新名词,有助于从中国接受新名词的机制上重新探讨日译西方观念对中国所起的作用。[2]
然而,中国近代出版的图书文献除少数已再版,大部分散落在全国各图书馆,其中有的由于纸张质量、印刷装订等原因不易长期保存。[3]新式辞书、百科全书等在高校图书馆竟成了稀缺资源。钟少华曾历数自己收集的清末百科辞书42部、民国百科辞书100部,年代涵盖自1855年至1949年,提出“重印有重大价值工具书,是中华现代学术建设的基本组成部分”[4]。他所开列的近代百科全书目录[5]近年来引起了海外汉学家的关注,德国学者瓦格纳自述“经多方努力,我们已拷贝到其中的一些复本,可供参与此项研究的学者使用”,“借由目前使用的技术手段:搜索目录卡片、在线图书馆目录以及二手书店,只能建立起一个可能非常有用、但却依然初步的数据库”;捷克学者米列娜强调黄人在1911年编辑的《普通百科新大词典》具有“中西文化之桥”的价值,并感叹“这些著作已经从公众视野中消失了近一个世纪,几乎没有留下痕迹”,而“随着现在开始的对早期工具书以及那个时期其他材料的发掘,我们了解到,20世纪初期的中国学者和他们的西方同事们,为使中国更好地理解西方科学、技术、现代医学以及药理学,一起做了大量而深入的工作”。[6]目前已经有大陆出版社开始关注有价值的近现代工具书,2008年在澳门举办的马礼逊与中西文化交流国际学术研讨会上,大象出版社就发布了其出版的《马礼逊文集》(其中包括中外第一部英汉双语字典《华英字典》)。
面对国内外学者对中国近代工具书的实际需求,中国的工具书在线平台如能快速跟进,收录有价值的近代出版的工具书,不仅可以节省印刷出版的成本,实现数字化再版与保存的功能,还可以为学者提供更为多样的检索途径,从而充分体现工具书网络出版的理念和知识总库的学术价值。
二、中国近代工具书将成为工具书在线平台不可或缺的内容资源
中国知网以“集锦”思路建立的工具书平台,主要收录当代出版的、从出版社购买了版权的工具书,据说目前已近5 000册。这一平台近来更名为“中国工具书网络出版总库”(以下简称“工具书总库”)。这是一个宏观的有创意的理念,一方面强调了网络出版的特征(印刷版本工具书数字化应该被视为一种再出版工程),一方面突出了“总库”的规模和潜在的发展空间(应该建设由不同的数据库聚合而成的知识体系)。然而,由于工具书的版权及质量等方面的原因,“总库”收录数量的多少只能是相对而言的,其工具书在类型、知识内容、时代年限、版本等方面还不够完备。
我们不妨先将中国的工具书分为古代、近代(晚清民国)和当代三部分,考察一下目前工具书数字化的整体情况。一些具有广义工具书性质的古籍丛书、总集——全唐诗、全宋词、二十五史、十三经注疏、四库全书、“十通”、四部丛刊等,已经分别开发了电子数据库。此外,还有“中国基本古籍库”、“国学宝典”、《古今图书集成》等文献数据库。这些数据库都具有全文检索功能,主要为科研部门和高校的古籍研究者所使用。
在古籍数据库已经比较完备的情况下,近代各种类型的文献资料的数字化(工具书化)已经提上了日程。商务印书馆的“工具书在线”平台收录了《东方杂志》,并建立了一个专门主页来介绍《东方杂志》(1904—1948)的内容、栏目等,提供多种检索方式和按需印刷。上海世纪出版集团易文网的“工具书在线”频道上传了“《中央日报》(1928—1949)标题索引”的网络版、《点石斋画报》等资源。中国知网《中国年鉴全文数据库》回溯了部分民国时期的年鉴。方正阿帕比公司在2008年推出了“中国工具书资源全文数据库”1.1版,据说精选收录国内各大出版社出版的精品工具书资源2 000余种;其数据库平台还单独列出了“民国期刊”专栏,收录了《精神》《新潮》等杂志。但上述工具书在线平台目前还没有收录近代的工具书。此外,有关近代期刊的数据库已经问世,《大成老旧刊全文数据库》收录了从清末到1949年近80年间中国出版的6 000余种期刊,共12余万期,130余万篇文章。
目前,汇集古代和近代文献资源综合开发的数据库系统已问世,如北京时代瀚堂科技有限公司的《瀚堂典藏数据库系统》,在先期开发的“小学数据库”、“类书集成库”等多种古籍数据库的基础上,最近推出了《近代报刊》数据库。《近代报刊》数据库汇集了近300种清末至民初的报纸和刊物,其中包括香港的《遐迩贯珍》、天津的《北洋画报》、上海的《申报》等著名报刊,不仅为研究中国近代报刊编辑出版史及近代社会发展史提供了丰富资料,也使原有的数据库系统具有了古今贯通、文献集成的特征。
中国近代工具书是西学东渐的产物,其编辑体例、类型以及知识内容都与中国古代工具书不同,却与当代出版的工具书有着衔接关系。例如,新中国成立后出版的新《辞源》和新《辞海》就是在近代出版的旧《辞源》(1915)和旧《辞海》(1936)的基础上修订的。近现代出版的专科辞书、百科辞书、年鉴、新式书目等,都具有重要的史料价值。既然近代报刊、年鉴等文献可以数字化,进入在线平台,近代专科辞书、百科辞书、新式书目等类型工具书的数字化也应是水到渠成的事。例如,商务印书馆具有100多年的历史,1949年之前的出版物共1.5万余种,新式工具书是其重要的品牌资源,完全有条件通过按需印刷将有价值的近代工具书再版,或选择有代表性的近代工具书进入在线平台。中国知网作为规模较大的知识门户,致力于将各种知识依据知识体系建立连接,形成完善的知识网络,也完全有能力通过图书、年鉴、报刊等数据库收录更多的近代文献资源;其“工具书总库”更具有收录和网络再版近代工具书的技术优势。可以断定,一旦认识到位,现多家在线平台必将争相整合近代文献资源(包括工具书),以拓展发展空间。
三、整合编辑:中国近代工具书网络再版的思路
工具书在线平台具有整合编辑的强大功能,不仅可以为一般读者提供大众化的检索服务,也能够整合多学科的、历时性的文献资源,形成纵横交叉的知识网络,满足学者个性化检索的需求。因而,基于在线平台来编辑和再版近代工具书,其知识价值以及传播范围都会远远超过印刷版本,还具有在海内外研究机构和图书馆在线推广的价值。近代工具书大致可以分为语文性(字典、词典)、检索性(图书、报纸、期刊目录)、参考性(百科全书、年鉴等)3类。本文仅针对目前数字化资源的情况以及学术研究的需求,提出整合开发近现代工具书、编辑专题工具书库的思路。
1.整合语文辞书资源,编辑语文辞书库
中国古代的字书从《说文解字》《尔雅》《类篇》到《康熙字典》等数字化版本,已经被《瀚堂典藏数据库系统》中“小学数据库”聚合在一起,这种编辑体例是值得借鉴的。目前阿帕比“中国工具书资源全文数据库”已经收录了《汉语大词典》和《辞海》(1999),如果再添加1915年中华书局版《中华大字典》(1978年有影本)等辞书,就可以形成历时性的系列了。商务印书馆“工具书在线”平台曾经上传新《辞源》(收词止于1848年),但1915年版的旧《辞源》作为第一部用现代方法编纂的以语词为主、兼收百科常识的综合性词典,收录了大量近代出现的新语词,这又是新《辞源》所删去的部分。这新旧两个版本如果能够链接起来,可以对同一词目进行历时性检索和比较。例如,检索“博物”一词,新《辞源》中仅列出古籍中的意思,旧《辞源》则介绍了从西方传入的“博物学(natural history)”概念。
2.整合中国近代百科辞书资源,编辑百科辞书库
中国学者在近代引入了西方百科全书的概念,翻译或编纂了多种百科辞书和专科辞书。其中近年来为学者关注较多的有《新尔雅》(1903)、《普通百科新大词典》(1911)、《日用百科全书》(1919)以及《博物大词典》(1907)、《植物学大辞典》(1918)等。
目前中国知网“工具书总库”收录了改革开放后出版的《中国大百科全书》以及多种百科性、专科性辞书,如果再收录近代有代表性的百科、专科辞书,则可以为学者研究近代引进的西学分科概念和诸多新术语提供重要史料。例如,检索“博物”这一词目,现在“工具书总库”可以同时列出多种当代工具书的解释,平面展现多学科的词条;如果利用其功能独特的“概念知识元库”,添加出自近代百科辞书的条目(如1907版《博物大词典》所谓“本书举植物动物矿物生理四科之学语及事项一一加以注释”的体例,反映了来自西学的博物知识),就可以自动形成历时性的概念库了。比如《日用百科全书》(1919)兼有传统类书性质,汇集了中西文化知识和大量新学科、新事物的资料,如同万花筒一般反映了民国初期社会文化的纷繁景观以及国民日常的生活样态,即使是一般读者随意点击,也可以从中了解近代许多新知识、新语词的来龙去脉。
3.整合中国近代书目资源,开发历代书目库
商务印书馆的“工具书在线”平台即将上线的图书包括《四库全书总目提要》,如果再收录《书目答问》(已收入《国学宝典》光盘)等古籍书目、杨家骆所编《图书年鉴》(1933)中的《新书总目提要》、北京图书馆编《民国时期总书目》,还有近现代翻译出版图书的目录(如《近代译书目》)等,就可以形成历时性的书目库,并具有目录学史的知识框架。商务印书馆正在“探索一般图书的工具书化,按照图书的类别,提取其中的知识元,作为可供检索的条目,使‘工具书在线’的内容进一步扩展,让读者能更精确、更广泛地获取知识检索服务,最终打造中国知名的图书搜索专业引擎”[7]。如果将《商务印书馆图书目录》(其中第1册收录1897—1949年的图书)和大量工具书化的近代出版物链接起来,就可以建设一个馆藏近代图书资源全文数据库了。再以中国知网平台为例,如果增加一个历代书目资源库,可以通过跨库检索,与图书、年鉴、学术期刊、学位论文等数据库中相关引文和资料组合成一个巨大的知识网络。
4.整合中国近代文献资源,形成历时性语料库
语料库是一个更大的集成性文献资源库。林穗芳先生曾提出关于编纂历时性汉语新词典的设想。[8]黄河清回应说:编纂历时性汉语新词典很有必要,前提是要有一个包容从古到今各个时期文献的电子文献库,如果有了这样一个文献库,用电脑查询,词语始见例证的寻找就会容易得多,而且还能将词目在各文献中的所有用例全部列举出来,这对于考察词语在历史上使用的实际情况及沿用的过程都是极有帮助的。[9]
目前商务印书馆已经建立的“工具书内容系统”就包括了辞书语料库,提供辞目、原始文献、标注语料、例证语料和已有辞书等多种类语料的采集功能;大百科全书出版社也建立了“百科术语数据库”。[10]而中国知网的“中国学术文献网络出版总库”是一个聚合了多种中文资源数据库、可以实现跨库检索的巨大平台。如果输入一个检索词,其结果不仅可以列出多种工具书的条目,还会列出学术期刊、重要报纸、重要会议、硕博士论文、图书等数据库中的有关篇目,还能通过“中国引文数据库”来链接更多的资料,这在一定程度上也具备了文献语料库的功能。其进一步拓展的思路应该是增加近代文献资源。例如,输入“国学”一词,应该可以检索出古代、近代和当代辞书中的词条释文,还能够链接近代出版的多种国学概论、相关刊物(《国粹学报》《国学季刊》等)、报纸文献以及引用文献等资料,展示这个语词在近代(不同于古代)的含义、用例以及形成的背景、出现的频率等信息,这种数据库资源与当今海内外学者对一个概念(观念)语词进行历时性比较研究的思路是相吻合的。
总之,中国近代编辑出版的工具书具有种类多样、体例新颖、知识丰富等特征,在当时是中西文化交汇的重要载体和桥梁,在当今对多学科的历史研究依然具有重要的资料价值。探讨中国近代工具书的编辑出版史,也是研究中国近代印刷技术发展、中西文化交汇以及知识概念形成史的一个不可忽视的视角。在数字化出版时代,工具书在线平台具有整合编辑的技术功能,近代工具书是其知识网络中不可或缺的内容资源。国家文献出版部门应了解学术界的研究动态和需求,进一步掌握近代工具书的类型、内容、版本等方面的信息,并解决版权和载体转化等问题。多家在线工具书平台也可在内容资源竞争与数据集成的过程中展现自己的实力。通过网络再版近代多种类型的工具书不仅能够保护文献资料,还可以形成强大的百科知识检索库,促进多学科融会贯通地研究中国近代学术史问题。
[1] 周甲禄.历史文化语义学系洞悉历史文化的新窗口[EB/OL].(2006-12-19)[2009-10-11].http://news.xinhuanet.com/book/2006-12/19/content_5507216.htm.
[2] 金观涛,刘青峰.中国近现代观念起源研究和数据库方法[J].史学月刊,2005(5):89.
[3] 江河.国图民国文献面临消失殆尽的危险[J].北京档案,2005(5):10.
[4] 钟少华.何乐不为[N].中华读书报,1999-08-25(家园版).
[5] 钟少华.人类知识的新工具——中日近代百科全书研究[M].北京:北京图书馆出版社,1996.
[6] 陈平原,[捷克]米列娜.近代中国的百科辞书[C].北京:北京大学出版社,2007:40,150.
[7] 刘成勇.传统出版业弄潮数字出版[N].中国知识产权报,2007-08-31(10).
[8] 林穗芳.关于编纂历时性汉语新词典的设想(上)——基于中外一些语文词典比较借鉴[J].出版科学,2004(1):12.
[9] 黄河清.应该建立一个近现代汉语电子文献库——兼作林穗芳《关于编纂历时性汉语新词典的设想》一文的回音[J].出版科学,2004(4):24.
[10] 田丽丽.中国出版集团数字旗舰起锚:从单体数据库建设到整合集团内外数字资源[N].中国图书商报,2008-04-25(6).