《中国大百科全书》纸质版与网络版关系探讨
2022-04-14闫运利
摘要:随着互联网、人工智能等新技术的发展,网络版百科全书因内容丰富、检索方便、更新迅速等特点,越来越成为人们查询信息、检索资料的新选择。《中国大百科全书》纸质版在古代专名中倾向使用繁体字,但网络版若不考虑读者用字习惯及用户使用情况直接选用繁体字,可能影响条目检索功能的实现,导致一些条目失效。文章认为,从纸质版到网络版,文字载体形态发生了根本性变化。《中国大百科全书》网络版应在科学性、正确性的前提下,酌情考虑使用通行的简化字,以便用户高效地检索和使用。同时也要不断改进和完善检索方式,以适应不同字体条目检索的需要。
关键词:《中国大百科全书》;纸质版;网络版;繁简字;条目检索
中图分类号:G230.7 文献标志码:A 文章编号:1674-8883(2022)02-0191-03
一、引言
百科全书扼要概述人类知识和历史,并着重反映现代科学文化领域的新成就,被称为“人类的知识宝库”“工具书之王”和“没有围墙的大学”。中国大百科全书出版社自1978年成立之日起,便专注于《中国大百科全书》的编纂出版。从1978年至1993年,历时15载,按学科或领域分卷,出版了《中国大百科全书》(74卷)第一版,结束中国没有百科全书的历史;1995年至2009年,又历时14载,按条目汉语拼音顺序统编排列,出版《中国大百科全书》(32卷)第二版,真正实现与国际接轨。
2011年,《中国大百科全书》第三版由国务院立项,并明确要求“通过建立数字化编纂平台,编纂发布和出版网络版、纸质版”;2014年,项目正式启动,并于2021年7月发布首批条目,包括网络版中文条目约21万个、中国主题英文条目1000个、纸质版3卷,其余条目和卷次也将陆续编纂发布和出版。
《中国大百科全书》从单一、传统的纸质版发展到新型的网络版,可谓中国百科全书编纂史上一个重大的历史转折。新时代、新征程,也面临着许多新问题、新挑战。比如,《中国大百科全书》纸质版和网络版之间到底是什么样的关系?我们该如何妥善处理二者之间的关系?文章认为,《中国大百科全书》从纸质版发展到网络版,文字载体形态已经发生根本性变化,应该具体问题具体分析,对纸质版、网络版予以区别对待,因此以繁简字的选用为例展开具体分析。
如条目“高適”,《中国大百科全书》第一版、第二版的纸质版多选用繁体字,但如果《中国大百科全书》第三版的网络版仍沿用繁体字,可能会出现一些问题。检索输入“高适”,网络版根本检索不到这一条目;而检索输入“高適”,网络版才出现“中国唐代诗人”等相关内容。又分别选取“胡适(胡適)”“西昆体(西崑体)”“曾几(曾幾)”“晏几道(晏幾道)”等条目进行检索,结果出现了同样的问题,即“西昆体”“曾几”“晏几道”等简体条目检索不到,而输入相应的繁体便能检索出来。
可见,在网络版中,繁体字的选用已经影响到条目的有效检索,甚至导致有些条目失效。而条目检索功能的退化和失效条目的存在不但无法发挥其公共知识服务平台的价值,而且在一定程度上会降低《中国大百科全书》的公信力和可信度。基于此,文章从《中国大百科全书》纸质版选用繁体字的历史背景和《中國大百科全书》网络版选用简化字的现实条件两个方面进行深入分析。
二、《中国大百科全书》纸质版选用繁体字的历史背景
《中国大百科全书》第一版、第二版的纸质版在古代专名中选用繁体字,具有一定的历史背景。比如关于“高適”与“高适”。王力《古汉语常用字字典》共收录两个“适”字:①适(適),有三个读音,分别为shì(往,到……去;女子出嫁;适合,适宜;刚才,刚刚;正巧,恰好)、dí(专主,作主;嫡,与“庶”相对)、zhé(哲,责备、惩罚,引申为被流放或贬职),并在最后特意注明——在古代,“适”和“適”是两个字,意义各不相同。上述义项都不写作“适”。现“適”简化为“适”[1]。②适,kuò,疾速,多用于人名[1]。如《论语·宪问》中有“南宫适”,唐代有唐德宗“李适”,宋代有“洪适”。由此可知,“適”和“适”在古代确实是两个不同的字,因为现代文字规范及汉字简化的需要,“適”简化为“适”,简化后的“适”和古代的“适”统一成了今天的简化字“适”。那在人名中出现这类繁体字,并且繁简不完全对称的情况一般如何处理呢?
2000年通过的《中华人民共和国国家通用语言文字法》第17条作出如下规定:
有下列情形的,可以保留或使用繁体字、异体字:(一)文物古迹;(二)姓氏中的异体字;(三)书法、篆刻等艺术作品;(四)题词和招牌的手书字;(五)出版、教学、研究中需要使用的;(六)经国务院有关部门批准的特殊情况[2]。
由此可见,在姓氏中是可以保留繁体字、异体字的。中国出版工作者协会校对研究委员会编写的《关于校对工作的两个建议》中根据实际情况,也放宽了对两点的限制:
一是引用古籍的文字,尽可能使用简化字和通用字,但个别容易引起歧义的字仍可使用异体字;二是该《整理表》中原只限于姓氏使用异体字,用在名字中也不计错。如镕、淼、榘、邨、珮等[3]。
可见在名字中也可以保留异体字。
《辞海》网络版在其《凡例》中也有规定:人名、地名等一般用简化字。简化字意义不明确的,适当保留原来的繁体字或异体字,如“高適”(人名)的“適”不作“适”,“王濬”(人名)的“濬”不作“浚”,“南壄”(地名)的“壄”不作“野”。也就是说,人名或地名中的繁体字是否采用简化字,只需要看使用过程中是否会引起误解。“适”同时读作shì和kuò,且kuò又多用于人名,所以为避免误解,《辞海》网络版收录时采用了“高適”和“胡適”等繁体,显然这两处“適”都读作shì。可能受此影响,之后的《唐诗鉴赏辞典》(上海辞书出版社,2004)、《唐诗大辞典》(凤凰出版社,2003)等工具书均收录“高適”,而无“高适”。这些辞典的《凡例》中也作出了类似解释:本书使用简化字,在可能产生歧义时,酌用繁体字或异体字。这一解释与上述《辞海》网络版《凡例》的规定如出一辙。
1985年出版的《中国大百科全书出版社编辑出版条例汇编》中“《中国大百科全书》编写体例”和“《中国大百科全书》编写体例的补充规定”部分对繁简字作了如下规定:
14-2 需要保留的繁体字或异体字,用不同色笔加醒目的方框注明,如魏徵,以免排校错误。用简体字易生误会者,请用括号注音表示,如赵汝适(kuo),不是“適”字的简体字[4]。
12-1 繁体字应用范围,中国古代人名在下述情况下不用简体字。①两个(或两个以上)汉字因精简汉字数目合并成一个,另一个仍可使用的,如“凌濛初”不用“凌蒙初”。②简化后,字形变化过大,易使熟悉的人名变成不易辨认的人名,如“朱簾秀”不用“朱帘秀”,“洪昇”不用“洪升”。按规定简体与繁体同时并用的字,更不能以简代繁。如“魏徵”不能用“魏征”,“萧统”不作“肖统”,“萧三”不作“肖三”。外国人习用的译名如“萧伯纳”不作“肖伯纳”。
12-3 引用中国古籍原则上用简体字,易引起误会的字例外。
12-4 《繁体字和简体字对照表》中的繁体字应以1936年版《辞海》所用者为准[4]。
基于以上原则,《中国大百科全书》第一版、第二版的纸质版基本上采用“高適”等繁体字,以免发生歧义或引起误會。由此看来,《中国大百科全书》作为综合性大型工具书,第一版、第二版的纸质版在人名中采用“高適”等繁体字,符合国家及出版行业的相关规定及《中国大百科全书》的传统编写体例;同时又有权威工具书作示范,是有据可依的。“曾几(曾幾)”“晏几道(晏幾道)”等条目与之情况基本类似,在此不再赘述。
三、《中国大百科全书》网络版选用简化字的现实条件
与上述情况不同的是,从目前现实使用和通行程度看,“高适”“胡适”等简化字使用的频率更高。尤其是在如今的互联网时代,读者更多是在网上检索。
如在中国知网上检索篇名中含“高适”二字的论文约336篇(截至2022年2月),用“高適”的只有4篇。即便是《北京大学学报(人文科学)》刊发的文章《論高适和岑参的詩——〈高岑诗选〉前言》,全篇使用繁体字,但“高适”仍选用简化字[5]。
以同样的方法检索“胡适”“晏几道”,用“胡適”“晏幾道”的只有1篇,可见中国文学专业研究领域基本上已经使用简化字“高适”“胡适”“晏几道”等。而且现在从中小学语文课本到大学生《中国文学史》教材,基本都采用“高适”“胡适”“晏几道”等,而非“高適”“胡適”“晏幾道”等。这也在一定程度上造成出版物中“高適”与“高适”使用的极度混乱。因此有学者提出,“适”本来就是“適”的简化字,而且读kuò音的“适”相对来说比较少见,因此完全可以与读shì音的“适”以同形字的方式处理,另外再括注拼音以示区别,而不必将常见的简化字硬用繁体字代替,导致人为的混乱[6]。并且最新的《通用规范汉字字典》只提到人名中“锺”和“頫”怎么处理,而没有提到“適”等字用作人名时怎么处理。
因此,随着文字规范要求的日益严格和读者用字习惯的日趋简化,一些工具书也越来越多地使用简化字,如“晏几道”,《宋词鉴赏辞典》[7]《宋词大辞典》[8]《唐宋词鉴赏辞典》[9]中均使用简化字“晏几道”,而非“晏幾道”。
由上述可知,《辞海》等辞典类工具书及《中国大百科全书》第一版、第二版的纸质版中多选用“高適”等繁体字,而中学课本、大学教材及中国文学专业研究领域基本都选用“高适”等简化字。因此,《中国大百科全书》纸质版中可选用“高適”等繁体字,以坚守百科全书编纂的权威性和准确性;《中国大百科全书》网络版中宜选用“高适”等简化字,以充分发挥网络版检索功能的价值,同时在保证正确性的前提下照顾到读者的用字习惯,适应新时代读者的需要。
再者,《中国大百科全书》网络版是融媒体时代的新型百科全书,在检索方式、检索渠道上与纸质版有一些不同。纸质版具有完备的检索系统,如音序检索、笔画检索、分类检索、外文检索和主题检索等检索渠道,笔画检索还附有《繁体字和简化字对照表》。而网络版除了条目释文中设置的超级链接外,更多地依靠输入条目标题进行检索,所谓“知而后检”,只有读者知道了这个条目,才能有效、快速地检索。况且纸质版可完全用肉眼看到,即使用繁体字也可以检索到;而网络版以供读者寻检、查阅为主,比较依赖检索,如果读者使用常用的“高适”“胡适”等简化字去检索,根本检索不出来。读者、用户的使用体验不佳,势必会影响网络版《中国大百科全书》的推广。
简而言之,《中国大百科全书》从纸质版发展到网络版,其文字载体形态已经发生了根本性变化,我们也应该具体问题具体分析,对纸质版、网络版予以区别对待。
由上述内容可以发现另一个问题,即《中国大百科全书》网络版的检索功能至关重要,检索方式的单一化会直接影响读者的使用效率。倘若有些条目标题不得不使用繁体字,又该如何解决其检索问题呢?我们需要做的就是尽所能地提高和优化检索技术,增加和改进检索的渠道和方式,如检索入口可以设置字顺检索、主题词检索以及繁简字通用的检索方式等,以实现繁简同时检索。这一检索方法已广泛应用于各种文献检索平台和数据库,如中国知网和中华经典古籍库。在中国知网检索栏选择“篇名”,输入“高适”二字,题目中出现“高适”“高適”的文章都能检索出来。再如中华书局的中华经典古籍库,无论输入的是简化字还是繁体字,都可以检索出相关内容,比如输入简化字“有间有合”,检索结果中会同时出现“有間有合”“有閒有合”等多种相关的繁体形式。
四、结语
在互联网、人工智能等新技术的推动下,出版行业正在发生着前所未有的大变革,知识生产传播的内容与形式都在发生剧烈变化。网络版百科全书由于同时具备工具书的查考性、易检性、知识性、权威性,以及内容呈现更丰富、检索使用更方便、数据更新更迅速等特点,越来越成为人们查询信息、检索资料、获取知识的新选择。
《中国大百科全书》网络版,以建成新时代基于数字化技术的国家大型公共知识传播和服务平台为定位,应该更注重其权威性、准确性与规范性,同时在此前提下也要兼顾其普及性和通用性。这是由网络出版的特点和《中国大百科全书》网络版的定位决定的。因此,网络版百科全书(尤其是条目标题)应在科学性、正确性的前提下,酌情考虑使用简化字,以便读者高效地检索和使用。同时也要不断改进和完善自身检索方式,以适应不同字体检索的需要。
参考文献:
[1] 王力.古汉语常用字字典[M].北京:商务印书馆,2012:350,222.
[2] 黎洪波,利来友.图书编辑校对实用手册[M].桂林:广西师范大学出版社,2016:164.
[3] 河南省新闻出版局.出版物编校手册[M].郑州:河南人民出版社,1999:79.
[4] 《中国大百科全书》编辑部.中国大百科全书出版社编辑出版条例汇编[M].北京:中国大百科全书出版社,1985:23,36.
[5] 孙钦善,武青山,陈铁民,等.論高适和岑参的詩:《高岑诗选》前言[J].北京大学学报(人文科学),1963(5):75-87,40.
[6] 王剑.《辞海》中的“高適”与“胡適”[J].中国典籍与文化,2008(1):39.
[7] 夏承焘,等.宋词鉴赏辞典[M].上海:上海辞书出版社,2003:241.
[8] 王兆鹏,刘尊明.宋词大辞典[M].南京:凤凰出版社,2003:540.
[9] 唐圭璋,等.唐宋词鉴赏辞典[M].上海:上海辞书出版社,2011:512.
作者简介 闫运利,博士,编辑,研究方向:中国古代文学与百科全书编纂。