自主研发构建网络百科知识宝库
2021-09-15
记者|李 丽
依托于已建立的数字化出版平台和对前沿技术的实践,中国大百科全书出版社用技术“激活”知识,将打造出一个权威的网络百科知识宝库。
曾经,百科全书堪称图书业的皇冠,但随着网络百科兴起而形成的挑战,闪闪发光的皇冠逐渐黯淡,《不列颠百科全书》《拉鲁斯百科全书》等世界著名的百科全书早已停止印刷纸质版,欧洲、美洲的百科全书出版商们不再出版综合性的百科全书,纷纷转向了少儿出版、教育出版。而中国大百科全书出版社(以下简称大百科出版社),面对互联网时代的挑战与机遇,围绕百科全书内容的编纂和传播,积极探索数字化融合发展,通过技术赋能,在综合性百科全书、地方性百科全书和专业百科全书出版方面不断结出新的硕果。其开发的专业性百科全书数据库《中国军事百科全书数据库》获得了“第五届中国出版政府奖电子出版物奖”,同时,该社建设的国家重大出版工程《中国大百科全书》第三版也于7 月24 日发布了首批条目,包括网络版中文条目约21 万个、中国主题英文条目1000 个、纸质版3 卷。
大百科出版社是全国出版界中获得新媒体类国家级奖项数量最多的出版机构,自2007 年以来,该社新媒体类型的出版物已14 次获得中国出版政府奖、中华优秀出版物奖和相关提名奖。获奖作品包括:获得“首届中国出版政府奖网络出版物类提名奖”的《中国大百科全书在线版》、获得“第三届中国出版政府奖电子出版物奖”的《中国大百科全书数据库》、获“第二届中国出版政府奖音像电子网络奖”的《奥林匹克运动百科全书》、获得“第六届中华优秀出版物奖电子出版物提名奖”和第四届“中国出版政府奖电子出版物提名奖”的《中国历史百科地图》,等等。
这家成立于1978 年的老牌“国家队”出版社,为何能够在岁月的历练中勇立潮头,在新媒体出版领域精品迭出?为此,《出版人》杂志采访了中国大百科全书出版社副总编辑刘杭,听其介绍了代表当代中国军事科学发展最新权威水平的扛鼎之作《中国军事百科全书数据库》的产品特色与诞生过程,并了解到以《中国大百科全书》第三版项目开发为代表的,大百科出版社尝试从内容的编纂、存储到展示、发布、运营,全部在线完成,全面颠覆传统出版流程,真正从传统出版向数字出版转型的探索。
大国实力造就《中国军事百科全书数据库》
荣膺两项国家级新媒体奖项,2019 年获得“第七届中华优秀出版物电子出版物提名奖,2021 年获得“第五届中国出版政府奖电子出版物奖”的《中国军事百科全书数据库》,是在《中国军事百科全书》第二版的内容基础上开发建设的数据库,据悉这是当今世界上唯一的大型军事百科知识类数据库。
《中国军事百科全书》是系统介绍古今中外军事领域知识的大型百科全书,是建设军事文化的基础性和标志性工程,也是实现大国强军梦之文化软实力的集中体现。据刘杭介绍,该百科全书项目由军事科学院和大百科出版社联合组织编纂出版,现已出版19 卷纸质版,并采用国产技术开发出数据库,自去年下半年以来开通了100 多家机构的试用,实现营收近百万元。
参与这套图书编纂的专家、学者共计万余人,来自全军100 多所院校和各军兵种,其中两院院士就有50余名。内容涉及15 个学科领域:军事思想、战略、作战、国防建设、军事工作、中国人民解放军政治工作、军事后勤、军事装备、军事技术、军事法、国际军事、军事历史、军事人物、军事著作、军事环境。近100 个学科单元,收录3 万余个条目,2 万余幅图片、表格,3600万文字,以及中国人民解放军大事记、武器装备列表等百余个权威资料库。全书数据库内容权威、资料全面,分类清晰、检索准确,体系梳理、直观浏览,并且使用的是纯国产的数据库技术,安装使用都非常简便。该数据库的定位主要面向两大类用户,一是服务于军事院校和相关科研机构,二是通过公共图书馆提供给爱好军事知识的普通大众,目前的阅读方式主要是PC 端阅读。
刘杭表示,大百科出版社从上个世纪90 年代就开始做百科全书数据库,拥有较好的技术储备,在数据库开发方面比较得心应手,因此,在《中国军事百科全书》内容编纂完成后,数据库的开发只用了不到半年的时间。
从外包走向自主研发
上世纪90 年代初,正是纸质版百科全书的销售高峰,1990 年,《不列颠百科全书》在美国一年售出了12万套,总销售额达到创纪录的6.5 亿美元。但中国大百科全书出版社居安思危走在时代前列,于1993 年就成立了中国百科术语中心,迈向了数字化出版、新媒体出版的实践历程,基于《中国大百科全书》第一版建立了中国百科术语数据库,获得了国家科技进步三等奖,同时成立了中国大百科全书电子音像出版社,以光盘的形式出版《中国大百科全书》第一版的数据库。2004 年,出版社开始做局域网的大百科全书数据库, 2006 年左右,恰逢中国第二波互联网浪潮,大百科出版社开始做面向互联网的数据库,与互联网平台公司合作,将《中国大百科全书》第一版的数据库放到了互联网上。2009年起,该社与中国移动、中国联通、中国电信合作,做电子书的数字阅读,同时开始做App 掌上百科,供读者通过手机和iPad 阅读使用。
自2016 年以来,在社长刘国辉的领导下,大百科出版社的数字化探索进入了重要的发展新阶段,开始转向知识服务。在此之前,该社主要是和互联网平台合作,做2C 的数字化产品,2016 年之后,重点放到了为机构用户提供自主研发的知识服务和一些重大项目上。《中国军事百科全书》就是在2016 年立项,并列入了“十三五”国家重点出版物出版规划。刘杭告诉《出版人》,他们做知识服务就是基于出版社的数据库,做一些定制开发,为科研提供支撑,“比如,科研机构和院校老师们的有些课题需要类似百科知识的背景体系作为支撑,我们就根据社里的百科全书数据库和资源库进行定制开发,向他们提供这方面的知识服务”。
与此同时,该社也在有声读物领域开展积极探索,除了在儿童科普、人物传记、历史故事等领域制作了一批有声作品,还基于《中国军事百科全书》制作了一批军事题材的有声读物并取得了良好的传播效果。
在承担重大项目的过程中,大百科出版社自己的数字化业务团队也获得了快速成长,其新媒体中心如今已扩展到20 人,随着一部部产品的开发和更新迭代,这支年轻的队伍从项目外包和技术合作中不断学习、积累,逐渐具备了一定的能力,将原来主要依赖外包厂商完成的工作,逐步转为自主研发。2020 年在《中国大百科全书》第三版技术与运营工作中,该社新媒体中心就撤销了编纂平台代外包开发任务,全部改为自主研发,极大地节约了成本,提高了研发效率。
尽管现在一些大型的项目,依然有部分工作需要采用技术外包,但在外包项目验收之后,项目后期的迭代更新、维护、开发,都转为由出版社新媒体中心自主承担。
不重视数字化就是要自杀
刘杭感叹:“无论是《中国军事百科全书数据库》的开发,还是现在承担的《中国大百科全书》第三版的开发,对于大百科出版社都是非常宝贵的机会,出版社在人员、技术和管理模式等各方面,都借此机会在不断探索。依托国家的投入,给了我们一个真正实现数字化转型的机遇。过去一些项目交给外包公司去开发,难以避免会出现项目拖延、成果物不达标需要返工修改的现象,所以我们一定要有自己的技术判断和研发能力。”
在刘杭看来,“市场变化太快了,出版社现在如果不重视数字化,就是要慢性自杀”。他透露,大百科出版社为了吸引和留住数字化技术人才,设立了一些专职技术岗位,按照特殊人才聘用,“工资收入比社领导还要高”,整体上,数字出版部门员工的工资普遍高于传统出版部门。
相比互联网大厂和其他行业,出版社还具有情怀留人的优势。大百科出版社新媒体中心的几个技术骨干已经在出版社工作了较长时间,刘杭说,这些骨干都很热爱出版行业,因为出版社给了他们比较大的自主发挥的空间和平台,并且经常给他们提供参加各种内部和外部培训的机会,鼓励他们考取职业资格和软件工程师证书。从职业的稳定性、成就感、工作氛围和情怀等各方面综合衡量,这些技术人员觉得出版社更适合他们。
但刘杭也提出了他的担忧,数字出版的商业模式仍然是全行业面临的一个问题,怎样真正实现赢利,反哺行业发展,依然没有清晰的路径。据刘杭介绍,现在国内2C 类的电子书产品,主要通过中国移动、京东、亚马逊、苹果等第三方电子平台销售,因为平台分成高,电子书定价过低以及打折促销混乱,导致出版社制作发行2C 类电子书很难赢利。所以大百科出版社目前把研发和销售的重点放到了2B 类的数据库产品,不通过第三方平台,由出版社自己直接面向机构用户销售。
刘杭表示,《中国大百科全书》第三版的编纂发行是真正意义上的数字化出版,出版社为此建设起了在线的编纂平台、存储平台、运营发布平台,实现了数万名作者在线撰稿、交稿。编辑审读人员在线协同加工审读稿件,配置多媒体内容,检索和调阅相关参考文献资源,通过智能检校工具辅助人工进行质量校验,还可以根据稿件来源和质量进行编审流程配置。丰富的统计报表、权限设置等功能大大提高了管理效率。所有百科条目通过编纂平台进行流转,实现了全流程数字化编纂,数据化存储,以及线上内容发布。
同时,刘杭着重强调,《中国大百科全书》第三版网络版的运营将面临前所未有的挑战,但出版社别无选择,而且已经做好了准备,将努力开辟新一代百科全书的网络运营途径,力争既能为广大读者提供优质的百科知识服务,又能建立网络百科全书持续良性发展的模式。
基于《中国大百科全书》第三版的编纂出版,大百科出版社还积极申请,获批成立了国家新闻出版署出版业科技与标准重点实验室——百科知识融合创新出版工程重点实验室。刘杭希望,以实验室为抓手,进一步提高大百科出版社在数字化出版和融合创新方面的能力。通过建设实验室,探索怎样将前沿的科学技术,诸如知识图谱、自动标引、人工智能技术,应用到百科全书的编纂和传播上,以提高编纂质量、优化内容展示,提高传播速度和传播效果,此外,出版社也希望能借机创建一些通用的质量规范标准和具有行业共性的技术。例如,实验室的有些课题是探讨利用短视频的形式来展示百科全书的知识内容,像对地球自转的阐释,用文字和图片讲述总是有些抽象,但用视频、动画的形式演示就非常形象。还将探讨利用大数据更有针对性地了解读者的阅读兴趣,从而更好地向读者提供个性化的内容推荐,更精准、及时地对内容进行补充更新。
事实上,为了提高百科全书内容的传播效应,大百科出版社还开创性地利用人工智能技术,研发出了“小司南”百科问答机器人,继2018 年推出比真人略小的样机后,又研制出可手持的迷你版“小司南”,有望量产后走进课堂、展览馆。
未来,依托于已建立的数字化出版平台和对各项前沿技术的实践,大百科出版社将更好地利用自身在百科全书与工具书出版方面的专业实力与资源储备,用技术“激活”知识,打造出一个权威的网络百科知识宝库,继续为广大读者提供优质的服务。■