数字编辑及复合出版所需解决的若干问题
2009-08-02王勤
王勤
如何采用信息技术来提高工作效率、细化成书工艺指标、提升编辑质量、缩短出版周期,是出版业普遍关心的问题。现代大型工具书的编辑出版,特别是知识型的百科全书更是如此。《中国大百科全书》(第二版)在编辑工作后期,特别是成书编辑阶段所面临的问题更多。如:全书体例的规范和统一、面对海量数据的情况下如何利用数字技术发现问题和解决问题、成书过程中专项检查的工艺化过程控制、资料的全面核实、协同异步工作机制的建立、基于数据库的底层环境建设等关键问题。
中国大百科全书出版社的领导层和决策层在全书编纂阶段就率先认识到这一点,很早就启动了具有自主知识产权的大型工具书数字编辑平台的自主研发工作,并在《中国大百科全书》(第二版)的编辑出版工作中取得了以下几项突破性成果。
一、提高工艺流程的并发率,利用信息技术提高工作效率
百科全书的成书过程环环相扣,步步关联。如按编辑流程线性展开,一则工期长;二则在流程中,文稿和交换频繁,文件流转过程中发生的技术性故障和人为故障率大大提高。因此,如何利用信息管理技术和现代工艺学,在现有人力物力的条件下,科学管理,理性调度,最大限度有效提高工作效率,是百科全书成书过程中首先要解决的问题。
在系统设计中,首先按百科全书的传统成书工艺细化了成书工艺的线性流程,并根据这个基本流程,以提高并发率,交叉率开始进行流程的优化处理,从而使得整个编辑工艺流程的设计从原来传统的时间线性操作变成最大可能的时间并发和工艺并发,从而大大提高了工序的并发率,极大地提升了工作效率。
二、细化成书工艺指标,实现质量控制
在努力提高成书工艺流程的并发率和有效性的同时,如何按照精细化管理目标的理念,细化工艺指标,是保障成书整体质量的关键问题之一。项目组在编辑平台的设计过程中,首创了基于工业化生产流程控制,精细化工艺管理的大型工具书成书编辑理念,在系统设计中首先考虑成书编辑过程如何按辞书出版工艺学原理,并利用系统工程设计思想及总署的图书质量保障体系,将百科编辑成书体例的每一项任务,分解成最小的可单一执行单元并使之具有可操作性。
百科全书成书体例的认真贯彻在执行过程中存在的另一个问题,一是体系的描述过于原则;二是并非所有编辑人员都能深刻领会体例制定精神的实质;三是体例所应对的具体问题千差万别;四需要统一和解决的问题成千上万;五是不同的人员、不同的学科背景,不同的编辑业务经历,对同一体例要求的理解和认识的差异性也很大。如何统一编辑人员的认识,规范所有编辑人员的工作行为及工作准则,如何将各项工作分解并将工艺指标细化,如何使全体工作人员在统一的规范和统一的程序中完成成书编辑任务,是实现工业化工艺流程设计后课题组面临的又一个重要课题。项目组在认真研究的基础上,提出了任务分解,指标细化的系统设计思路,并将其成功应用于系统的研发过程中。
在工艺设计中,最为重要的是体例中的规范指标的细化和描述,为此,整体工作分为两个方面,一是将任务明确、指标细化、说明具体化;二是通过修改留痕和检查校验系统,确保改动的有效性和可追溯性。
三、海量数据处理,优化编辑过程
百科全书的编辑加工总量,在出版物中高居首位。以《中国大百科全书》(第二版)为例,全书成书条目总数为5.9610万条,总索引量为26.6593万条、总参见数为16.2688万条、总图数3.1573万幅、总表数854,参考书目2683本。全书总句数114万。在线修改10次。
仅以文字内容的资料核查为例说明工作量,对于全书的成书质量来说,要求做到的是内容的自恰。然而要做到自恰二字,就意味着要对每一句的每一个表意要素进行对比核实,全书所有的资料不能出现不统一或互为矛盾的地方。
全书成书条目总数为5.9610万条,共计114万句,按句子成份分为定义、定性叙述、词源、生平、经历、沿革、事件、成果、评价、著作等。每一句都是由若干个表意元素组成。如果仅按每句5个基本表意要素统计,一次编辑需要核实的表意要素总量就高达570万,全书成书期间在线修改10次,核实确认总量高达5700万(中间过程的实际工作量要按此增加20%)。对传统出版来说,这是一个天文数字,如果不依靠信息技术和计算机,仅仅依靠人力,是不可能完成这项工作的。
为此,我们创造了句型编辑法,即在系统中,将全书的条目按句入库,并通过自主研发的基于语义的句式系统,对全书所有的句子,依其句型进行语义分析,并将其基本表意要素提取出来,进行比对核正了解数字化和网络时代的特点。我们要捕捉到它的特征。
第二,要遵循它的规律,日报每天更新一次,月刊每月更新一次,网络现在完全不是这样的,网络社区凝聚了很大的力量。我们经常说网上的东西是一堆垃圾,但我要问大家,如果网上的东西都是垃圾,大家上网干什么?
网上一定有很多不是垃圾的东西。举一个简单的例子,比如博客,特别是名人博客,谁会把垃圾往上搁呢?一定不是垃圾。再说专业网站,是垃圾吗?网上的一些工具书,是垃圾吗?我们现在想查一个词,或者一个概念,很容易在网上查到。
我觉得现在年轻一代,像我小孩那一代根本不使用纸质词典,去年我们研究所搞了一个电子纸测评,今年准备搞第二次,电子纸这个领域如果进入到出版界将是什么概念?特别是电子课件等等,它的影响是非常深刻的。所以要尊重数字化本身的规律,而不是用传统平面媒体的思维方式经营数字化时代、互联网时代的媒体。
第三点建议,我个人认为也不一定正确就像今天会议主题一样,要从资本层面去解决问题。为什么这样说呢?尽管金融危机到来了,大家一听投资就有点脑袋大,但技术与资本是永恒的话题。目前,传媒业还是条块分割,以我为中心做事,做期刊就做期刊,做投资就做投资,做技术就做技术,做广播就做广播。美国人怎么做呢?美国有亚马逊,我国有当当,亚马逊不光卖实体书,还卖电子书,还做Kindle。当当呢?我们做阅读器是技术提供商来做,硬件商来做,跟内容完全脱离,企业和企业之间没有任何战略上的、资本上的融合。我认为更重要的是在资本层面上合作。所以说今天是一个合作共赢时代,简单的合作是项目合作,委托开发等等,但我觉得合作应该更深层次一点,就是要进入资本层面。
另一方面,现在正进行文化体制改革、出版体制改革,出版体制改革应该说迈的步伐还是很快的,改革的目的就是要转企改制,把能进入市场的出版单位改成纯粹的企业。我想说的是:改革前,传媒业的领导可能是官员,有行政级别和头衔。但改革以后,你既然已经是企业了,我觉得你就应该少一点官员身份,多一点商人身份。这一点很重要,因为只有你是商人了,你才会想到怎么去经营,才会从战略角度、资本角度思考问题,数字化说到底是一个企业战略问题。
我想借这次年会的机会,希望传统的平面媒体跟资本的力量能够联起手来,能够打造出中国数字媒体的航空母舰,或者探索一种成功模式。我觉得这个是我们现在非常非常需要的。
(本文根据作者在09,中国传媒投资年会上的演讲整理)