出版对象论
2022-03-22耿相新
耿相新
在出版学教科书中,我们找不到有关“出版对象”的章节。但在具体的出版活动中,作为出版人,我们却每天都在和出版对象打各种各样的交道。这是一个司空见惯的现象,也许还是一个不值得一问的问题。然而,出版对象到底是什么?难道它就是我们桌子上或者计算机屏幕上的文本稿件?抑或是等待校对的书稿清样?或许,我们还可以根据出版社的不同类型将出版对象区分为图书馆分类法中的各类图书,甚至还可以将其划分为音像电子出版物和纸质出版物等。不过,以上归类依然没有解决问题。出版对象到底是由什么构成的?通过对现实出版世界的理解,尤其是对世界出版50强的对比性观察,我认为,在数字时代,出版对象已经发生重大位移。无疑,重新界定和讨论出版对象的问题,具有重要的现实意义。本文拟从出版符号、出版符号被传递物内容类型和出版符号传递物介质形式三个方面,试图厘清出版对象的问题,并试图唤起学界和业界对此问题的重视。
一、出版符号的界定
出版活动实质上就是人类符号的一个传递过程。德国哲学家恩斯特·卡西尔(Ernst Cassirer)说:“人是符号的动物。”①为了说明“符号”,卡西尔区分了信号和符号,他认为“信号是物理的存在世界之一部分,符号则是人类的意义世界之一部分”,人之外的动物可以感知信号,“动物具有实践的想象力和智慧,而只有人才发展了一种新的形式:符号化的想象力和智慧”,“符号化的思维和符号化的行为是人类生活中最富于代表性的特征,并且人类文化的全部发展都依赖于这些条件”。②他进一步认为,人自觉地创造并运用符号,由此创造了文化,创造了一个“符号的宇宙”,人、符号、文化三位一体,因此“人是符号的动物”。符号是中介和媒介,它架起了人与文化之间的桥梁。而出版作为一种人类文化活动,它使用的工具和作用的对象就是人所创造的各种各样的符号。
既然符号构成了人的意义世界,那么符号究竟是由什么构成的?或者,我们应当直接提问:什么是符号?简单地说,符号是携带意义的记号。英文中symbol(符号)这个词“来自希腊文里代表token(象征)或token of identity(身份的象征)之义的词,它结合了两个词根:sum(一起)和动词ballo(丢掷),对‘符号’一词较宽松的诠释是‘放在一起’”③。放在一起的可以是人也可以是物,其本源的意指是某人证明某人的关系。美国《韦氏词典》对符号的定义是“由于关系、联想、习俗成规或偶然而非有意的类似,来代表或使之联想到其他事物的某种事物”④。这个定义强调了“某种事物”能够代指另一种事物,与罗曼·雅各布森(Roman Jakobson)的观点十分一致。雅各布森认为符号具有两个方面:“一个是可以直接感觉到的指符(signals),另一个是可以推知和理解的被指(signature)。”⑤这个观点与费迪南·德·索绪尔(Ferdinand de Saussure)关于符号是能指与所指之间的关系异曲同工。美国哲学家查尔斯·桑德斯·皮尔斯(Charles Sanders Peirce)对以上的符号概念进行了大大的拓展。皮尔斯认为,整个宇宙充满了符号。他给符号的定义是:“符号,或代表项,是对于某人在某一侧面或能力方面代表了某物的东西。它对某人说话,也就是说,它在此人的思维中创造了一个相对应的符号,或者一个更加发展了的符号。那个被创造出来的符号我称之为第一个符号的解释项。”⑥这个定义突破了符号的能指和所指二元结构而成为“符号、符号的对象与符号的解释项”三元结构,符号活动就是一个三元过程,也即“符号首先是一种解释项,是一种响应,通过这种响应的解释,另外某种东西才能被看作符号,从而成为被解释项,而且,还能够生产一个开放的、由其他符号组成的符号链”⑦。沿着由符号的解释与被解释并产生新的符号这一逻辑,任何事物,凡是能够联系在一起的,就是符号。皮尔斯在《关于意义的论文》中列举了大量的符号例子,如:画像、图片、图表、手指、眨眼、手帕结、回忆、幻想、概念、指示、标志、数字、信件、词、短语、句子、篇章、书籍、图书馆、信号、命令、显微镜、立法代表、音符、音乐会、表演、自然哭喊,等等。⑧同时,皮尔斯还将数学、化学、心理学等17门学科也归入符号学的研究范畴。基于以上认识,我们可以将符号理解为一个能够解释的标记或者记号,这个解释就是意义,符号就是表达意义的载体和表达意义的条件,而“意义就是一个符号可以被另外的符号解释的潜力”⑨。换句话说,人的世界就是符号的世界,也是意义的世界。而出版活动的目的正是表达和传播意义,自然而然,符号必然也必须成为出版的表达和传播工具。因此,出版的对象就是人所创造的符号和对符号的解释。
毫无疑问,人是符号的制造者,也是符号的接受者。人的嗅觉、味觉、触觉、听觉、视觉五种感官的任何活动都具有作为符号或者成为符号的潜能。雅各布森尤其重视视觉和听觉,他说:“人类社会中最社会化、最丰富和最贴切的符号系统显然以视觉和听觉为基础。”⑩作为符号系统的听觉,其最明显的表征是口头语言和音乐艺术,声音成为符号意义的载体。而视觉符号系统则更倾向于身体姿势、书面语言、文本作品、图像、造型艺术等。当语言被文字符号记录而成为文本性的书籍,或者综合运用了空间场景的表演艺术,如演讲、课程、戏剧、歌剧、电影、电视等视频式艺术,则是整合了听觉符号和视觉符号。随着数字计算机图形软件技术的发展,虚拟现实和增强现实的虚拟影像也一同成为符号意义的载体。基于以上认识,我们将出版符号归类为五个系统:文字符号系统、图像符号系统、声音符号系统、视频符号系统和虚拟符号系统,此五类符号系统构成了总体的出版符号。
出版是一种符号生产和消费。文字符号的出版自出版诞生以来即为出版的主流。文字符号系统是人类的重要发明之一。在人类古文明时期,不同的文明发明了不同的文字符号系统。人类的语言有7 000种左右,但进化到记录语言的文字系统却只有几百种。文字是人类使用声音、语言的代号或符号进行视觉交际和传递信息的系统,这些符号或代号与声音或语言单位的意义约定性地相对应。最早的文字符号系统起源于图形符号,也可称之为象形符号,它是一种象征性代号,这些代号或符号可以提炼一个人或一件事情的特征、特点、特性,并以形象的图画形式进行表示,这些符号也对应于口语中的人或事物,约定俗成并形成惯例后便成为文字符号。迄今,人类所发明的成熟的文字系统主要有三种类型:词符与音节符并用的文字、音节文字和字母文字。如果一个符号代表一个词,使用大量的符号即可形成词符文字系统,但此势必造成词符数量巨大,而且抽象词也难以表达。苏美尔人、古埃及人、中国人把一部分词符改成不表意、只表音,并将其置于词符之间,用来表示其他与此读音相同或相似的词。苏美尔楔形文字、古埃及象形文字、赫梯文字、中国甲骨文字是发明最早也是最典型的词符和音符并用的文字系统,从甲骨文字流变而来的汉字目前依然是中国日常使用的书写文字和出版符号。音符也即音节符号、语音符号,相对于词符数量较少并相对稳定,如果舍弃数量巨大的词符而全部使用音节符号,那就成为“音节文字”,音节文字以楔形音节文字,西部闪米特音节文字(腓尼基文字、希伯来文字、阿拉米文字),爱琴海音节文字,日本音节文字(假名),埃塞俄比亚文字(阿姆哈拉文字)为代表。其中,日文是词符和音节符并用的文字,但其假名是音节符号。文字符号可概分为表形、表意和表音三种类型。古埃及象形文字中开始使用表音的限定符号,大量和重复使用的26个单辅音符号(每个符号代表一个辅音)成为世界上最早的字母表。早期的辅音符号几乎全部与词符、音符和限定符号一起使用,公元前2000年前时埃及人开始只用辅音字母书写,这一符号书写原则很快传入西奈半岛和黎凡特地区的闪米特族人中。⑪从古埃及的辅音字母表,演化为闪米特语的原始字母表,最后演变为西方今天广泛使用的拉丁字母表。公元前1000年左右,闪语字母演变为南闪语字母系统、迦南语字母系统、亚兰语字母系统和希腊语字母系统四大支系。迦南语系又再分化为早期希伯来文和腓尼基文。亚兰语系中的闪语字母系统包括方体希伯来文(现代希伯来文原型)、新西奈阿拉伯文、帕尔米拉字母、古叙利亚景教文、摩尼文等,非闪语分支中从亚兰字母衍生出的文字主要有印度婆罗米文、佉卢文、波斯文、粟特文、青帐突厥文、维吾尔文、蒙古文等。希腊人在西闪米特辅音字母表中,加入元音而创造出人类历史上第一个完整的字母文字体系,古希腊文又演化为伊特拉斯坎字母、斯拉夫语系的西瑞尔字母,拉丁字母(罗马字母)是伊特拉斯坎字母的支系。拉丁字母成为基督教官方文字后,被应用到许多不同的语言上,如日耳曼语系的英文、德文、瑞典文、丹麦文、挪威文、荷兰文;拉丁语系的意大利文、法文、西班牙文、葡萄牙文、罗马尼亚文;斯拉夫语系的波兰文、捷克文、克罗地亚文、斯洛文尼亚文;芬兰语系的芬兰-乌戈尔文、匈牙利文等。⑫从词符-音符文字、音节文字和字母文字的溯源可以看到,音节文字很早就被字母文字替代了,现在流传下来并仍在使用的文字系统只剩下中国的汉字系统(日文源于汉字)和源于埃及辅音字母的字母文字及其各种变种。人类历史上的书籍均是由不同的文字系统书写的。印刷术发明之后,汉字书籍(包括日本、朝鲜、越南的汉籍)主要使用雕版印刷和铜活字印刷,字母文字书籍使用古登堡铅活字印刷机印刷。19世纪以来的工业印刷机和20世纪中叶以来的计算机数字技术逐步淘汰和挑战纸质出版,但这只是出版技术的演替而已,书籍出版的符号系统依然是词符—音符的汉字系统和字母文字系统。通过对文字符号的探究,我们不得不说,不同书籍使用不同文字符号而呈现内容,这是出版活动的根基,实际上,某一语言文字的边界也就是某一出版活动的疆界。同理,突破原有出版符号版图的翻译活动,始终是推动文化交流的一种动力。在此,文字符号不仅是出版对象,在一定程度上它也是对出版的一种限制。
出版的本质是为了促进文化和语言交流。广义上的文化语言交流,有学者将其分为三大类型:科技指示符码—科学语言(数学语言、音乐、化学、物理、逻辑语、曼瑟尔表色系统、音标系统)与机器语言(C语言、Java、二进制、二维码);文化规约符码—自然语言(图像、自然语言、网络生成符号、艺术创作语言);混合理据符码—传播语言(公共标识系统、手语、旗语、各种指示符号、图像混合语言、图像化音乐记谱语言)。⑬从这个相对系统和完整的语言符码角度出发,我们可以看到计算机时代传播和出版符号的广度。除文字符号外,包括计算机图形符号在内的图像符号越来越凸显其重要性。图像不再单纯是传统意义上的图画、绘画、照片、雕塑,现在也应包括计算机条件下的设计、图形和镜像等。
图像进入书籍内部的时间十分久远。从时间性上说,图画早于文字诞生。书籍诞生之后,插图也紧随其后进入书籍内部结构。早在战国时期,中国的竹简书籍中就已出现插图,出土于长沙的战国楚帛书也可以被视为一本图文结合的书籍。出土于马王堆汉墓中的帛书,制作于汉代初年,其中的《天文气象杂占》等书籍是图文并茂的。《山海经》在汉代是图文相间的。雕版印刷术发明不久,雕版图像就已成为雕印书籍的一部分,如雕印于唐咸通九年(868)的《金刚经》,在书首就置有一幅精美绝伦的题为《祇树给孤独园》的图画。明清时期,雕版绣像插图更成为书籍美学呈现方式的普遍现象。世界上最早的书籍插图可追溯到古埃及的《死者书》(Book of the Dead)中的图画。在西方,现今存世最早的附有插图的手抄本是荷马史诗《伊利亚特》和古罗马诗人维吉尔的《埃涅阿斯纪》,是公元4世纪或5世纪时制作的。⑭中世纪的手抄本中大多手绘有极其精美的“装饰画”。古登堡发明铅活字印刷术之后,西方的印刷版画开始兴起。出版于1493年的《纽伦堡编年史》一书中附有插图1 809幅,堪称插图书杰作。文艺复兴时期,阿尔勃莱希特·丢勒(Albrecht Durer)是最著名的书籍插图家。与木版版画相比,后起的蚀刻凹版印刷技术铜版版画线条更加纤细优美,18世纪后凹版插图逐步替代了凸版插图。1843年,英国人安娜·阿特金斯(Anna Atkins)出版了世界上第一本使用摄影照片的书籍《英国藻类图片集:氰版照相法印制》。⑮从此,摄影照片开始大量涌入书籍内部,在工业印刷最鼎盛的20世纪,专业的摄影书籍甚至成为一个重要的出版门类。在数码摄影技术崛起后的21世纪,照片的生产量达到令人吃惊的程度,仅社交网站Facebook上一天上传的图片就有数亿张,数字照片开始成为重要的出版对象。图像作为一种出版符号将有可能超越文字符号而成为最重要的出版存在。
声音作为一种人类交流和传播媒介,其起源与人类语言的诞生同步。声音的易逝性特点决定了其作为一种出版符号的困难,但人类努力记录声音的探索却一直未曾停止。依据记录声音的技术,我们将声音符号分为间接记录声音符号和直接记录声音符号,前者主要指需要用文字或其他符号记录的声音,后者指模拟信号的录音、无线电广播和数字化数据音频。以书籍形式记录的声音符号在录音技术发明之前,主要类型有音乐乐谱,戏剧剧本和说唱、讲唱、弹唱文学底本。中国最早记录曲谱的书籍出现于汉代,《汉书·艺文志》中记载的《河南周歌声曲折》7篇、《周谣歌诗声曲折》75篇就是最早的乐谱,声曲折是一种古代的歌诗演唱时对曲调的记录方法,是依据曲调高低上下而绘制的一种乐谱,具体形态已不可知。中国古代最初是用文字记谱,现存的唐代手抄本《碣石调·幽兰》是目前仅见的一首用文字记述弹奏手法的琴曲,此文字谱用了4 954个汉字。⑯唐代曹柔创新古琴记谱法为减字谱(指法谱),沿用至今。同样起源于唐代的还有“燕乐半字谱”(工尺谱),在敦煌遗书中发现有数种四弦四相琵琶曲子谱,即燕乐半字谱。南宋词人姜夔的词曲谱集《白石道人歌曲》(6卷)中有17首词姜夔自注工尺谱,是“至今传世的唯一词调曲谱”⑰。明清时期,民间雕印了大量琴曲小册子,而雕版印刷的戏剧剧本和民间唱本,更多达数千种,这些都可以被归类为间接记录声音符号的出版物。录音技术被发明后,尤其是广播技术和数字音频技术被广泛应用后,声音符号迅速发展成为人类最重要的大众媒介之一。录音技术和录音机(留声机)是美国发明家T.A.爱迪生(Thomas Edison)于1877年发明的,其后,录音和放音介质发展为力学介质(留声机唱片)、磁性介质(录音带)和光学介质(电影的声道与数字式小型光盘),与书籍出版关联度较高的是磁带,磁带录音主要分为开盘式和盒式两种,以学习语言为主的教学带主要使用盒式磁带,在数字技术和互联网兴起之前,盒式磁带曾是音像出版业的主要产品。广播是利用电子技术向公众播送无线电或电视信号,它实现了远距离、实时、一对多的单向传播,无线电广播只传播音频,电视则同时传播视频和音频,二者向广大听众和观众传播的内容主要是教育、新闻和娱乐等节目。广播系统、电视系统是与出版系统并行的大众传媒,广播系统兴起于20世纪20年代,电视系统大约兴起于20世纪50年代,它们与图书出版的关联部分主要在教育方面,远程的广播和电视大学所使用的教材和教学辅助材料通常以纸质图书的形式出版。中国自宋代开始流行的口头讲说表演艺术,如说书、讲书、评书、讲古、评话、评词等不同称呼的说话艺术,在广播、电视兴起后,也开始成为广播和电视的节目,但表演艺术家们的底本(话本),通常还会以纸质介质的形式出版和传播。1983年建成的国际互联网,于90年代崛起为一个具有覆盖媒介功能的超级大众媒介,以数字化、电子化的文字、图像、音频、视频形式覆盖了以往的图书、杂志、报纸、摄影、录音录像、电影、广播、电视等媒介,以往的媒体内容逐步迁徙到互联网和移动互联网上,数字音频成为互联网和移动互联网上必不可少的一个角色。声音符号直接转换为数字形式之后,听书成为一种开始崛起的出版产品。1997年中国的网络广播诞生,2004年基于移动互联网的博客、网络听书网站兴起,2012年规模化的音频聚合网络平台出现,基于声音符号的音频介质开始朝垂直化、社群化、产业化的方向发展。⑱数字音频越来越成为一种商业化的出版对象。
视觉符号影像或视频成为出版对象的时间相对较晚。视觉是人类最原初的感知感官之一,也是人类初始信息交流的媒介之一。在口语时代,面对面的视觉交流是最有效的信息传递方式。即便是在通过网络进行远距离即时视频交流十分便捷和发达的今天,面对面的视觉交流依然不可替代。将人体的姿势、手势和表情记录下来成为视频符号,起源于1888年T.A.爱迪生和他的助手发明的第一个实用的活动图片摄像机,之后他们还发明了活动电影放映机。1903年之后,随着技术的不断进步,电影成为一个大众媒体并形成了巨大的产业。紧随电影之后,以影像为媒介的电视媒体崛起于20世纪50年代。英文单词“Television”(电视)1900年被法国人康斯坦丁·伯斯基创造,本意是“远距离观看”“用电来看”。⑲与电影不同,电视与无线电广播和有线电话是近亲,属于电子媒体。电视是活动图像和其声音的电子信号传输。电视摄像机将图像和声音转换为电脉冲信号,这些高频无线电载波信号由发射天线发出,被接收天线拾取并再转化为光的亮度变化,在接收机的荧幕上显示出来。1936年11月2日,英国广播公司正式播出电视节目,被视为电视正式诞生日。20世纪七八十年代,有线电视、卫星电视分别加入电视网,直到21世纪初以计算机网络为技术基础的移动互联网的崛起,兼顾了视频和音频优势的电视媒体才开始衰落。电视视频和图书出版相结合的部位主要体现在教育出版领域的教学课堂和课程上,视频课与纸质书互相支持对方。但在电视视频和数字图书分别迁徙到移动互联网上时,它们双方都重新找到了新营地。图书出版将原有的纸质图书内容转化成了视频形式的教学课程、软件和学习材料,文字作者开始直面镜头而转化为演讲时的影像,视频符号开始大规模地进入出版领域。视频符号成长为出版对象,并开始朝专业化、垂直化、知识化、课程化、产业化的方向发展。
虚拟符号是由计算机创建和产生的。随着计算机技术的发展,虚拟符号携带意义的场景应用越来越多并越来越具有商业性。计算机虚拟符号已经开始成为重要的出版符号,其商业价值越来越凸显。从我们熟悉的虚拟现实(VR)中追寻一下它的技术基础,可以得知虚拟现实的技术支撑是计算机图形和图像。虚拟现实(VR)是“计算机创造并以计算机为媒介的对真实或想象的环境的模拟”,它是一种虚拟环境,通过三维(宽度、高度和深度)图像的体验来提供对现实的幻觉。⑳三维图像是关键技术,三维图像的显示可以通过头戴式显示器、立体眼镜、耳机、运动平台、数据服装(数据手套)和其他互动装置呈现。计算机的硬件和软件构成一种交流媒介,通过人机互动装置像交流文字符号和声音符号一样交流图像、声音和动态模型以形成仿真模拟。三维图像的底层技术是计算机图形和图像,计算机图形是由计算机绘制的直线、圆、矩形、曲线、图表等外部线条构成的矢量图,计算机图像是由像素点阵构成的位图,计算机可以将一件现实存在的或想象的视觉信息以数字化的图形和图像形式表达为仿真的形象,运用透视线条、隐藏表面消除等技术使二维的计算机屏幕能够有效地模拟三维世界,从而形成虚拟现实式的计算机模拟世界。虚拟现实(VR)已被广泛应用于艺术、工程设计、娱乐游戏、工业仿真、培训实训、课堂教育、医学、军事、航空航天、能源交通、生物、水文地质、事故还原、工业制造等领域。和传统出版关联度较高的是教育领域,虚拟现实技术能够为学生提供一个生动、逼真的学习环境,可以为学生提供诸如物理、化学、生物等虚拟实验,也可以为职业学校的学生提供各种虚拟演练和动作操作。数字技术发展的现实,让我们不得不重新审视计算机所创造的虚拟图形和图像,它们也同样起到了携带意义的中介符号的作用,已经演变成一种出版符号。
二、出版符号被传递物内容类型
如果我们将出版符号理解为出版活动中的外在表现形式,那么,我们随之要进一步思考的是,作为中介的出版活动在时间和空间上要传递的内在形式是什么?符号学中将符号的传递分为遗传和传统两种类型。遗传属于生物学中基因代码的范畴,而传统则被视为“一种文化可被看作是一个有机体群体,其行为方式受制于特殊传统,即经由学习获得之,并在创造性的修正之后将其传至下一代”㉑。关于遗传和传统,《符号学手册》的作者认为:“两种传递类型(遗传和传统)都是记号过程,而且被传递物(知识、态度、生产技能和制造物的使用),在很大程度上也是以记号为基础的。”㉒符号的创造过程也就是记号的过程,由记号(符号)的生物性所决定,符号传递既具有一代一代的时间性,也具有地理概念下的空间性。无论是传递的生命力,还是传递的广度,出版活动中的核心要素是首先要界定清楚传递什么,换句话说,被传递物是什么。我们认为,出版活动中的被传递物是数据、信息、知识和智慧。
狭义的数据指数字或数值,是人类通过观察、实验、检验、统计或计算,通过对客观事物的逻辑归纳而得出的结果,也指用于进行各种数学统计、计算、查证、决策、科学研究、技术设计等的数值。英文单词data(数据)是指“一个有意义的事实和数值总体”,中文的“数据”定义是“指对客观事物进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合”㉓。从数据的表现形式上可将其分为离散数值和连续数值,即数字数据和模拟数据,数字数据主要为各种统计或量测数据,模拟数据指在一定的区间内连续变化的物理量,包括图形数据、符号数据、文字数据、图像数据等。如果依数据的物理性质,还可以将其分为定位的坐标数据、定性事物属性的定性数据、反映事物数量的定量数据和反映事物时间特征的定时数据。在计算机数据库时代,数据被定义为“描述事物的符号记录”,“描述事物的符号可以是数字、文字、图形、图像、声音、流数据、HTML(hypertext markup language)、XML(extensible markup language),即数据有多种表现形式,数据可以是结构化的、半结构化的和无结构的”㉔。结构化数据是指可以被计算机识别的数据,是“具有一定结构性、可以划分为固定的基本组成要素、能够通过一个或多个二维表来表示的数据”㉕。结构化数据主要是应用于关系型数据库和面向对象数据库中的数据。半结构化数据主要应用于XML(可扩展标记语言)和计算机网络网页。非结构化数据是指不是以一种预先定义好的方式进行组织的数据,在表现形态上主要包括文本、图片、音频、视频等,“世界上大约80%的数据是以文本、照片和图像等非结构化数据的形式存在”㉖。通过对“数据”概念的理解,我们可以非常清晰地认识到,数据已经不再是单纯的数学概念下的数字或数值,它实际上已经演化为记录和描述一切事物的符号。自20世纪60年代以来,数据库技术得到迅猛发展,数据库出版迅速成为一种新的出版形式,数据随之成为最富有前景的出版对象。
数据本身并不能完全表达事物的内容,需要解释才能表达出完整的意义,对数据含义的说明既是一种数据解释,同时也是对数据的一种加工。在计算机系统中,数据是所有能以二进制信息单元0、1的形式输入计算机并被计算机程序处理的符号的介质的总称。数据的价值在数据库技术发明之后得到了充分体现。数据经过组织和加工产生价值和意义。对各种数据进行收集、存储、加工、传播、应用是一种数据处理活动,对数据进行分类、组织、表示、编码、存储、存取、控制、维护是形成数据库的关键。数据库就是用数据模型对现实世界的数据特征进行抽象、描述、组织和控制,是一种持久存储在计算机内的有组织、可共享的数据集合。依数据库管理模式,数据库分为层次数据库系统、网状数据库系统、关系数据库系统、面向对象数据库系统、演绎数据库系统、分布式数据库系统、并行数据库系统、工程数据库系统、Web数据库系统、混合型数据库系统等形式。按照应用领域、市场用户需求和商业价值实现,已经进入市场并实现经济效益的特定的、专业的、特种的数据库大体有:与计算机并行和分布式技术结合的并行数据库、分布式数据库;与人工智能和计算智能结合的主动数据库、演绎数据库、模糊数据库、知识库等;与多媒体技术结合的图像数据库、图形数据库、文本数据库、情报数据库、多媒体数据库等;与计算机硬件结合的内存数据库等;满足特殊需求的实时数据库、空间数据库、工程数据库、生物信息数据库等。㉗作为出版行为的数据库出版,已经成为数字出版的基石,不仅仅是在底层技术上,在数字出版产品上它的盈利规模也远远超过了纸质出版。
数据通常被理解为未经过加工和组织的数字、文字、图像、图片、声音、视频等原始符号记录,而信息则被视为通过人脑或计算机对原始数据进行筛选、加工和创造后产生的有意义的数据。在数据和信息的关系上,可以说,数据是信息的表现形式和载体,它们可以是符号、数字、文字、图像、图形、声音、视频等;而信息则是数据的内涵,是对数据有意义的表示,是对数据做出的具有含义的解释,“信息是结构化的数据”。如此解释数据和信息,是计算机时代的一个视角解读,但究竟如何定义信息,或者说如何定义出版活动中的信息概念,其实还存在诸多难度。
在出版活动中,我们可以将信息视为用于传递、交流、传播和反馈的关于客观事物或意识、思维、思想的符号与内容。现代意义上的“信息”概念,最经典的定义是1948年克劳德·香农(Claude E.Shannon)在《通信的数学理论》一文中所表述的:“信息是用来消除随机不确定的东西。”㉘香农的这篇论文从通信技术的发展角度开创了信息论,但他的这个定义却是缺乏意义和语境的纯粹数学概念,他将信息视为发送者传递给接受者的讯息,可以用0和1的符号串形式来编码,信息是一个抽象的科学概念,可以用数学方法加以定量表征,“信息量等于不定性的负量”。香农的信息定义并不和意义产生关系,他认为:“通信的基本问题是在某一点上准确或大概复制在另一点上选择的讯息。讯息常常是有意义的。换言之,它们根据某一系统指涉某些物理实体或观念实体,或与之有关联。通信的语义方面和工程问题没有关联。语义的方面是,实际的讯息选自于一套可能的讯息。”㉙对香农的信息概念进行阐释和拓展贡献最大的是沃伦·韦弗(Warren Weaver)和诺伯特·维纳(Norbert Wiener)。韦弗从技术、语义和效用三个水平方面解读了香农信息和通信研究的方向:“水平A.通信的符号如何能精确地传送?(技术问题)水平B.所传送的符号如何准确地传达所希望的意义?(语义问题)水平C.所接收到的意义如何有效地以所希望的方式影响行为?(效用问题)。”㉚我们可以看到韦弗已经将信息理论拓展到了传播学领域,他关注到了符号的发送者和接受者,关注到了信息产生方式、信息载体和信息内容,关注到了符号意义的传送与反馈,为出版产业应用信息理论奠定了理论基础。维纳是控制论的创始人,他一再强调,他是用信息论工具来研究控制系统和建立控制论的,是用统计学的方法来研究信息论的,控制系统中的过程是通信,控制系统是由系统、信息、控制、反馈和通信组成的。维纳的信息定义是:“信息是人们在适应客观世界,并使这种适应被客观世界感受的过程中与客观世界进行交换的内容的名称。”㉛这个定义是对香农信息概念的发展,它强调了借助反馈维持稳态的作用,也就是说,信息是关于事物运动的知识,信息是内容,信息是人们在与客观世界之间建立联系的内容,这些内容具有意义,通过控制物质领域的意义以减少世界的不确定性。通过“交换”(反馈)赋予信息以意义,信息表达目的是维纳对香农信息概念的拓展。加拿大物理学家、传播学家罗伯特·K.洛根(Robert K.Logan)更进一步认为“没有意义的符号并不是真正的信息”,他与路易斯·斯托克司(Louis Stokes)提出的数据、信息、知识和智慧的定义,更成为知识经济时代的理论基础,这个基于信息的关于知识进化的理论模型,实际上也是数字出版理论探索的一个工具。洛根认为,“数据是纯粹和简单的事实,没有特殊的结构或组织,是基本的信息原子”;“信息是有结构的数据,信息赋予数据意义,为数据提供语境和意义”;“知识是战略上使用信息,以达成个人目标的能力”;“智能是在符合个人价值并在大社会语境里选择目标的能力”。㉜在洛根的理论框架里,数据是信息发送者和接受者之间传输的信号、消息、符号,数据语境化之后附有了意义而成为信息,信息得到应用而转化为知识和智慧。洛根的这个信息和知识模型是对香农、维纳信息论和控制论的发展,有效解释了数据、信息、知识和智慧(思想)之间的关系,它既是一个知识生成的模式,也是一个思考如何进行知识生产和传播的方法论。
洛根在《什么是信息》一书中,还进一步将信息区分为微观信息和宏观信息,微观信息是字符串或符号串,宏观信息是生物有机体、语言和文化,并延伸到技术和经济领域。这个新视角,对指导我们的出版活动具有更直接的理论意义。在符号域中,心灵、语言和文化,一直是人类书写的主体和表达的主题,它们得以以书籍的物理形式出版和传承,而到达信息社会和信息时代,计算机数字技术和通信技术的结合为出版业的发展提供了前所未有的机遇,携带意义的数据和信息与知识和智慧一样成为重要的出版对象,其产品形态以数据和信息数据库为主要出版形式,这是迄今为止出版史上最大的一次出版对象的转移。自20世纪70年代以来,信息内容产业开始兴起,通信网络、互联网提供商、计算机硬件和软件提供商、信息内容提供商共同构建了一个庞大的信息产业,出版商也随之成为信息业的一个组成部分。现在,信息产业所创造的商业价值已经远远超过传统的纸质出版业。
知识是人类历史上符号传递中最重要的传递内容。自文字发明以来,知识是最适合文字符号系统传递的传递内容。回顾一下出版历史,我们很容易得出知识是书籍内容基本构成的结论。在计算机进入出版业之前,我们甚至可以说,一部出版史实际上就是一部知识出版史。从洛根的知识论模型,我们也可以看到电子计算机的影响因子,对数据和信息的深度关注正体现了对计算机语言的高度重视。洛根之后,王维嘉在《暗知识:机器认知如何颠覆商业和社会》一书中将知识区分为明知识、默知识和暗知识三类,也可以推导为人类知识和机器知识两大类。所谓“明知识”,就是人类可以用语言表达或用数学公式描述的知识,也可以称之为“正式知识”,“它们被记载在书籍、杂志、文章、音频等各种媒体上”;“默知识”是只可意会、不可言传的知识,属于“默会知识”,绝大多数的知识无法用语言表达、无法记录、无法传播和积累,如大量的传统工艺和技能;“暗知识”是人类既无法感受也无法表达的知识,属于“机器知识”,是机器从视频、图片或其他场景中萃取的参数集之类的模仿人脑和模仿演化而产生的知识,是机器发掘出来的,人类无法理解和陈述,但机器可以记录并通过网络以光速传递给其他机器。㉝如果从数量上来衡量,尽管人类积累了5 000年的明知识,但其数量却是有限的;其次是默知识;而由各类计算机所产生的暗知识则已经远远超过人类知识。2 000万册纸质书的总信息量相当于20TB,现在每年产生的文字大约为160TB,而每年仅上传到社交平台YouTube上视频的量就大约有157 680TB,各种传感器和计算机监测下所产生的数据和信息量则可达到天文数字。㉞以20世纪40年代末计算机诞生为分水岭,知识开始被区分为人类知识和机器知识,这是知识史上的革命性变革,以出版知识为使命的出版业也可以随之被区分为人工出版和人工智能出版、印刷机器工业出版与计算机数字网络出版、纸质出版和数字出版,这一重大分野应当成为我们重新思考出版符号和出版对象的逻辑起点。
在计算机语境下,知识总是和信息密不可分,知识的概念、定义和内涵与信息、数据也紧密地联结在一起。在计算机数据库和知识库的背景下,知识被定义为:“知识指人们对自然现象的认识和从中总结出的经验,或指以各种方式把一个或多个信息关联在一起的信息结构。”㉟可以说,知识是信息综合处理的结果,信息通过相互比较,结合成有意义的关联,信息是知识的内涵与实体,而数据符号则是信息的外延与形式,数据是表示事物、概念的一种符号,信息是数据所表达的事实,知识是信息经过加工、整理、改造而成的一般概念的信息,因此,“知识是经过消减、塑造、解释和转换的信息”㊱。其实,这个计算机时代的知识定义只是众多定义中的一种,但这个重视关联的定义内涵,我们却可以追溯到知识起源时期的希腊,数学家毕达哥拉斯说“始基和万物皆为数”,柏拉图认为“科学知识来源于洞见理念世界,而这理念世界是由数和形的理念组成的,这就是说,科学认识就在于用数学概念的体系去把握自然”㊲。理念世界是“可知世界”,物理世界是“可见世界”,人类知识就区分为可见世界的意见和可知世界的科学,意见包括信念和猜想,科学包括推理知识和理智直觉,因此,柏拉图认为“知识是一种被证实为真的信念”,而证实的途径靠数学、逻辑、演绎推理、经验和归纳。㊳用数学去把握世界和用数据、数值去建构世界知识,其逻辑思维是统一的,是一脉相承的。
无论如何定义知识,知识作为人类文明的内容传递是确定的。我们从人类的知识传递史和知识的分类史中就可以看到知识传承和传播在人类文明发展中是何等重要。在西方,亚里士多德将知识分为纯粹理性(理论科学,形而上学、数学、物理学),实践理性(实用科学,伦理学、政治学、经济学)和技艺(创制科学,音乐、诗学、建筑)三大类别。17世纪,弗朗西斯·培根(Francis Bacon)将人类科学知识分为记忆科学(历史学、语言学),想象科学(文学、艺术)和理智科学(哲学、自然科学)三大类别。20世纪,罗素将人类知识划分为科学、神学和哲学。而在中国,孔子时代的知识分为六艺,即礼、乐、射(射箭)、御(驾车)、书(文字)、数(技术、技巧、数学)。汉代的知识分为六艺、诸子、诗赋、兵书、数术和方技。隋唐时期,中国的书籍知识分为经、史、子、集、道藏和佛藏。20世纪初,中国的学科知识分为七大类,即“七科之学”(文科、理科、法科、商科、医科、农科、工科)。20世纪70年代,以计算机技术为基础的数据库、知识库兴起后,人类知识被分为叙述性知识、过程性知识、控制性知识、元知识,也被分为对象知识、元知识、进程知识、常识,就知识内容而言分为原理性知识和方法性知识,就知识形式而言分为显性知识和隐性知识,就知识性质而言分为理论性知识和经验性知识,就知识的确定性程度而言分为确定性知识和模糊性知识。2012年,Google推出面向互联网搜索的大规模知识图谱,知识图谱通常将知识分为事实知识、概念知识、词汇知识和常识知识。无论东方、西方,也无论古代、当代,知识一直是书籍最重要的内容。而书籍,正是出版的主要呈现方式。
出版是传递人类符号的中介,在数据、信息和知识之外,人类智慧也是出版传递的重要内容类型。1988年,运筹学家罗素·艾可夫(Russell Ackoff)画出数据、信息、知识、智慧的金字塔知识模型,在此之前,提出类似观点的还有工程师迈克尔·库利(Michael Cooley)和教育家哈兰·克利夫兰(Harlan Cleveland)。艾可夫之后,管理学家维娜·艾莉(Verna Allee)、传播学家洛根又强化了此观点。艾莉在《知识的进化》中又丰富为数据、信息、知识、含义、原理、联合智慧体的学习和管理模型。这个模型中的智慧,毫无疑问成为出版传播中的重要组成部分。但什么是智慧?出版活动中的智慧包括什么类型?这正是需要我们厘清的关键。
概括而言,在出版内容的类型中,某种程度上可以说,在数据、信息、知识之外的都应属于智慧的范畴。但这样的判断过于宽泛而流于空洞。在进一步界定之前,让我们首先明晰一下智慧的概念。汉语中的“智慧”一词,指“辨析判断、发明创造的能力”,也指才智、智谋,最早见于《墨子》:“夫无故富贵、面目佼好则使之,岂必智且有慧哉!若使之治国家,则此使不智慧者治国家也,国家之乱既可得而知已。”㊴此之智慧,既指才智,也指能力。南北朝时期,“智慧”一词也用于梵语“般若”和梵文“阇那”(Mati)的意译,“泛指一切有分析和有决断性的认识能力”,即“具有观察对象和思维分析、断除疑惑的认识能力”㊵。梵文的智慧,指向破除迷惑证实真理的识力和逻辑推理的能力。在古希腊,“Sophia”(汉译智慧)一词的原意指拥有“专业知识”或“技能”,“哲学”(Philosophia)一词由“爱”(philein)和“智慧”(Sophia)构成,本意为“爱智慧”。㊶苏格拉底说:“我假定,智慧使人们变得聪明”,“说人聪明不就是说他们对事物拥有知识吗?”,“那么,知识与智慧是一回事吗?”。㊷被称为希腊“最智慧的人”的苏格拉底并没有解答清楚这个令人疑惑的问题。柏拉图区分了“智慧”和“哲学”,他认为“哲学就是拥有真知”。亚里士多德进一步指出:“智慧是关于某些本原和原因的科学。”㊸他还认为:“智慧既是理智也是科学,在高尚的科学中它居于首位。”㊹哲学不等于智慧,但它却可以是通向智慧的“真实的智慧”;智慧不等于知识,但它却可以是至高的知识;智慧不等于技能,但它却可以是理念的能力。20世纪末,艾莉给智慧的定义是“智慧就是获得和运用知识的能力”,“智慧是看穿事物核心或实质的才能,它是处理知识以抽象出本质的规则和事实的一种高创造力的连接方式”。㊺
基于以上对智慧的理解,结合出版的历史与当下数字出版的现状,我们首先可以将默会知识和技艺性知识列入智慧内容的范畴,其次是哲学和文学艺术类内容,最后将自然科学、社会科学、人文科学中不能用数据、信息和知识表达的内容全部纳入智慧内容。也许这不是一个科学的类分,但它表示了智慧出版内容的丰富性和广泛的适用性。我们应当看到,纸质出版一定程度上限制了默会知识和技艺知识的表达方式,但数字化的声音、视频和虚拟技术,却为今后的智慧出版提供了无限想象空间。
三、出版符号被传递物介质形式
出版活动具有物质性和精神性。作为物质活动,它受时代技术的限制,作为精神活动,它受人的思维能力的限制。如果我们将出版理解为是将一定的符号及内容经过编辑加工复制于一定的载体形成产品并进行广泛传播的行为的话,那么,由符号、内容和载体构成的出版物就是我们通常意义上的出版对象。出版物的物质性、物理状态、媒介形式由制作技术决定,出版物的精神呈现由符号、内容类型、意义价值决定。综合起来,我们认为,出版对象的呈现方式会随着出版技术的发展而出现多形态的特征。自20世纪下半叶以来,随着计算机技术的发明和发展,出版对象的介质和呈现方式发生了天翻地覆的变化。概括起来,自纸被广泛应用之后,其成为出版对象的主流介质,但当下电子介质却异军突起。因此,我们将重点讨论出版介质中的纸质介质和电子介质,纸质介质之前或与纸质介质并存的泥质介质、石头介质、莎草介质、贝叶介质、简帛介质、羊皮介质等略而不论。
具有一定物理状态的纸质书籍已经诞生1 900年。迄今,封装型的纸质书籍依然是全世界读者最喜欢的出版物。纸质书籍之前,还存在其他物理形状的书籍。最早的书籍,是苏美尔人以楔形文字书写在泥板上的泥板书籍,之后有埃及、希腊、罗马人书写在莎草纸、羊皮纸上的莎草纸书、羊皮纸书,以及中国的书写在竹简、缣帛上的竹简书籍和帛书,在南亚还出现了书写在贝多罗树叶上的贝叶书籍。在中国雕版印刷术发明前,书籍的物理形状主要是卷子状,莎草纸书、羊皮纸书、竹简书籍、帛书和写本时期的纸质书籍都是卷子状,泥板书籍是块状,贝叶书籍是长条木夹状。卷子状书籍的规格受制于载体材料,如:“用以书写一卷希腊文学作品的纸草,其单张的尺寸很少(甚至从来不曾)超过13×9英寸,而对于中等档次的书来说,更为常见的尺寸是10×7.1/2英寸。另一方面,袖珍本诗集的纸高可能要短得多。”㊻自公元2世纪,罗马开始出现册子装帧的纸草书籍,主要流行于基督教人群,至公元4世纪,纸草卷子和纸草册子一并让位于皮纸册子。中国自东汉至唐代,纸质书籍的装帧形式一直是卷轴状,唐代末年出现雕版印刷册子装帧书籍,到北宋初中国完成由卷轴装帧书籍向册页装帧书籍的过渡,册页线装是中国书籍的主要形态,一直延续到晚清。15世纪中叶,德国谷登堡发明铅活字印刷术后,西方书籍一直是册页精装。西方在19世纪开始普及纸皮精装书籍,20世纪30年代开始广泛流行纸皮平装书籍,直到今天,精装书籍和平装书籍依然并行。中国自19世纪70年代开始引进西方印刷技术,尤其是石印技术的普及,加速了雕版印刷的衰落,书籍形态也引进了西方书籍的纸皮精装与平装形式,但由于经济等原因,中国的书籍形式一直以纸皮平装为主,进入21世纪,纸质精装书籍渐多。20世纪80年代电子书籍兴起之后,尤其是90年代互联网普及之后,纸质书籍被替代的预言不绝于耳,但实际情况是,纸质书籍非但没有被取代,其出版品种还实现了几何级数的增长。我们可以用数据对比一下。1996年日本出版的纸质新书是63 054种,而2019年是71 903种。㊼1996年美国出版的纸质新书是68 175种,2019年是203 757种。㊽1996年中国出版的纸质新书是63 647种,2020年是213 636种。㊾尽管纸质书籍已经退缩为出版符号所呈现的一种内容载体形式,但我们坚信,延续了1 900年的纸质书籍传统依然会继续发挥它的功能。
与纸质书籍对应的出版符号主要为文字和图像不同,电子书籍对应的出版符号还包括计算机图形、音频和视频符号,因此,电子书籍作为出版符号的一种呈现方式,具有跨符号的综合特征。所谓电子书籍(Electronic Book),就是指“通过计算机或类似设备,以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,并可复制发行的大众传播载体”㊿。电子书籍依赖的最底层技术是电子计算机技术,但电子书籍的诞生实际上是一系列新技术交互作用的结果,这些技术包括电子技术、计算机技术、软件技术、信息处理技术、通信技术、激光技术、自动化技术、材料技术、精密机械技术、印刷技术、互联网技术、数据库技术、多媒体技术等。用数字来表现模拟,用离散来表示连续,将现实世界的模拟变量用大量的连续的二进制0、1的数字化方式表示,用数字表示一切,从而再现现实世界,将此原理运用于表示文字符号、图像符号、声音符号、视频符号,由此而创制出电子书籍。电子书籍与纸质书籍最大的不同是符号信息载体截然不同,纸质书籍的符号信息载体是纸介质,电子书籍的符号信息载体是磁记录介质、光记录介质。磁介质包括软磁盘(FD,Floppy Disk)和硬磁盘,硬盘有移动硬盘和固定于计算机或服务器中的固定硬盘两种;光介质为光盘,包括只读光盘CD-ROM、交互式光盘CD-I、图文光盘CD-G、照片光盘Photo CD、高密度只读光盘DVD-ROM等。在实际的出版活动中,依据内容符号系统的特征,我们将电子书籍分为文本电子书籍、静态图像电子书籍、动态图像电子书籍、声音书籍和综合性的多媒体书籍等。电子书籍与纸质书籍的另一个显著不同是,电子书籍的内容符号载体与阅读终端是分离的,从物理形态上看,电子书籍由内容符号存储载体、传输载体和阅读终端载体三部分构成,存储载体是磁盘或光盘,传输载体是计算机或计算机网络或移动通信网络,阅读终端是计算机屏幕或类计算机屏幕,电子书籍需要三个载体的结合才能完成阅读或观看行为。因此,从阅读终端的角度分析,我们还可以将电子书籍分为离线载体阅读、在线载体阅读和无线移动载体阅读。离线载体主要是FD磁盘、CD-ROM光盘,在线载体主要是在线计算机、在线笔记本电脑,无线移动载体主要是手机、平板电脑、手持阅读器。无论载体介质如何不同,也无论传输通道是计算机、计算机网络或通信网络,有一点是相同的,那就是阅读内容都要通过终端的屏幕,终端屏幕成为我们可视的物理形态。
与纸质书籍相比,电子书籍对内容符号的呈现方式更趋多样化。根据实际出版活动中的产品形式和市场行为,我们将电子书籍分为五个产品系统。一是单一符号系统型电子书籍。单一符号指纯文字符号或纯声音符号,如1991年5月中国出版的第一部电子书籍《国共两党关系通史》就是纯文字符号的,此书150万字,由武汉大学出版社出版,同时出版了纸质印刷版和电子版,电子版可全文检索,以软盘形式呈现。再如1993年1月出版的中国第一张数据光盘《中国企业、公司及产品数据库》也是纯文字符号的。中国20世纪90年代的电子书籍以纯文字符号呈现的方式为主,并且以软盘载体为主,后期大规模的尤其是以PDF格式呈现的电子书籍多转向以光盘为载体。二是多媒体型电子书籍。电子书籍往往综合性同时呈现多种符号系统,如在一个出版物产品中同时出现文字符号、图形设计、图像符号、音频、视频、动画等,构成多媒体、跨媒体或融媒体的产品,多媒体是电子书籍的重要特征。从概念上来说,“多媒体是将不同的媒体种类在个人电脑上融为一体呈现出来”,从产品的角度而言,多媒体“是指基于个人电脑的集文本、声音、图像、动画和图表于一体的出版产品”。多媒体产品可以是离线的,也可以是网络在线的,离线的多以CD-ROM光盘的形式呈现,在线的主要是在互联网上传播。三是互联网型电子书籍。电子书籍的载体可以是软磁盘和光盘,也可以是计算机互联网络,书籍内容符号存储于计算机硬盘或服务器硬盘中。互联网分为计算机互联网和移动通信互联网两类,电子书籍的阅读通过PC端计算机屏幕和智能手机端屏幕实现。计算机互联网的商业应用始于1991年,1994年中国接入全球互联网。电子书籍内容通过互联网传播在2002年被新闻出版总署列为互联网出版,并将互联网出版定义为:“互联网出版,是指互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。”互联网普及之后,迅速成为电子书籍的主要传播载体和渠道,由此也导致了软盘载体和光盘载体的衰落。2007年,苹果公司推出通过移动通信网络来实现无线网络接入的智能手机,从此开启了移动互联网新时代,智能手机端电子书籍进入新的传播时代,手机成为电子书籍阅读最重要的工具,PC端互联网的影响力开始下降。以无线通信技术为基础的手机网络平台,还被学界和业界视为一种新的出版平台,即手机出版平台,手机出版也相应成为一种新的出版业态。四是手持阅读器型电子书籍。电子书籍的阅读和使用必须依赖阅读专用软件和硬件。电子书籍阅读软件的提供商主要是Adobe公司和微软公司,Adobe电子书籍阅读软件以PDF格式为基础,可以下载到各种PC计算机、笔记本计算机、掌上电脑(Personal Digital Assistance,PDA)和专用电子书阅读器上,比微软的阅读软件略胜一筹。像纸质书籍一样可以便捷地拿在手里随时随地阅读,是电子书阅读器开发的动力。1986年美国富兰克林电子出版公司(Franklin Electronic Publishers)研制成功的一种装载《富兰克林拼写词典》(Franklin Speller)的手持电子阅读装置,是世界上第一种手持电子阅读器。之后,SoftBook出版公司推出了类似掌上电脑的第一代硬件Softbook阅读器,NuvoMedia公司1998年推出了Rocket Ebook Reader(火箭电子书阅读器),EveryBook公司推出了EB Dedicated Reader手持阅读器,电子书籍手持阅读器市场逐步成熟。日本的夏普公司、松下电器公司和索尼公司也分别研制并上市了自己的电子书阅读器,但市场效果不佳。2007年亚马逊公司发售的Kindle专用手持电子书阅读器是“史上首次取得商业成功的电子书阅览设备”,2010年苹果公司的平板电脑也成为非常成功的电子书阅读器。目前,与电子书籍一道,电子书阅读器也成为一个产业。五是数字图书馆型电子书籍。传统的以纸质文献为主的图书馆是一个搜集、收藏、整理纸质图书和文献并提供查阅、咨询服务的知识传播实体机构,但自20世纪80年代以来,随着计算机技术、通信网络传输技术、互联网技术、多媒体技术和数字出版技术的发展,信息和知识的采集、处理和传播方式发生了革命性的巨变,传统图书馆开始转向信息资源数字化、信息检索计算机化、信息传输网络化、信息资源利用全时空化、信息服务个性化,数字图书馆开始成型并能提供全球性的平台化服务。所谓数字图书馆,就是“指搜集、存储、组织数字化形式的信息,通过计算机网络提供各种咨询、检索等服务以及传递信息的系统”。数字图书馆自1998年起逐步成为一个技术系统,这个技术系统的解决方案IBM公司将其架构为资料加工生产与获取系统、存储与管理系统、搜索与取用系统、信息传递系统、知识产权管理系统,数字图书馆技术在资源建设和管理、用户信息管理和信息服务方面形成了有别于出版技术系统的新知识管理技术系统。而与此同步,数字图书馆在提供公共信息和知识服务的同时,其性质也开始发生质的变化,一部分数字图书馆依然保留了公共服务性,一部分数字图书馆转向了商业性。电子书籍、多媒体资源、数据库等数字资源成为数字图书馆的数字产品,商业性数字图书馆分为三种类型:一是数字图书馆扮演了出版中介的角色,成为一种出版行为,如将纸质书籍数字化并有偿提供用户服务;二是出版商开发售卖性质的数字图书馆;三是技术提供商或网络运营商聚集内容资源开发搜索或阅读有偿服务。由此,数字图书馆成了一个数字产品,同时它也成为数字出版活动的一个组成部分。
声音符号既是出版对象,也是一种出版呈现方式。作为产品的声音类书籍,其名称还没有获得业界和学界的共识,有的名为“有声读物”“有声书”“有声书籍”,也有人称之为“音频书”“音频书籍”。英文audiobook现在通常被译为“有声书”,美国有声书协会对此词的定义是:“包含不低于51%的文字内容,复制和包装成磁带、高密度光盘或单纯数字文件等形式进行销售的录音制品。”由此,有声书从载体上可以分为磁带型、光盘型和网络数字型三种,前两种是有形的,后一种是在线的,但它们都是电子技术的产物,属于可以用声音表达的电子书籍形式。而在此之前,有声书的源头是唱片。最早的有声书可以追溯到1931年美国盲人基金会和美国国会图书馆联合推出的“有声书计划”,主要是小说,录制为时长20分钟的唱片供盲人使用。1963年,荷兰飞利浦公司研制成功全球首盘盒式磁带,1970年第一盘120分钟的磁带诞生,1971年Advent公司发售201型磁带机,录音和播放器成本和高保真质量大为提高。20世纪70年代,有声书开始流行。20世纪90年代,CD光盘型有声书开始流行。1997年,Audible.com推出世界上第一款面向大众市场的数字听书播放器,数字有声书开始走向市场。2010年后,有声书市场突然出现爆发式增长。2010年,美国有声书出版品种数为0.62万种,2015年达到了3.56万种。2017年,美国有声书出版数量达到4.6万种。世界出版50强的大众出版集团是美国有声书出版的主力,如企鹅兰登书屋、西蒙&舒斯特公司、哈珀·柯林斯出版公司的有声书销售增幅都超过了20%。中国的有声书发展也超过了世界发展水平,“艾媒咨询《2018—2019中国有声书市场专题研究报告》数据显示,2018年中国有声书用户规模达到3.83亿,预计将在2020年达到5.59亿人”。2018年市场规模达到46.3亿元。目前,出版、生产和传播有声书的企业主要有三类:传统出版社或集团,如中国出版集团、中信出版集团等;数字阅读平台加入听书功能或新建听书平台,如掌阅听书、阅文听书、咪咕阅读、QQ阅读、微信阅读、百度阅读、网易云阅读等;新兴听书平台,如懒人听书、得到、十点课堂、樊登读书、喜马拉雅FM、蜻蜓FM、荔枝FM等。作为数字时代电子书籍的一个品类,有声书为纸质书籍和原创电子书籍内容转换为声音产品提供了可能并已经实现这一可能,有声书已经成为出版产业新的经济增长点。
以视频方式呈现纸质书籍内容,在计算机数字化时代已经成为现实。与有声书的书籍形态相对应,视频书的概念呼之欲出。所谓视频书,我们可以将其定义为:以二进制数字化方式记录、存储和编辑加工制作的具有一定长度和主题集中的、在计算机网络或通信网络传输、传播的动态影像内容。简言之,视频书是数字化的动态影像的书。一定长度是相对于短视频而言的,我们认为,无论什么形式的书籍,均需要主题和长度,如纸质书籍要求不低于49个页码,那么,视频书的时长应当不低于30分钟,也就是说长视频以上才可以称得上为书。关于视频长短的界定,一般将5分钟以下列为短视频,6—30分钟为中视频,30分钟以上为长视频。一种视频书,我们认为是长视频的形式,它可以由大量短视频和中视频构成,也可以由一定数量的长视频构成,与一部纸质书籍由若干章节构成同理。当前中国出版的视频书,均是由数量不等的长、中、短视频组成的,如2018年人民出版社出版的《不朽的马克思》,是纸质书和视频书同时出版的,纸质书为平装16开,视频以二维码的方式印于书尾,读者用手机扫描二维码即可观看视频,视频共有37集100分钟。换言之,我们也可以说短视频是视频书的重要组成元素。短视频的发达是视频书的起点和基础。短视频应用最早出现在美国,2011年第一款短视频制作应用软件Viddy问世,“用户可通过Viddy拍摄短片并添加音效和特效美化功能,最后剪辑成视频短片在社交平台分享”。美国三大社交平台迅速跟进,Twitter推出Vine短视频应用App,Facebook推出Instagram短视频分享软件,YouTube推出MixBit视频分享软件,短视频随即爆火。中国的短视频用户和分享数量在很短的时间内即成为全球第一,2021年短视频用户规模达9.34亿,爱奇艺、优酷、腾讯视频居于行业头部位置。短视频的快速发展,为视频书的开发奠定了内容和素材基础,但从出版的实践活动看,视频书还不是一个成熟的出版门类。随着5G、6G时代的到来,长视频将成为主要的传播场景,视频书的时代才可能真正到来。视频书将会朝三个方向发展:一是纸质书籍的视频化,这是初级阶段;二是原创视频书兴起,出版者按照书籍的主题和逻辑制作视频书,同时也可以还原为纸质书籍,进入融合出版阶段;三是课程化视频书崛起,将各门类知识制作为长视频的课程,形成以视频形式存在的课程式的独立产品,课程将成为视频书的主流,这是视频书最重要的方向,进入场景化出版阶段。
数据库作为数据、信息、知识和智慧的呈现方式,并且成为一个出版活动,完全依赖于计算机技术的发展。20世纪60年代中期数据库技术产生,历经第一代层次和网状数据库系统、70年代第二代关系数据库系统、80年代面向对象数据库系统三个发展阶段。按照提供数据的性质,数据库分为文献数据库、数值数据库、事实数据库和多媒体数据库;按照数据库内容分为综合性数据库、专业性数据库和专题性数据库;按照数据库载体类型分为磁带数据库、磁盘数据库、光盘数据库和联机数据库。与出版最直接关联的是文献数据库,其主要分为两类:“一类是收录了论文、稿件等的目录事项或摘要等,所谓二次信息的文献参考(reference)数据库;一类是收录了数值、图像、影像、声音、图书以及论文、稿件等文献全文(fulltext)的事实(信息源)数据库。”1961年1月,美国化学会《化学文摘》服务社创办的新杂志《化学题录》(双周刊,一年24期)同时出版纸质印刷版和磁带版,此磁带版被视为世界上第一种电子出版物,此题隶属于二次文献性质,具有数据库雏形。1964年,美国医学图书馆利用计算机对《医学索引》(Index medicos)进行排版并将数据转换到磁带上形成机读数据,此数据库通常被视为最早的计算机数据库。此后,美国的《化学文摘》《生物学文摘》《工程文摘》《科学引文索引》等计算机数据库建立。二次文献型数据库自此进入出版领域。全文数据库出现稍晚,1973年“美国米德公司建成世界上第一个面向公众查询的大型全文数据库Lexis”,自此,全文数据库成为全球文献数据库的发展方向,并成为数字出版的重要门类。中国的数据库开发稍晚于美国,1980年,中国化工信息研究所开始研究和建设第一批中文数据库,至1991年,“全国共建成800多个数据库”。1992年,北京大学发行英文版《中国对外经济贸易法律全文数据库》光盘,这是我国第一个CD-ROM全文数据库。1993年,中国第一家数据库专业公司“万方数据公司”成立。2000年,原万方数据(集团)公司由中国科学技术信息研究所联合中国科技出版传媒有限公司、科技文献出版社等组建成立北京万方数据股份有限公司,推出万方数据知识服务平台、万方医学信息服务平台、万方数据中小学数字图书馆、万方视频知识服务系统等数据库产品,万方公司成为中国最重要的数据库出版公司之一。作为一种出版形式,数据库出版已经覆盖到出版物的各个门类,也已经覆盖到社会科学、人文科学和自然科学的各个学科,甚至延伸到了人类生活的各个方面。
在出版符号和内容呈现上,数据库不仅仅是一种呈现方式或出版形式,更重要的是它还是技术和工具。数据库可以作为独立的电子产品被销售给机构和客户,同时,它还为计算机互联网(PC端互联网)和通信互联网(移动端互联网)上的应用平台(App)提供后台技术支持,如后台数字内容管理系统(Content Management System,CMS)、数字资产管理系统(Digital Assets Management,DAM)、数字权利管理系统(Digital Rights Management,DRM)等均属于数据库技术的范畴。平台是一个用户界面,各种应用程序(App)是一个个不同程度的用户界面(平台),这些平台只有通过后台的数据库技术管理才可以实现应用。应用层面的搜索引擎、信息检索、决策工具、咨询服务、一对一解决方案、个性化服务等均依赖数据库技术,数据库实际上是数字出版的核心基础和底层技术。在出版活动的实践层面,三大领域的出版商,其数字内容、平台、服务和应用无一不通过后台数据库技术来实现。专业出版领域,出版商一方面直接提供书目、索引数据库和全文数据库,一方面搭建在线数字平台提供检索工具、研究工具、决策工具和解决方案,如励讯集团的ScienceDirect数据库在线平台,“收录了自然科学、社会科学、医学类别下22个学科的2 500多种期刊以及数千种图书、1.2万多个视频、超过170万张图片等”。此数据库既是全球最大的全文数据库,也是在线的一个信息查询和信息服务平台。在教育出版领域,出版商同样通过直接提供在线海量信息资源库和推出在线平台提供一系列教与学服务,尤其是在个性化学习和一对一学习解决方案方面,教育出版商更需要通过网站和教学平台来实现。如培生集团的EQUELLA(数据库)是一个“专业的教育内容数字在线仓库”,MyLab是基于互联网的在线学习和辅导工具,Pearson Learning Solutions在线平台“是为用户解决学习过程中各种需求和问题的个性化学习解决方案”。在大众出版领域,出版商更偏重于建立自己的电子书资源库和有声书资源库,直接在自己的平台上分销,而原创网络文学平台则选择了直接搭建终端阅读平台,将作者创作的文学作品放在平台上供用户在PC端、手机端、平板电脑端直接阅读或听取,二者的后台都需要一个数据库来支撑。大众出版的这两种数字出版模式,前者以企鹅兰登书屋为典型,后者以阅文集团的起点中文网为代表。由上可知,数据库出版这种形式已经渗透到数字出版的各种形态之中。
总体而言,进入印刷时代,出版介质主要是纸介质;进入计算机时代,出版介质进入磁介质、光介质和纸介质并用时代,而出版物(书籍)则相应以纸质书、电子书、有声书、视频书、多媒体书、数据库形式呈现。
四、结语
综合以上论述,我们认为出版对象由出版符号系统、被传递物内容类型和内容载体介质三要素构成,反过来说,符号、内容和介质共同构成了出版对象。出版对象就是由一定的符号系统表达一定的内容并承载在一定的介质之上,呈现出不同形态的出版物。构成出版物的三个要素缺一不可。譬如,汉代司马迁的《史记》一书由作者书写在竹简上,他书写的符号系统是文字,被文字传递给后人的内容是历史知识,符号、知识和介质共同构成了《史记》这本书。纸被发明之后,其内容被重新书写在纸上。雕版印刷术被发明后,其内容又被雕版印刷在纸上。石印、铅印、数码印刷机被发明后,其内容又被机械印刷机印刷在不同的纸上。计算机被发明后,其内容又以二进制的数字方式被存储于计算机并被转换到不同屏幕上而成为电子书,其内容还被数字化为有声书、视频书,以及被制作为数据库以供检索和研究。无论《史记》这本书的形态如何变化,但构成它的符号、内容和介质要素必须是完整的。然而,在实际的出版活动中,我们看到的往往是变化,出版符号系统在变化,内容类型在变化,载体介质在变化,这些变化都不同程度地来自技术的发明、发展和应用在出版对象的演进中起到了关键性的作用,技术影响到了符号系统的变化、内容类型的变化和载体介质的变化,由此也决定了出版对象的物理形态和呈现方式的变化,进而,所有的变化都影响到出版活动的意义和利益获得。作为业界中人,我们必须随着出版对象的变化而变化,必须找出出版对象变化的规律,必须理性地动态定义自己的出版行为,厘清这些变化正是我研究出版对象的目的所在。也许,也是意义所在。
注释
① 卡西尔.符号形式的哲学[M].赵海萍,译.长春:吉林出版集团股份有限公司,2018:216.
② 卡西尔.人论[M].甘阳,译.上海:上海译文出版社,1985:41,42,35.
③ 马祖尔.人类符号简史[M].洪万生,洪赞天,英家铭,等译.南宁:接力出版社,2018:2.
④ 见https://www.MerriamWebster.com/dictionary/symbol,查询时间为2022年8月22日。
⑤⑩ 霍克斯.结构主义和符号学[M].瞿铁鹏,译.上海:上海译文出版社,1987:129,139.
⑥⑦⑧ 彼得里利,蓬齐奥.打开边界的符号学:穿越符号开放网络的解释路径[M].王永祥,彭佳,余红兵,译.南京:译林出版社,2015:28,5,28.
⑨ 冯月季.传播符号学教程[M].重庆:重庆大学出版社,2017:3.
⑪ 费希尔.书写的历史[M].李华田,李国玉,杨玉婉,译.北京:中央编译出版社,2012:30.
⑫ 光复书局大美百科全书编辑部.大美百科全书[M].台北:光复书局企业股份有限公司,1990:380.
⑬ 胡易容.图像符号学:传媒景观世界的图式把握[M].成都:四川大学出版社,2014:82.
⑭ 余凤高.插图的历史[M].北京:中国文史出版社,2020:8.
⑮ 凯夫,阿亚德.极简图书史[M].戚昕,潘肖蔷,译.北京:电子工业出版社,2016:184.
⑯ 夏野.中国古代音乐史简编[M].上海:上海音乐出版社,2010:75.
⑰ 姜夔.姜白石词笺注[M].北京:中华书局,2013:4-5.
⑱ 孟伟.音频媒体研究[M].北京:光明日报出版社,2020:2.
⑲ 熊澄宇.媒介史纲[M].北京:清华大学出版社,2011:153.
⑳ 琼斯.新媒体百科全书[M].熊澄宇,范红,译.北京:清华大学出版社,2007:474.
㉑㉒ 李幼蒸.历史符号学[M].桂林:广西师范大学出版社,2003:283,283.
㉓ 百度“数据”词条,由“科普中国”科学百科词条编写与应用工作项目审核。
㉔㉗㊱ 《数据库百科全书》编委会.数据库百科全书[M].上海:上海交通大学出版社,2009:11,662,848.
㉕ 大数据战略重点实验室.块数据2.0[M].北京:中信出版社,2016:39.
㉖ 霍尔姆斯.大数据[M].李德俊,洪艳青,译.南京:译林出版社,2020:7.
㉘ SHANNON C E.A mathematical theory of communication[J].The bell system technical journal,1848,27(3):379-423.
㉙㉜ 洛根.什么是信息:生物域、符号域、技术域和经济域的组织繁衍[M].何道宽,译.北京:中国大百科全书出版社,2019:23,41.
㉚㊲ 周昌忠.西方科学方法论史[M].上海:上海人民出版社,1986:438,13.
㉛ 中国大百科全书出版社编辑部.中国大百科全书(简明版)[M].北京:中国大百科全书出版社,1996(10):5441.
㉝㉞ 王维嘉.暗知识:机器认知如何颠覆商业和社会[M].北京:中信出版社,2019:20-31,25.
㉟ 何守才.数据库综合大辞典[M].上海:上海科学技术文献出版社,1995:180.
㊳ 肖仰华.知识图谱:概念与技术[M].北京:电子工业出版社,2020:15.
㊴ 方勇.墨子[M].北京:中华书局,2015:63.
㊵ 任继愈.佛教大辞典[M].南京:江苏古籍出版社,2002:1182.
㊶ 先刚.柏拉图与“智慧”[J].学术月刊.2014(2):49.
㊷ 柏拉图.柏拉图全集[M].王晓朝,译.北京:人民出版社,2003:(2):656.
㊸ 亚里士多德.亚里士多德全集(7)形而上学[M].苗力田,译.北京:中国人民大学出版社,2016(7):29.
㊹ 亚里士多德.亚里士多德全集(8)尼各马科伦理学[M].苗力田,译.北京:中国人民大学出版社,2016(8):127.
㊺ 艾莉.知识的进化[M].刘民慧,等译.珠海:珠海出版社,1998:83-85.
㊻ 凯尼恩.古希腊罗马的图书与读者[M].苏杰,译.杭州:浙江大学出版社,2012:111.
㊼㊽ 罗紫初.比较出版学[M].武汉:武汉大学出版社,2006:60,60;魏玉山.国际出版业发展报告:2020版[M].北京:中国书籍出版社,2021:370,17.
㊾ 中国出版年鉴1997[J]1997:8;中国出版年鉴2021[J].2021:836.
㊿ 张立.数字出版学导论[M].北京:中国书籍出版社,2015:24.