图书内容数字化的实践与思考
2017-08-22曹昳
曹昳
摘 要 随着社会经济不断发展,信息资源在现代社会发展中的重要地位愈发突出,相应提高了对于图书内容数字化及相关服务的实际要求。图书数字化是现代信息技术在图书出版领域应用的结果,经过多年的发展,已经具有数字图书、数据库出版物以及数字报纸等多种数字化图书形式,极大地促进了我国数字出版产业的发展。但就我国数字出版产业整体发展现状而言,其仍处于起步发展阶段,尚未形成系统、完善的技术模式和出版体系,还需加强对相关技术、手段的研究。笔者从图书内容数字化入手,详细分析了数字化图书出版的编辑加工流程,并以此为基础提出几点思考和想法,以供相关人员参考。
关键词 图书数字化;数字出版;思考;实践
中图分类号 G2 文献标识码 A 文章编号 1674-6708(2017)191-0071-02
随着科学技术不断发展,现代信息技术在各个行业领域有着越来越深入、广泛的应用,就图书出版领域而言,基于现代信息技术的数字出版模式,从根本上突破了传统图书出版模式的束缚,提高了图书信息资源的传播速度和共享效率,更加契合当前社会经济发展的实际需求。但由于我国数字出版产业的起步发展相关较晚,其技术手段和出版体系尚未完善、健全,以往积累的图书资源也有待进一步的开发和利用。因此,从当前数字出版的编辑加工流程入手,探讨相应的图书数字出版技术要点,并加强对数字出版产业的未来发展思考,具有重要的现实意义。
1 数字图书基本内涵分析
数字图书就是数字化处理后的图书产品,就数字化产品而言,数字图书出现的时间较早。从图书内容编辑加工的角度分析,数字图书和传统图书的编辑加工流程具有较高的相似性,二者的差异性主要表现在传播和阅读方式方面。受数字出版技术及资金成本等因素限制,目前数字图书的编辑加工,主要是在传统图书内容资源基础上进行的,大体可分为内容编辑和数据上传两部分内容,具体操作流程如图1所示。
2 数字图书基本编辑加工流程分析
内容编辑加工工作在图书内容数字化过程中占据重要地位,其工作流程主要分为内容审核、格式转换以及后期加工3个阶段。
2.1 内容审核阶段工作概述
内容审核工作的重点在于对文化传播的审查控制,图书出版所传播的文化知识,应符合健康、科学的出版要求。在实际审核工作过程中,需保持工作的严谨性和一致性,无论是新书书稿或是已经进行出版的纸质书电子稿,都需要对其思想性、政治性以及科学性进行审核和评估,严格落实相关审核标准和要求,以确保数字图书出版质量。
审核人员在稿件审核过程中,应保持客观、严禁的审核态度,对于稿件内容中存在的汉字差错、内容差错、数字用法错误、标点错误、单位与量的错误、表格错误等错误进行校对和整改。对于专业性的图书文献而言,如医学类图书,在审核过程中,需加强对相关计量单位和医学数据的审核,以确保专業性图书的内容正确性和严谨性。另外,此类图书的校对工作应尽量交付于专业人员进行,以确保相关审核标准的有效落实。
2.2 内容格式转换阶段工作概述
格式转换的工作对象主要是已经出版的图书资源,具体是指在相关格式要求基础上,对已有数字化内容的开发或转让。格式转让可有效提高出版资源的有效利用率,同时降低数字出版成本。现阶段,图书原版输出是应用最为广泛的数字转化技术,即电子图书和纸质书具有相应的内容和板式。从格式转化工作实施的角度分析,正方书排班软件是应用最多的格式转换软件,本文即以此为基础,就其文件转化PDF的技术操作方法和常见问题,进行了分析和谈论,具体内容如下:
1)使用方正书版进行发排,将纸质图书转变为CEB格式,再使用阿帕比阅读软件进行打印输出,即可获得较快的转化速度。但从阅读终端的角度分析,选择此类转换方式,容易导致字体乱码、图片显示错误等问题。
2)使用方正文杰系列进行打印输出,将图书内容资源打印为PostScript格式,再使用Acrobat Distiller完成转化输出。一般来说,这种转化方法多用于图书书页数少于300页的图书资源转化中,如图书书页数超过这一数值,其数值越大,则需要耗费的输出时间越长。另外,由于这种转化的过程较为复杂,其对于计算机的硬件配置有着较高的标准要求,同理强化计算机硬件配置,也可达到缩短转化时间的目的。
3)使用方正文杰系列进行打印输出,将图书内容资源打印为PostScript格式,再使用PDF Creator完成转化输出。这种转化方式所涉及的应用软件均为方正系列转化软件,故而具有较好的兼容性和可操作性,有效提高了图书资源的格式转化效率,但其最终生成的文件的兼容性较差。此外,选择这种转化方法,也容易导致阅读终端出现字体乱码等问题,后期问题解决较为繁琐。
2.3 后期加工阶段工作概述
后期加工阶段的工作以解决格式转化阶段工作出现的问题为主,具体问题解决措施如下:
2.3.1 字体、缺图问题解决措施分析
在后期加工过程中,字体、缺图等问题主要依靠PDF Factory Pro等虚拟打印机技术解决,在二次打印输出前,需对打印尺寸、图片分辨率等参数进行设置,以确保图片、字体的正确显示。
2.3.2 输出文件问题解决措施分析
输出文件问题具体表现为PDF文件打不开、PDF文件较大以及翻页速度慢等问题。针对此类问题主要借助PDF、Adobe、Acrobat等编辑软件中的“PDF优化器”或“减少文件大小”等功能解决,进而完成对文档大小的调整
2.3.3 其他问题解决措施分析
后期处理加工其他问题包括纸质书与电子书目录不一致、版权与封面不完整、文件打不开、以及阅读显示问题等。在后期加工过程中,编辑加工人员需确保万分之一以下的综合差错率。此外,针对医学类图书等特殊图书资源,还需重点加强其细节处理,以确保正常的阅读显示。
3 内容上传环节概述
数字出版需通过数字平台数据库,完成图书内容及信息的数据上传,在平台数据库中图书资源主要以二进制编码数字的形式存在。现代互联网技术支持下,平台数据库具有良好且广泛的受众群体,既可以是普通消费者,也可以是企业。与传统出版模式相比,数字化出版平台的信息传播速度更快、复制成本更低,且具有更加人性、便捷的检索服务,可提高图书资源的有效利用率。在實际操作过程中共,需组织专人负责图书资源的上传管理工作,除及时解决数据上传过程中的各类问题外,还需对图书信息反馈机制进行完善,进而优化不同部门主体的信息沟通。
4 关于图书内容数字化的几点思考
4.1 加强技术平台建设
就电子出版产业运行现状而言,其涉及的软件主要有排版类软件、输出类软件以及后期制作类软件等,不同类别的软件中具有多种不同的选择,其优缺点各不相同,在实际操作过程中,较难依靠一个系列的软件,完成所有的图书数字化出版工作。同时,受不同软件间的兼容性问题影响,在图书数字化过程中,较容易出现各种编辑加工问题,影响数字图书质量,降低图书数字化出版效率。
因此,加强技术平台的建设意义重大,需要借助技术平台功能的完善,规范图书数字出版流程,使其形成系统的技术体系,进而提高数字出版管理的科学性和有效性,降低编辑加工成本,提高图书数字化综合效益。
4.2 统一格式标准要求
统一化的格式标准要求,是图书电子出版产业良性发展的重要基础。目前,常见的电子书阅读存储格式超过20种,不同的存储格式在支持软件、资源加工等方面存在不同的标准要求,不仅给消费者带来了巨大的下载、阅读不便,同时繁杂的内容加工操作,也导致了巨大的资源浪费。以PDF格式电子书为例,其在计算机设备中可以正常进行阅读,但在手机等小型智能移动终端中,受设备的屏幕尺寸限制,就无法达到理想的阅读效果。
因此,需要对电子书的格式进行统一的标准要求,以简化电子书加工流程,促进电子图书更加广泛的传播和应用。
5 结论
综上所述,我国电子出版产业应从当前的图书编辑模式入手,加强对技术平台和标准规范的发展研究,以不断优化图书数字化产业流程,简化图书数字化加工难度,进而促进电子出版产业的进一步发展。
参考文献
[1]单晓巍,陆小新,画恒等.图书内容数字化的实践与思考——以“沪版图书内容数字化”项目(二期)建设为例[J].科技与出版,2012(5):62-64.
[2]李芬林.对《四库全书》研究成果数字化的思考——甘肃省图书馆创建“《四库全书》研究资源数据库”的理论与实践[J].图书馆理论与实践,2012(8):16-19.
[3]王以俭,张炜.“绍兴电视图书馆”建设的实践与思考[J].国家图书馆学刊,2013,22(3):36-39.
[4]杨璠.数字出版产业链创新途径探索——基于流程再造视角[J].新闻传播,2014(15):166.
[5]李立.万国鼎农史数字图书馆构建的实践与思考[J].西北农林科技大学学报(社会科学版),2015,15(1):140-145.
[6]柏红梅,林岚.海南省图书馆虚拟参考服务应用及思考[J].情报理论与实践,2013,36(1):90-93.