如何进行内容资源数字化建设
2014-07-16姜占峰
姜占峰
内容资源数字化是出版业实现数字化转型升级过程中的基础性工作。笔者结合人民交通出版社(以下简称交通社)5年来内容资源数字化建设的具体实践,围绕“选择哪些资源数字化”“怎么数字化”及“如何做好保障”三个核心问题,对如何有效开展内容资源数字化工作提出思路和解决方案。
一、统筹规划 确立建设目标
出版企业要从用户需求出发,结合本单位实际,确立内容资源数字化建设目标。即:用户导向,统一思路,明确重点,厘清职责,形成资源采集、加工、存储、管理和发布一体化的数字资源建设业务流程,为产品开发、销售和用户服务奠定基础。
按照这一思路,交通社确立了适应本单位实际的内容资源数字化建设目标,并重点在规范数据加工、制定加工标准、做好资源规划和严格资源管理4个方面做好基础工作。通过市场比价和竞争性谈判,出版社确定了5家定点数据加工厂商,自主研发了元数据标准、存储标准和结构化标准,制定了排版厂上交电子文档规范格式和内容资源管理办法,确定了资源建设的重点、核心和切入点,提高和规范了数字内容资源的质量。
通过近5年的数字化加工,交通社已积累建设8000余种可直接面向用户提供阅读服务的高品质电子书、120余万个交通专业词条等高质量的数字内容资源,开发推出了数据库、U阅通等数字产品,上线了悦通网、交通标准服务网等数字出版平台。
建立内容资源矩阵是比较好的资源建设规划方式,有利于出版企业梳理资源现状,明确建设路径和切入点。
二、量力而行 明晰建设路径
1.明确资源获取途径
在开展资源数字化之前,出版企业应首先对本单位现有数字内容资源的存放环境、数量、质量(完整性、准确性、及时性)、格式及存在的问题等,进行排查、梳理和总结。在此基础上,通过以下4种途径来进行内容资源建设:
(1)自主建设:主要通过对存量资源的外包数据加工和增量资源的外包开发制作两种方式完成。
(2)作者提供:借助协同编辑系统,从选题策划开始到交稿的全过程,由作者提供相关内容素材,并取得授权。
(3)外部购买:从满足资源的完整性、权威性需求出发,通过版权交易方式,购买相关内容资源。
(4)交换引进:通过虚拟积分、信用等级等方式授予用户一定的资源使用权,换取用户上传资源,并取得授权。
2.选取适合的切入点
(1)能较快产生效益的资源可优先。具体包括可直接产生经济效益的资源、间接为纸质图书做增值服务的资源、可以提升图书产品竞争力的资源、能满足用户一定需求的资源。
(2) 数字化工序容易的资源可优先。包括制作原版原式数字内容资源、收集数字化素材、易于拆分的内容资源。
(3)核心的、重点的资源可优先。包括企业独有的有充分竞争力的资源、有常销价值的资源、符合战略发展方向的资源。
(4)基础好的资源包可优先。包括电子文档保存质量高、完整、版本新、版权无争议且易于维护更新的资源。
交通社在选择数字内容资源建设的切入点上,以数字出版项目建设为抓手,把重点放在最核心的资源建设上。
3.制作适用的数字内容资源
(1)优先满足用户的需求。从用户需求角度出发,满足用户对产品功能的需求。
(2)确定适合的数字化加工颗粒度。针对不同资源类型,结合用户需求,分别加工成双层PDF、单层PDF、XML、试题、条目等不同类型的数字内容资源。
(3)根据用户阅读需求,确定要加工的数字内容格式,分别加工成PDF、EPUB、MOBI、TXT、video、movie、tif等不同格式的内容资源。
三、规范实施 确保建设质量
1.资源建设,标准先行
资源数字化之前,要注意建立或选择相应的元数据标准、分类标准、知识体系、加工标准、排版文件与封面文件交付标准、质量标准、存储标准、结构化标准、数据架构标准(DTD)和资源管理标准等,作为数字化加工的规范要求。
2.分类标引,规范加工
(1)对已制作完毕的数字内容,按专业属性进行分类和标引工作。
(2)对不同种类数字资源提出对应的技术加工要求。如要把图书数字化加工成双层矢量PDF文件,技术要求如下:
像素:彩色图片不低于600dpi,普通黑白图片或灰度图片不低于 300dpi;
纠偏:校正的图像允许的倾斜度不大于1度;
去污:干净、整洁和美观;
识别准确率:差错率不高于万分之三;
完整性:源文件统一,避免缺页少页多页现象;
一致性:页码顺序100%正确,文本和图像对应一致等。
(3)在数字化加工前,针对不同种类内容资源,应确定不同的元数据规范。主要包括:图书元数据、目次元数据、作者元数据、文章源数据、单页元数据、附件元数据、脚注元数据、图片元数据、视频元数据、音频元数据、参考文献元数据、管理元数据、表格元数据、公式元数据等。
3.细致检查,严格验收
对存量资源进行数字化,应在规定的抽检范围内就文字、图像、关联关系、版式文件、流式文件等存在的差错进行计算,并对交付的以下数据资料的完整性、准确性进行检查,最后形成质检验收报告。包括:原始资料、加工规格、加工质量、加工周期、交付方式、交付日期、存储介质、命名规则、数据实体、交付报告、交付清单、交付接收单、质检报告等。
4.人员齐备,制度保障
出版企业在数字化转型过程中,首先要配备的人员就是资源数字化专职人员,包括资源建设管理人员、质量检查人员及验收人员。同时,还应建立相应的管理制度,包括电子文档管理办法、内容资源管理办法、资源建设合同管理办法、数字加工厂商管理办法、内容资源管理办法等。
当然,在内容资源建设过程中,还一定要注意加工的内容资源要求版权有效、内容权威、内容更新及时等。数字化后的内容资源,像食品一样有保质期。若无法在一定时间内形成服务能力,则投入资源数字化的时间、精力和金钱很可能就付之东流。因此,选择用户需要的、有效益的、核心的和易做的资源数字化,应是出版企业在实现数字化转型升级过程中首要做好的基础工作。(作者单位系人民交通出版社)