浅谈ONIX标准及其应用
2016-06-22唐贾军
唐贾军
我国CNONIX应用示范工作取得较为瞩目的成效,逐步形成了从试点到示范,再到全行业推广的格局,为下一步产业化推广奠定了基础。
ONIX(在线信息交换)为ONline Information eXchang的缩写,是一种以电子形式描述、传递和交换丰富出版物产品信息的国际性标准,包括《ONIX for Books》(图书在线信息交换)、《ONIX for Serials》(连续出版物在线信息交换)、《ONIX for Publications Licenses》(出版许可在线信息交换)、《Licensing Terms & Rights Information》(许可条款和版权信息)等多项标准。《图书在线信息交换》是第一个,也是目前在全球应用最广泛的ONIX标准,我国的《中国出版物在线信息交换》(以下简称“CNONIX标准”)采用的就是《图书在线信息交换》标准。
所有的ONIX标准均基于XML,支持出版供应链参与各方对实体出版物和数字出版物元数据进行计算机与计算机之间的交流。有必要强调的是,ONIX本身并不是数据库,也不是一种应用软件,只是为数据库之间的数据交流提供了一种标准的方式,为组织数据储存提供了一种标准的XML技术模板,这对理解ONIX标准非常重要。
一、图书ONIX标准制定背景
图书ONIX标准的出现是为了解决两个问题而研制的:
第一是更丰富的在线图书信息的需要。互联网的发展和网上出版物销量的增加,大量的实体书逐渐被网上图书网页所取代,研究证明顾客拥有更多出版物的网上信息,就越可能购买,这信息包括音频、视频信息。出版者困惑于如何迎合书商的需求,以及如何提供信息给潜在购买者有关出版产品的信息。
第二是大型图书批发商和零售商使用的元数据资料有各种各样不同的格式需求。如美国英格拉姆公司、鲍克公司和亚马逊,都有各自不同的数据接受格式时,使得出版商同多种贸易伙伴格式化和交换图书信息时费力费时。而传统出版界一直没有严格的贸易标准可供依循,特别制定的ONIX标准能使图书产品信息传输标准化,提供的XML工具让批发商、零售商及在供应链的其他相关单位能够以电子方式接受ONIX传送而来的信息。
1999年,美国出版者协会(AAP)提出开发一种产品信息标准,旨在让各个出版者能以一致的格式发送丰富的产品元数据给零售商,特别是开展网上零售业务的电商。2000年5月,图书ONIX1.0正式面世,由欧洲的EDItEUR、美国书业研究集团BISG、英国的书业交流会BIC负责维护更新。该标准以XML语言作为交换语法形式,通过特定的文件类型规则来定义字段属性,并有指引手册详述每一字段的标准定义,是一套专业性较强的标准技术规范。2001年发布了图书ONIX2.0,2009年4月重要的图书ONIX3.0发布,ONIX3.0可以对数字产品进行全面和连续的描述,提高了数字产品的处理能力,并且数字产品被作为ONIX范畴中的“核心”元素来对待。
图书ONIX3.0经过几年的修改、完善,已经发展到ONIX3.0.2,配套的代码表基本以每三个月更新的速度公布到了第26期。据了解,截至2014年底ONIX3.0以前的所有版本将不再提供技术支持。
二、图书ONIX主要内容及应用
图书ONIX标准每个版本的发布都会提供一个经过不断完善的核心文件《图书产品信息格式规范》及其配套的不断升级的代码表,多样的XML工具(如XSD schema 、RNG schema 和DTD)及ONIX标准应用指南、长短标签转换工具和大型ONIX文件分解工具等也随着图书ONIX标准的发展可以在国际EDItEUR官网上下载获得。
图书ONIX看上去既庞大又复杂,原因在于它所需描述的产品太过复杂,产品元数据十分丰富,必须满足不同市场产品供应链中的不同生产商和经销商的各种需要。在核心文件《图书产品信息格式规范》里包括了消息头描述部分和产品记录本身,其中产品记录的开始部分是一些记录元数据的元素(或称“管家”),其余部分由产品描述(数据块1)、产品营销(数据块2)、产品内容(数据块3)、产品出版(数据块4)、相关资料(数据块5)、产品供应(数据块6)六个数据块组成,每个数据块里又包括了一个或一个以上的经过编号的数据组。其中数据块1到5只能出现一次,数据块6则可重复。
在一个完整的ONIX产品记录中,数据块1和数据块4最好能够出现,数据块6至少出现一次。换言之,一个完整的ONIX产品记录应该至少能够对产品进行描述、说明谁是出版者,并且针对一个或者一个以上的市场提供供应细节。在实际操作中,发送一个完整的产品记录时,没有数据块2的情况非常少见,因为对于大多数采用图书ONIX交换数据的用户来说,丰富的营销附属内容的传递十分必要。当然,在持续更新时,ONIX产品记录可以仅对相应的数据块进行更新,而不用全部内容更新。
各国国家小组负责ONIX标准在本国的应用推广和技术支持,并编写相关应用指南,如美国国家小组BISG的元数据委员会在其最佳实践指南中就规定了ONIX字段的31个核心元素,包括题名、著者、出版商及主题代码等。日本国家小组JPO-FBIC在建议提供的50条新书数据条目中要求至少提供21条必要信息。
对于那些想开始发送图书ONIX信息的出版者来说,有三种选择:自行开发或委托制作定制软件;购买第三方产品数据管理系统;签约使用一种基于web的服务,该项服务支持在线数据输入,并将ONIX输出的信息发送给指定的接收者。这三种选择的可用性和实际操作性因国家的不同而不同。
在实际应用中,出版领域与图书情报部门就元数据的最佳使用也进行了积极探讨,如2009年3月,世界著名的联合编目中心OCLC举办了“出版者与图书馆员学术研讨会”(Symposium for Publishers and Librarians),主题是对图书元数据的讨论,会后发布了白皮书,名为《简化图书元数据工作流程》(Streamlining Book Metadata Workflow)。这里的元数据指的就是ONIX及MARC标准,白皮书重点分析了图书供应链中元数据创建、交换与使用的现状,以及未来的机会,指出图书供应链中元数据的利益相关人,也就是拥有图书元数据的机构,包括出版社、元数据供应商、批发商、书商、国家图书馆、本地图书馆与Google。得到的结论是,出版界和图书馆界有必要由两个不同领域研究在分享元数据的方式上如何均质化(homogenize)。未来的机会,包括标识符(identifier或译为识别码)、主题表及最佳实践14条建议。这对我国未来推广使用ONIX标准并与参与国际书业贸易流通有着很好的借鉴作用。
三、图书ONIX标准对书业的重要影响
图书ONIX标准为出版供应链各方所起的促进作用显而易见。对于出版者而言,有两个重要的商业利益,一是可以利用ONIX这种标准的信息交换格式,将丰富的产品信息轻松地发送到供应链各参与方: 批发商、发行商、大型零售商、数据集成商以及各有关公司。二是通过提供这种产品记录的内容和结构模板,促进内部信息系统的优化,进一步整合各种用于描述和推广新书作品和重版作品所用到的元数据信息,而且相同的核心数据还可用来制作促销清单、书目以及其他宣传促销材料。
对于中下游供应链中的合作伙伴来说,ONIX标准可以让他们以更快的速度将最新产品信息上载到面向客户的服务系统中,既降低了数据制作成本,又减少了手动干预程度,降低了出错风险。
经过长期实践,图书ONIX标准已成为世界范围内广泛应用的书业产品与贸易标准,极大地提高了书业供应链管理效益和信息共享程度,为出版物发行建立了国际通用的信息交换标准,解决了行业各机构间信息交换多种数据格式并存的困扰,因而得到欧美主要发达国家如美国、英国、德国、荷兰、加拿大、法国、意大利、澳大利亚及亚洲的中国、日本、韩国等20多个国家的大力支持和广泛采用。
四、我国引进并积极推广图书ONIX标准
我国新闻出版业正处于完善体制改革,实现机制创新、技术升级和生产方式转型的重要时期,传统出版和发行方式正遭遇新技术、新媒体、新的传播渠道的挑战。因此,必须将标准化和信息化作为进一步提高产品质量、服务和管理水平、工作效率,促进事业发展的重要手段。基于图书ONIX标准在全球书业上的重要影响,结合我国出版发行业迫切需要解决出版物产品信息共享的现实问题,全国出版物发行标准化技术委员会(以下简称“全国发行标委会”)依据采标政策,在国家新闻出版广电总局的指导下,于2009年向国家标准化管理委员会提出拟采用国际图书ONIX3.0标准,制定我国CNONIX国家标准的项目申请,11月底获得批准,列入2009年第二批国家标准制修订计划。项目主要承担单位为中国出版集团公司、浙江省新华书店集团有限公司、中国建筑工业出版社、中国科技出版传媒股份有限公司、人民邮电出版社、上海世纪出版股份有限公司、中国标准化研究院、中国电子技术标准化研究所等。
2010年7月,CNONIX标准制定工作正式启动。为保障CNONIX国家标准制定的顺利进行,贯彻实施走出去战略,2011年,经国家新闻出版广电总局同意并报外交部批准,全国发行标委会作为中国国家工作组代表正式加入ONIX标准维护管理机构EDItEUR国际组织成为会员,并参加了国际ONIX国际指导委员会(ISC),积极争取国际ONIX标准的表决权、话语权。
2013年6月和12月,CNONIX行业标准和国家标准分别获得国家新闻出版广电总局、国家标准化管理委员会的批准。其中CNONIX行业标准为方便使用,共分为三个部分,于2013年8月举行了首发式,国家标准于2014年7月1日正式实施。出版的CNONIX标准保持国际图书ONIX标准数据元素、代码表架构不变,屏蔽了ONIX发展的痕迹和不合国情的数据元素,申请增加了适应我国国情的代码。
CNONIX标准不仅是出版物发行标准体系中基础核心关键标准,而且对加快出版与科技的深度融合、构建现代出版供应链体系、推动新闻出版产业转型升级具有重要意义。标准制定完成后,全国发行标委会委托北方工业大学启动了配套的标准实施指南编制工作,2013年3月双方共同成立了“中国ONIX标准应用研发联合实验室”,作为我国在线信息交换标准的技术研发基地,积极组织业内有关单位参与标准应用示范项目申报和研究工作,开展大规模的宣贯和培训工作,加强标准的应用推广和全面普及。2014年1月,全国发行标委会又邀约业内具有一定影响力和代表性的12家出版发行单位、技术公司作为CNONIX标准应用与推广战略合作单位,战略合作单位在“提供信息、数据交换、应用研究、推广示范”等方面积极发挥本单位的组织优势、资源优势,为实现我国书业数据信息的管理、整合、共享与分析,搭建“走出去”战略国际化信息通道做出了有益探索。
通过借鉴国际通用和成熟完善的图书ONIX标准,结合我国国情,CNONIX标准实现了图书产品数据信息的一次制作、多次多方应用,其对新闻出版业的重要影响不言而喻。2013年,加强CNONIX标准的应用推广被列入了国家新闻出版广电总局新闻出版改革发展当年重点工作内容之一,2014年3月,国家新闻出版广电总局与财政部文资办联合发文《关于推动新闻出版业数字化转型升级的指导意见》,支持CNONIX国家标准的应用推广工作被列为2014年度文化产业发展专项资金申报项目的首项工作内容。
按照总局数字出版司的“统一标准、统一工具和统一平台”的三统一建设原则,2014年12月,CNONIX国家标准应用示范工作正式启动。示范工作开展以来,取得了一系列的进展。目前,各示范单位围绕着标准进行了出版端系统改造、出版与发行环节数据采集、加工与交换、规范化数据整理等工作内容;各技术服务商完成相应工具的改造与研发,并在行业内进行部署;遵循CNONIX国家标准,应用示范工作相继推出了一系列项目标准,指导具体工作的实施;2014年至2015年,行业内已有十三家单位获得财政文资办有关CNONIX标准应用的资金扶持,拨付补贴达1.37亿元,撬动企业资金3.5亿元。至此,在我国,CNONIX应用示范工作取得较为瞩目的成效,逐步形成了从试点到示范,再到全行业的推广格局,为下一步产业化推广奠定了基础。
(作者单位系全国出版物发行标准化技术委员会)