《图书馆行业条码》标准应用解读
2019-11-05陈攀董曦京
陈攀?董曦京
摘 要 《图书馆行业条码》 (WH/T 74-2016)标准适用于各级各类图书馆,其特点是在条码信息中加入了所属机构标识符,便于被标识对象的权属识别。本文介绍了该标准的功能,与图书馆原有条码及RFID技术的兼容性,以及各种条件下的应用方法。
关键词 《图书馆行业条码》条码 RFID 图书馆标准化
分类号 G250.7
DOI 10.16810/j.cnki.1672-514X.2019.09.013
Interpretation of the Standard Application of Bar Code in Library Industry
Chen Pan, Dong Xijing
Abstract Bar Code in Library Industry (WH/T 74-2016) is applicable to all kinds of libraries at all levels. Its characteristic is that the identifier of the affiliated institution is added to the bar code information, which facilitates the identification of the ownership of the identified object. This paper introduces the functions of the standard, its compatibility with the original bar code and RFID technology of the library, and its application methods under various conditions.
KeywordsBar Code in Library Industry. Bar code. RFID. Library standardization.
0 引言
隨着图书馆数字化、智能化技术的发展,图书馆界越来越多人把研究目光投向高新技术,而对于传统技术手段的改进却缺乏热情。20世纪80年代,条形码技术的普及对我国图书馆自动化起到的巨大推动作用。时至今日,条形码仍然是现代图书馆馆藏管理的必要技术手段,但我们对其原理及应用的研究却早已湮没在当今技术发展的热潮中。对于大多数图书馆来说,这项技术的存在就像空气一样理所当然。然而,随着图书馆的不断发展,当前,条形码的使用模式已经无法解决图书馆许多的业务问题,如馆藏条码唯一化问题、识读效率问题等。因此,许多图书馆转而求助于新的识别技术,例如RFID技术,甚至有人认为条形码可以完全被RFID技术替代。笔者认为,RFID作为一种识别技术,更多解决的是识读方式的变革,但是对于需要被识读的数据内容本身,仍要站在图书馆人的立场上进行研究探讨。由此看来,我们不但不应抛弃条形码技术,更要通过我们的研究,让这项经典技术换发新的活力。本文旨在通过新版《图书馆行业条码》的解读,与图书馆从业人员共同探讨图书馆条形码的未来应用趋势,同时也给图书馆馆员带来一些新的启发。
1 行业条码标准简介
《图书馆行业条码》(WH/T 74-2016)[1]标准于2016年4月发布,是专为图书馆及相关行业设计的二维条码标准。1995年,文化部发布的《图书馆行业条码》(WH 0501-1995)标准推荐使用库德巴码或三九条码作为基础码,但由于其未能解决行业条码码制控制(实际应用码制超过6种)、条码数据格式编码规范化、馆藏条码编码唯一化、馆藏权属识别系列等重要问题。2013年,文化部标准化机构对其应用实效评估后建议重新修订[2]。2016年,新标准公布,同时宣布旧标准废止[3]。本次发布的图书馆行业条码标准采用快速响应矩阵码(QR码)[4]作为基础码,具有安全性高、兼容性好、功能完备等特点。新的行业条码标准由于选用了二维条码,编码结构比一维条码要复杂一些,可以承载更多的数据,实现更复杂的功能。笔者期望通过对新标准应用规则和数据编码的介绍,让准备选用该标准的用户可以顺利实现从一维条码到二维条码的转换,以及与RFID技术的平稳对接。新行业条码标准具有如下特点。
(1) 统一了图书馆行业条码的基础码制及用户数据编码规则,引入了国际标准化行业AFI及ISIL,提升了图书馆行业条码的管理水平,改变了图书馆长期以来使用多种一维码制,编码规则自定义、互不兼容的局面。
(2)具备所属机构标识符,可实现馆藏标识唯一化。新世纪以来,图书馆RFID技术规模化应用为馆藏所属识别问题的解决树立了非常好的典范,基于该技术实现的读者自助式服务可以在无工作人员干预的情况下安全、准确地完成馆藏权属及馆藏条码的识别,排除非所属馆资料或其他行业资料。图书馆RFID标准中包含“所属机构标识符”(Owner Institution Identifier)数据元素,即业界通称的“馆代码”[5]。本标准在设置数据元素时,引入了所属机构标识这一概念,以实现行业内馆藏标识唯一化。
(3)可与图书馆现行的一维条码、RFID系统兼容使用。RFID技术的先进性得到图书馆业界普遍认同,但是由于受RFID设备投入、系统管理维护、标签寿命等因素影响,众多图书馆权衡自身实际需求和条件后,继续选择使用条码。同时,RFID技术并没有导致条码退出图书馆应用,图书馆RFID体系中仍然将条码作为馆藏及书架标签的基本数据保留使用。本标准具有良好安全性和兼容性,无需对现行的图书馆管理系统做出结构性修改,用户可选择与一维条码及RFID系统并行使用。
2 数据元素及数据结构
标准设置了11个用户数据元素,分别是前缀标识、应用类别标识、附加数据标识、对象标识校验方式、对象标识编码类别、对象标识数据长度、所属机构编码标识类别、所属机构编码标识数据长度、对象标识数据、所属机构标识数据、附加数据。
在数据编码时,这11个数据元素被编入四个数据段。如表1所示,第一数据段为参数数据区,是定长字段,全长4个字节,采用比特位编码,包含8个指示及控制参数,用于指示条码的应用类别,有无附加数据,采用何种校验方式,对象标识参数,所属机构参数等属性。如表2所示,第二数据段开始是实体数据区。第二数据段编码对象标识数据,是变长字段,用于馆藏条码(或读者证条码,馆藏架位标识等)数据,采用ASCII字符集编码。第三数据段编码所属机构标识,是变长字段,用于标明所属机构(馆代码),采用ASCII字符集编码。第四数据段编码附加数据,是变长字段,用于标明用户自定义数据,采用通用文字字符集(UTF-8) 编码。
2.1 参数数据
2.1.1 前缀标识
前缀标识用于条码预识别,条码识读器对不符合标准前缀标识的条码将停止译码作业,以排除非图书馆行业的条码。在当下社会二维条码无处不在的环境下,设置前缀标识可提高条码识读的安全性和作业效率。
标准引入了图书馆RFID技术中的应用族标识(Application Family Identifier,AFI) 作为前缀标识编码。AFI是一段单字节代码,在ISO/IEC 15962中(C2)HEX被分配为图书馆专用。条码前缀标识选用国际标准代码值,有利于标准的国际化推广,具有前瞻性。
2.1.2 应用类别标识
应用类别标识指示此条码的用途,采用3比特位二进制编码,有8种编码冗余。该数据元素参考图书馆RFID标准中应用类别标识的设计理念,使标准不仅适用于馆藏文献,也可用于编码读者卡、馆藏架位信息,以及图书馆设备等,如:
主馆藏标识 (101)2
读者证号标识(110)2
馆藏架位标识(111)2
图书馆其他物品标识(100)2
……
2.1.3 附加数据标识
附加数据标识用于指示条码是否含有附加数据,采用1比特位二进制编码,(0)2为无附加数据,(1)2为有附加数据。采用QR码作为基础码大大提升了图书馆条码的数据容量,因此本标准增加了可由图书馆自定义的附加数据区,各馆可根据实际需求选用。
2.1.4 对象标识校验方式
对象标识校验方式是指原有图书馆一维条码的校验方式。采用4比特位二进制编码,有16种编码冗余。图书馆在前期一维条码的应用中选择了对条码数据加校验位或不加校验位,在本标准中仍可继续保持其校验方式的选择。
其中,无校验编码(0000)2可以是用户数据无校验位,也可以是不对外公开采用何种校验方式。采用其它校验方式和字串编码(不对外公开),又在合作体内要求校验或拆分解析字串编码的用户,可选择标准已占用编码以外的剩余编码。
2.1.5 对象标识编码类别
对象标识编制类别用于指示对象标识(馆藏条码)的编制机构类别。采用3比特位二进制编码,有8种编码冗余,如:
单一图书馆集成系统内 (101)2
图书馆合作体内 (110)2
国家(区域)层面 (111)2
SGTIN-96 (011)2
ISO 28560-4 UII (100)2
……
對象标识编制类别参数可为系统提示用户主馆藏标识数据的编码方式,以便于系统数据按标识的类别分段解析。除各馆自定的编制方式外,还有区域合作体、国际编制标准等类别,如ISO 28560-4 UII、SGTIN-96等。SGTIN-96由EPC组织提出,可将ENA等国际物品标准化编码形成RFID平台的新物品标准化编码[2]。馆藏唯一标识符UII由ISO组织提出,用于超高频RFID标签编码,在ISO 28560-4:2014中有详细叙述[6]。未来,这些编码标准或被用于图书馆馆藏唯一标识符,标准中需预留编码。
2.1.6 对象标识数据长度
对象标识数据长度用于指示对象标识中的ASCII字符个数,即数据占用字节的个数。编码采用十进制数转5比特二进制编码,最大编码长度冗余31位。一维条码长度通常在20位以内,此编码冗余量可满足一般对象标识符的设置。
2.1.7 所属机构标识编码类别
所属机构标识编码类别标识用于指示对象标识的编制机构类别,即“馆代码”的编制机构类别。采用3比特位二进制编码,有8种编码冗余,如:
国际标准所属机构标识ISIL (101)2
国家统一所属机构标识 (111)2
行业统一所属机构标识 (110)2
合作体定义所属机构标识 (100)2
……
标识推荐采用ISO 15511图书馆及相关组织国际标准化标识符(International Standard Identifier for Libraries and Related Organizations,ISIL)[7],该标准规定ISIL编码不大于16位ASCII字符。如果用户前期已采用区域、行业、合作体等定义的馆标识,则需按照指定的类别加以标识。
2.1.8 所属机构标识数据长度
所属机构标识数据长度用于指示“馆代码”编码的ASCII字符个数,即数据占用字节的个数。编码采用十进制数转5比特二进制编码,最大码长度冗余31位,可满足一般馆代码的冗余量设置。
2.2 对象标识数据
对象标识数据是指图书条码、读者证条码、馆藏架位条码等数据实体,是可变长字段,最长为31位ASCII字符。对象标识数据一般来自于原馆藏(或读者证)的一维条码,在编制本标准条码时对其数据可直接采用。对于原一维条码中定义的子字段属性仍继续由图书馆主系统相关程序处理,本条码编码不对其做解析处理。
2.3 所属机构标识数据
所属机构标识数据(馆代码) 是可变长字段,最长31位ASCII字符。增加“馆代码”是规范行业条码使用的重要基础,是解决各馆间条码重码的有效手段,是本标准的核心功能要素之一。
2.4 附加数据
附加数据是最后一个数据段,用以满足不同用户的自定义条码编码需求。采用通用文字字符集(UTF-8)编码,为可变长字段。一般情况下不建议用户使用附加数据,使用时该数据区内数据元素也不宜设置过多,数据段内各元素之间用“;”分隔。作为一种数据传输工具,附加数据段可携带如载体类型、题名等数据。选用UTF-8字符集主要考虑到国际互借业务中各国文字需要。实际上,ASCII字符集是UTF-8字符集的子集,一般情况下馆代码及原一维条码应用的字符都限定在ASCII字符集内,而第四数据段附加数据中如使用各国语言文字,则需采用UTF-8字符集编码。
3 关于基础条码选择的说明
《图书馆行业条码》(WH/T 74-2016)标准综合考虑了被选基础码的技术性能、编码灵活适用性、条码阅读设备对所选条码的覆盖率、条码印制方便等各方因素,选择QR码作为基础码,并对编码模式、纠错等级、印刷格式等问题做出说明。在QR码编码过程中,需经过数据分析、数据编码、纠错编码、构造最终信息、在矩阵中布置模块、掩模、生成格式和版本信息等步骤。图书馆在应用并印制条码时需确定3个QR码自身主要参数。
3.1 编码模式
《快速响应矩阵码》(GB/T 18284—2000)标准(以下简称“QR码标准”)中定义了4种编码字符集:数字型数据、字母数字型数据、8位字节型数据(ASCII字符集)、中国汉字字符。同时,提供了8种编码模式供用户选择,包括:扩充解释(ECI) 模式、数字模式、8位字节模式、字母数字模式、中国汉字模式、混合模式、FNC1模式、结构链接模式等,并设置了对应参数。用户需选定相应参数,以便将编码模式参数信息编制印入条码[4]。
本标准选择QR码标准中提供的8位字节模式作为基本编码模式,为保证行业条码编码格式的一致性,各馆不能修改此参数。此种模式用于表示ASCII字符集,其编码密度为每个字符8位(bit)。本标准中所有用户数据均以8位字节的形式被编码,记入条码中。条码被识读输出后,数据由用户终端的应用软件按本标准解码。
3.2 符号版本
QR码的符号规格在21×21模块到177×177模块之间,对应版本号1到40,每个版本号比前一个版本号每边增加4个模块。在本标准中,由于实体数据均为变长字段,条码数据量不确定,因此未对QR码符号版本做出规定,用户可根据实际需求对照QR码标准进行设置。QR码标准中规定,在没有预先规定所采用的符号版本时,编码将默认选择与数据相适应的最小版本。如果用户可以接受较低的纠错等级,则同样的数据也可以用更低的符号版本表示。
3.3 纠错等级
QR码标准中提供了4个纠错等级,分别为L、M、Q、H四种,对应的纠错容量(可恢复的码字比例)为7%、15%、25%、30%。本标准推荐使用纠错等级是“M”级。在QR码标准中,“M”级被认为是“标准”等级,具有较小尺寸和较高的可靠性。由于条码数据量的不确定性,本标准允许用户根据需要提高此参数等级。本标准中推荐了无附加数据情况下的二维条码印刷尺寸。在确定符号版本—纠错等级的条件下,用户可根据需要按比例增大条码打印尺寸,这样可提高条码耐用性、机器识别率,以及对二维条码上下部印刷字符及中央区嵌入图案的识别。条码具体印制要求参见QR码标准。
4 关于条码编码的说明
4.1 ISIL编码
ISIL标准是ISO组织根据图书馆RFID技术应用需要而制定的国际标准,在图书馆RFID标准中规定“所属机构标识符”应采用符合ISIL格式规定的、由各国或地区专职机构管理注册的“所属机构标识符”。ISIL标识符的显著特征是带有两个拉丁字符国家前缀及短横线“-”,如中国地区编码前缀为“CN-”。在我国图书馆RFID标准(GB/T 35660.1-2017)中,对ISIL编码有明确规定[8],各馆可参照执行。如果用户采用的是各行业(如教育、科研等)、区域、合作组织内的自定义馆代码,其在图书馆RFID标准中对应的数据元素是“备选所属机构”,用户不可在编码前加国家前缀。本条码标准中的数据元素“所属机构类型”用于指示馆代码的编制类别,采用的代码类型(如ISIL、国家统一标识、行业统一标识、合作体定义标识等) 应与RFID标签中相应数据元素的设置保持一致。
4.2 条码数据的校验
在既往图书馆一维条码应用中,为保证数据传输准确性,部分用户采用了含校验位条码,其条码字符串的最后一位为校验位,例如对数字字符条码加模10校验,对字母数字(ASCII字符集)条码加模43校验。在本条码标准中用户可沿续原有带校验位的数据编码串格式,校验与否以及采用何种校验由用户自定。原馆藏条码校验位设置与本标准中QR码校验无直接关系,标准仅在参数数据段中为其设置了指示参数,便于原一维条码系统按其标识校验方式进行校验。对自定义或超出可标识的校验方式设为系统默认校验方式(1011)2,也可标识为(0000)2,不公布其校验方法,外部系统按照无校验条码加以识别。关于是否采用一维条码校验位,本文推荐在图书馆合作體中,有数据远程传送的需求,以及对数据可靠性要求高的用户,可对对象标识数据采用校验。
4.3 条码译码效率
从工作效率上看,一般一维条码在阅读器读取后基本无需再译码,输入客户端后直接向集成系统发送。本标准的二维条码译码解析处理程序比一维条码要复杂一些,需经前端客户端解码处理后才可向图书馆集成系统发送,但比起RFID标签数据译码解析程序要简单得多,而且当下客户终端计算机性能普遍较高,因此用户不必担心二维条码的译码效率问题。
5 在图书馆系统和RFID系统中的应用模式
5.1 在独立系统中应用本标准条码
如在独立系统中仅使用本标准条码,条码中馆代码与对象标识符均为单一定长格式,则在流通系统中,条码译码程序可直接采用取子串方式截取馆代码与对象标识符数据,对条码前缀AFI识别与否均可,这样可简化程序。从系统供应商角度出发,为保持程序的一致性,也可采取全程序译码:首先,读取前缀标识AFI,若非图书馆行业标识则中止后续操作;然后,解析馆代码与对象标识符长度参数,采用取子串方式截取馆代码与对象标识符数据;如果提示有附加数据,则继续读取附加数据字段。
5.2 馆内一维、二维条码并行使用
若并行使用两种条码,必须采用一维、二维条码兼容型阅读器。对原一维条码仍维持原系统程序,馆员需查看馆藏章后再扫条码继续流通作业。对二维条码采取全参数程序译码,系统首先读取前缀标识,符合识读条件则继续解析馆代码与对象标识符长度参数,采用取子串方式截取馆代码与对象标识符数据,如果提示有附加数据,则继续获取附加字段数据。各馆在并行使用两种条码时,可选择旧馆藏不更换原一维条码,新馆藏采用二维条码;也可选择对旧馆藏进行回溯,加贴二维条码,原一维条码转码嵌入二维条码中。推荐有开架流通需求的文献使用二维条码,以适应读者自助服务的需求。
5.3 在图书馆合作体中应用本标准条码
以往图书馆合作体构成的核心要素是合作体内馆藏一维条码编码唯一化,格式统一化,所有馆藏均处在同一系统管理之下。如果合作体加盟馆与合作体条码格式不一致,或原一维条码与合作体条码出现重码,则这个加盟馆的馆藏要全部重贴条码,这是图书馆自由合作的一大障碍。
本标准二维条码提供的馆藏权属识别功能,使各图书馆互不兼容的管理系统间的流通合作成为可以尝试探索的新课题。除此之外,建立一个具备严格权限管理的高效流通作业交换服务器系统,也是解决合作体条码唯一化的关键要素。该系统需根据每件馆藏的财产所属权切换终端流通作业的对应系统链接方向,流通终端从主服务器获得准入馆代码信息存放于数据字典中,用于流通作业时的馆藏权属比对。由此各合作馆可以继续保持其馆藏条码编码格式、各自不兼容系统的独立运转,图书馆选择加盟和退出合作组织在技术上更加容易实现。
5.4 在RFID系统中的应用模式
在RFID自助流通服务系统中,馆藏条码不直接参与流通作业,馆代码识别由RFID标签识读实现。因此,图书馆加贴本标准二维条码不会对现有RFID系统产生直接影响。图书馆如采用本标准条码,只需将馆藏加贴与RFID标签馆代码标识一致的二维条码即可,不存在与RFID系统兼容障碍的问题。另外,由于RFID标签寿命有限,很多具有一定规模的图书馆仅在部分开架和外借文献上应用了RFID技术,而在闭架库藏文献上没有使用。这种应用模式下,可参考一维、二维条码并行应用的方式,对闭架旧馆藏延用一维条码,新馆藏采用二维条码,条码识读器使用一维、二维条码兼容式设备;开架自助服务环境下,建议逐渐实现馆藏二维条码替代一维条码使用。
从应用现状看,使用RFID系统的图书馆似乎无需将原馆藏一维条码替换为本标准二维条码,但从未来发展趋势看,图书采购、配送、加工等工作环节将逐渐从独立模式向中心服务模式转变,采用本标准条码将有效提高工作效率,降低差错率。在粘贴RFID标签时,如果采用了本标准条码,可减少人工设置馆代码等信息的步骤,直接从条码中读取相应数据。另外,如果标签信息错误,更换二维条码的成本也远低于更换RFID标签的成本。
6 结语
图书馆一维条码已使用了近半个世纪,本次《图书馆行业条码》(WH/T 74—2016) 标准的发布标志着图书馆行业条码应用从1.0时代进入2.0时代。条码编码及识读方式与图书馆服务质量及系统信息安全密切相关。本条码标准既解决了一维条码无法解决的馆藏权属识别问题,又可顺利与RFID技术对接,承上启下地实现了新老技术协同发展。图书馆业目前已与世界各行业共同步入智能时代,过往非智能的应用方法应该被智能化方法所取代,图书馆信息系统的管理者应当重视图书馆行业条码标准带来的新契机,积极推动图书馆行业条码标准化进程。
参考文献:
中华人民共和国文化部.图书馆行业条码:WH/T 74—2016[S].北京:国家图书馆出版社,2016.
董曦京.图书馆行业条码数据模型标准化方案研究[J].国家图书馆学刊,2015(4):51-58.
关于发布行业标准《图书馆行业条码》的通知 [EB/OL].[2018-09-30]. http://zwgk.mct.gov.cn/auto255/201605/t20160517_474876.html?keywords=.
中国物品编码中心.GB/T 18284-2000快速响应矩阵码[S].北京:中国标准出版社,2001.
ISO28560-1:2014 information and documentation-RFID in libraries-part 1: data elements and general guidelines for implementation[S/OL].[2018-09-30].http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=65203.
ISO 28560-4:2014 information and documentation-RFID in libraries-part 4: Encoding of data elements based on rules from ISO/IEC 15962 in an RFID tag with partitioned memory[S/OL].[2018-09-27].https://www.iso.org/standard/62311.html.
ISO15511:2011 international standard identifier for libraries and related organizations(ISIL)[S/OL].[2018-09-27].https://www.iso.org/standard/57332.html.
中国国家标准化管理委员会.信息与文献图书馆射频识别(RFID)第1部分:數据元素及实施通用指南:GB/T 35660.1-2017[S].北京:中国标准出版社,2017.