APP下载

中文名称规范控制发展历程及启示*

2022-02-17陈辰杨幸然宋琳琳

大学图书馆学报 2022年4期
关键词:标目标准规范编目

陈辰 杨幸然 宋琳琳

1 引言

图书馆规范控制思想最早由卡特在20世纪初提出,我国规范控制工作起步较晚,在20世纪80年代才正式开始对规范控制进行研究,与一些国家相比还有较大的差距,但通过我国图书情报学界和业界40多年的研究和实践也取得了较大成绩,发展过程中不乏理论前沿探索者和实践先锋。系统梳理我国名称规范控制的发展历程,有助于掌握名称规范控制工作的发展规律和趋势,为探索面向未来的规范控制转型发展策略提供理论和现实依据。

文献调研显示目前尚缺乏专门针对我国名称规范控制发展历程的全面、系统研究,仅有几篇成果零散分布于相关研究之中。如林明曾将国际规范控制发展历程分为萌芽、试验、蓬勃发展和变革四个时期,基于国家图书馆和北京大学图书馆等在20世纪80年代初期开始实施西文文献编目规范控制的事实,将我国名称规范控制的起步实施纳于国际规范控制的蓬勃发展阶段,但没有着力探讨我国名称规范控制的发展,尤其没有涉及我国20世纪80年代之前规范控制思想研究[1]。胡媛则从规范控制实践操作层面,以1995年国家图书馆中文名称规范控制组成立为起点,将中文名称规范控制发展分为维护和制作(或奠基发展阶段)、跨越式发展和积累提升阶段,但该研究只涉及名称规范实践操作层面,不包括理论探讨、标准规范在内的名称规范发展历程的全面梳理[2]。刘峰峰和孙更新将我国民国时期至今的编目发展历程分为初创、发展、繁荣及深入发展时期,探讨了作为编目工作内容之一的规范控制研究和实践发展情况,由于编目发展是其研究的主线,对于规范控制并未着力梳理[3]。

可见,已有研究将我国名称规范控制发展历程置于编目领域和国际规范控制大发展背景中,只涉及名称规范控制理论或实践发展的某一方面,缺少对规范控制理论、标准规范和实践发展的全方位系统梳理。基于此,本文从理论研究、标准规范和实践发展三个维度对我国名称规范控制发展情况进行全景式扫描,总结名称规范控制发展演化特点和趋势,在立足于历史和现实的基础上,提出对我国名称规范控制未来发展的几点启示。

2 我国名称规范控制发展历程

通过检索中国知网、万方和维普等数据库,结合相关的网络、会议文献,获取与中文名称规范控制密切相关的理论成果、标准规范等资料,在对这些成果进行梳理分析的基础上,根据名称规范控制的发展现状、时间特征、主题特征等要素将其分为四个发展阶段:思想酝酿(20世纪80年代以前)、起步实施(20世纪80-90年代)、稳步深化(21世纪00年代)和变革探索阶段(21世纪10年代以后)。

2.1 名称规范控制思想酝酿阶段(20世纪80年代以前)

在20世纪80年代我国正式开展规范控制工作之前,我国古代文学作品创作、目录学发展及早期的著录条例中早已蕴含参照思想,这对于日后规范控制方法体系形成和实践影响深远。

(1)参照思想方法的运用

规范控制中指引读者从目录或其他检索工具中的某一标目查找另一标目,或在目录中提供关于某一事项的说明方法,即为参照法[4]。参照法揭示事物间的对照关系和参考性说明,西汉司马迁创作的第一部纪传体史书《史记》,其人物形象塑造即应用了参照方法,如将同一人物的事迹分散在不同的地方,并在相关类目中标明名目,以此集中揭示某一人的事迹,阅读时可互相参照[5]。西汉末年刘向、刘歆父子编纂的《别录》《七略》,在其创立的著录法中除编有内容提要外,也利用了互见和别裁方法,对具有两个或两个以上主题的图书,适当在两个或两个以上类目进行分类著录,并互相参照。唐代欧阳询等人编纂的综合性类书《艺文类聚》在体例方面也运用了参照法,当某个资料与两个类都有关系时,在其中一个类下略引该项资料,并在其下标注指引作者参阅另一个类目下的详细资料,以“事具**”的形式表示其参见功能[6]。

如上述作品在使用参照方法上是无意识的,那么元末马端临的《文献通考·经籍考》则被认为是真正最早、有目的地运用参照互著方法著录图书的作品[7]。清代目录学家章学诚在《校雠通义》中,针对书籍中有“易淆”和“相资”情况,明确提出了利用互著别裁的系统理论和方法在两个或多个类目中分别著录。

由此可见,我国古代文学作品和目录学中包含的互著、别裁等参照思想,揭示了事物之间的关系并进行参考性说明,与规范控制中包含的参照法有异曲同工之妙,所以我国规范控制在工作开展之初虽引进了西方的思想方法,但也绝非产生于偶然,而与我国源远流长的文化整体观孕育有不可割裂的关系,对于我国名称规范控制的思想酝酿影响深远[8]。

(2)早期著录条例中的参照思想

早期著录条例中标目形式的确定和“参见片”的规定,体现了规范控制思想的萌芽。1961年由全国第一中心图书馆委员会、西文图书卡片联合编辑组编写的《西文普通图书著录条例》,规定了西文图书主要以著者作为著录标目,个别情况根据图书特点,以政府机构和机关团体、学术会议和书名等作为标目,标目格式包括对著者标目的顺序、生卒年以及编者和译者作为标目情况的详细规定。此外,在“著录著者事项的规定”中,详细规定了对各种名称形式的“见片”(又称“参见片”或“参照片”),对于笔名和真名的规定,原则上如果有笔名的著者,要查出其真名作为著者标目,笔名则作“见片”[9]。

此阶段虽没有形成独立的规范文档,也没有专门的“标目法”对规范控制工作进行系统阐述,但著录条例中标目形式的确定和“见片”参照系统的出现,早已体现了“标目法”的思想并意识到规范控制在书目工作中的重要性,这为规范控制的起步实施奠定了重要基础。

2.2 名称规范控制起步实施阶段(20世纪80-90年代)

规范控制研究和实践在20世纪80年代开始起步并逐步实施,以国家图书馆1982年开始着手进行西文文献规范控制工作为标志,经过近20年的摸索,产生了一批具有影响力的理论成果,并积累了一定数量的规范文档,本部分即从理论研究、标准规范以及实践探索三方面对名称规范控制发展情况进行阐述。

2.2.1 规范控制理论研究

(1)规范控制概论研究

主要普及规范控制概念、原理和方法等,学习和借鉴国外先进的规范控制工作经验,代表性研究者有黄俊贵、熊光莹、王知津、周升恒等,如熊光莹在1989年系统研究了规范控制的意义、概念、过程、规范记录创建等问题,是所查最早的系统研究规范控制问题的文献[10]。王松林和田书格等对国外规范控制的发展概况进行了系统介绍[11-12]。这些研究作为我国名称规范控制理论研究的开山之作,对于相关人员系统了解规范控制内容,提高对规范控制重要性的认识,推动规范控制实践应用具有重要奠基意义。

(2)“主要款目”存废和标目选择之争

研究者对主要款目之争产生的历史背景和不同特点进行剖析,对是否需要“主要款目”进行了集中探讨[13]。其中黄俊贵认为“主要款目”是手工编目时代的产物,随着计算机自动化技术的普及,解决了多项检索问题,“主要款目”从理论到实践都不再具有意义[14]。编制主要款目首先需要对著者标目和书名标目进行选择,根据《普通图书著录规则》和《西文文献著录条例》规定,西文文献一般采取“著者标目”,中文文献采用“题名标目”,中、西文编目主要款目的设置采用不同做法,体现了不同的语言规律和东西方文字特征[15]。

(3)标目选择问题研究

作为目录款目上指引目录排检线索的项目,标目范围和形式的选择会影响目录的检索效果,因此制定标目选择依据和原则至关重要。标目选择原则包括可检(具有检索意义)、充分(提供尽可能多的检索点)、认同(以常用、惯用和通用为原则)、统一性(统一标目原则)和多面引向原则等[16-18]。从标目类型上看,研究者对个人、团体(包括会议)、题名标目的选择范围和著录形式等问题进行了专门探讨[19-21],并加以示例进行说明,对于名称规范标目的确定具有重要参考意义。

此阶段研究多为规范控制概念、原理和方法等的普及和介绍,以及主要款目存废及各类标目的确定和形式选择问题。此外对于规范数据款目设置及著录[22]、规范控制自动化[23]、编目规则中的标目法[24]等问题也进行了初步探索研究,但多为介绍性、概述性的内容,真正结合我国实际情况提出规范文档建设方法与途径的成果并不多。

2.2.2 规范控制标准规范

(1)标目法

书目规范控制在编目规则中又称为标目法。1996年黄俊贵主编的《中国文献编目规则》构建了著录法和标目法两部分的编目工作系统,首次在编目规则中提出规范款目的概念,这在当时是率先于国际编目规则的[22]。标目法部分对标目范围、形式、规范和参照等问题进行了规定,使书目检索点的规范控制有了标准依据。

(2)规范控制标准规范

在指导规范数据内容创建方面,国家图书馆(原北京图书馆)于1990年编写了《规范数据款目著录规则(草案)》,1997年一分为二,分为《中文图书名称规范数据款目著录规则》和《中文图书主题规范数据款目著录规则》,明确了名称和主题两种规范数据类型。在统一规范数据交换格式方面,1990年国家图书馆参照国际图书馆协会联合会(IFLA)的《UNIMARC/规范格式》,编写了《中国机读规范格式》(试用本),1995年修订,1997年和1999年两次推出使用手册,赋予了规范、参照和一般说明机读形式记录的字段标识符、指示符和子字段标识。

在规范控制起步实施阶段,指导规范控制工作的内容和格式标准均已出台,使得规范控制实践工作有了标准依据,国家书目机构之间的规范记录交换与共享有了保障。随着规范控制实践工作的深入开展,研究者又针对标准规范存在的问题进行讨论、修订和完善工作。

2.2.3 规范控制应用实践

20世纪80年代以来,一些大型图书馆已经意识到规范文档对于书目检索的重要作用,国家图书馆于1982年开始着手进行西文文献规范控制工作。90年代编目界开展机读规范记录创建工作,尝试将手工卡片规范记录转换为机读规范记录,并进行联机规范控制系统建设。但是受软件环境的制约,大多数图书馆系统不支持规范控制功能,不支持规范数据和书目数据的连接,规范记录和书目记录并没有同步[25]。此阶段规范数据的联合共建共享工作初步展开,如1997年开始启动全国图书馆联合编目中心,1999年香港中文大学和岭南大学图书馆等7机构联合成立“香港中文名称规范工作小组”(Hong Kong Chinese Authority (Name) Group,HKCAN),本着规范数据共建共享的原则,启动HKCAN数据库建设。1990年中国台湾汉学研究中心和台湾大学图书馆联合成立“中文名称规范数据库工作组”,专门开展台湾地区的名称规范控制工作。但总体看,此阶段规范数据共享范围有限,数据交换和共享亦没有真正展开。

2.3 名称规范控制稳步深化阶段(21世纪00年代)

新世纪之初,随着计算机编目技术的日益成熟以及书目信息资源共建共享活动的推动,规范工作引起了更多的重视,规范控制理论和实践工作实现了稳步深化发展。特别是国家图书馆2003年启用Aleph 500系统,通过冗余方式实现了书目数据库与名称规范数据的有效连接,规范控制和著录工作实现同步,是名称规范控制工作步入稳步深化发展的一个重要转折点。

2.3.1 规范控制理论研究

(1)名称标目问题研究

由于各类名称形式表现的多样性和复杂性,确保名称标目在目录里的一致性和唯一性,才能保障检索效率。研究涉及:①个人名称标目选择和标目形式,如对于外国责任者的名称标目以及汉译惯称的西文著者名称标目的选择问题[26-27]。②个人名称标目的区分。中文姓名具有形式简短和重名率高的特点,需要添加包括生卒年、职业、学科、职称、性别、朝代等在内的附加信息才具区分能力[28]。国内外普遍以生卒年作为标目附加成分首选,当不能获取生卒年时,可结合学科、职业等成分进行区分[29]。

(2)国内外标准规范发展研究

标准规范发展研究对于标准的完善和修订具有重要意义,研究涉及:①国际编目原则、模型和规则对于规范控制的影响研究,如“巴黎原则”和“国际编目原则声明”在规范控制方面的发展变化[30];基于FRBR和FRAD探讨实体-关系模型在规范控制中的应用[31];RDA对规范控制的影响和启示,为规范控制提供原则性指导,并解释了规范记录的结构和内容元素[32]。②对国内编目条例和规范格式的修订研究,研究涉及编目规则中的标目法内容结构[33]、标目规范和参照[34]、检索点选取规则的修订等[35]。再有,涉及机读规范格式问题,如中外规范记录统一使用CNMARC规范格式的问题,CNMARC中的名称著录,以及MARC21和CNMARC的比较研究等[36-37]。

(3)网络环境下的规范控制研究

网络信息的纷繁复杂、良莠不齐给规范控制工作带来挑战,使得网络环境下的规范控制呈现新的特点并面临新的课题[38]。研究涉及:①基于唯一标识符的网络资源规范控制成为新内容。唯一标识符使信息资源具有可标识性和可规范性,从而简化了网络资源的规范控制问题[39]。唯一标识符成为一项重要检索点,应纳入到规范控制的范围并反映到编目规则中[40]。②规范控制机制研究,包括基于Web2.0理念[41]及语义Web技术的名称规范控制探索[42],在开放和动态的网络环境实现对各类型资源、针对各种用户和信息搜索场景的分布式规范控制。③规范控制对象的扩展,主要包括网络环境中的元数据规范控制,如DC和RDF等元数据的规范控制问题[43]。

(4)联机编目环境下的规范控制问题

联机网络环境为书目规范控制提出了新课题,内容涉及:①联机规范控制模式研究。鉴于我国行政体系造成的书目情报机构条块分割的现状,宜采取集中式与分布式相结合的模式[44]。②规范数据的合作共建共享。规范文档的合作建库,是联机合作编目在规范控制领域的延伸[45]。随着中国高等教育文献保障系统(CALIS)项目的开展,规范文档的共建共享活动提上议程。鉴于NACO(Name Authority Cooperative Program,NACO)和VIAF(Virtual International Authority File,VIAF)项目的成功经验,我国编目界也逐渐认识到合作构建规范数据的重要性,提出走合作化道路、加强规则的标准化和一致性、创建全国规范控制中心、建立书目规范联合检索平台等建议[46]。

(5) 对名称规范控制工作的总结

随着名称规范控制工作的逐步开展和规模不断扩大,其中存在的实际问题也逐渐凸显,针对我国的名称规范控制发展情况,研究者总结了个人名称标目质量[47]、自动化规范控制系统[48]及不同机构在标目选择以及规范形式表示方面的差异问题[49],并提出规范文档格式、内容和管理方式向国际标准统一化、网络化和自动化方向的发展建议[50]。结合香港中文名称规范控制合作项目(HKCAN)的管理架构、运行模式以及联盟协作等,提出名称规范控制管理机制方面的启示[51]。

相比上一阶段的规范控制理论研究,此阶段研究内容不断深化,研究领域不断扩展,除了对名称标目问题进行细化、深入研究外,研究者还对网络环境和联机编目环境下出现的新课题、国际编目规范控制热点问题进行了探索。另外还对规范控制实践工作进行系统总结和反思,探讨对规范控制标准规范的修订研究等。

2.3.2 规范控制标准规范

在内容标准上,2003年中国图书馆学会修订了《西文文献著录条例》,2005年国家图书馆修订并出版第二版《中国文献编目规则》;在格式标准上,2002年由文化部审定《中国机读规范格式》为文化行业标准(WH/T15-2002)。为了与IFLA的《UNIMARC手册:规范格式》(第三版)接轨,《中国图书馆机读规范格式》国家标准计划项目立项。

除了上述指导我国规范控制工作的国家和行业标准外,CALIS也出台了《CALIS联机合作编目手册》《CALIS规范控制档汇编》等相关标准规范,支持联合规范数据库建设。但这也造成以国家图书馆为主的公共图书馆和以CALIS为主的高校图书馆在标准规范方面的分歧,导致标目的选取和标目形式等遵循不同的规则,影响了规范数据的交流和共享。

2.3.3 规范控制应用实践

随着图书馆自动化系统的引进,规范控制的自动化规模不断扩大,国家图书馆和清华大学图书馆等实现了书目数据库与名称规范数据的有效连接,规范控制纳入到图书编目工作流程中,改善了规范数据与书目数据脱节的问题[52]。联机规范系统也开始建立,规范数据的合作共建共享初见成效。

部分图书馆进行了区域化合作,国家图书馆也开始向全国图书馆联合编目中心的用户提供规范数据的下载。2003年3月CALIS正式启动规范数据库建设项目,2004 年8月建立联机规范系统实验数据库,将各成员馆的规范记录集中到统一的规范文档中并提供共享服务。2003年10月“中文名称规范联合协调委员会”成立,成员单位包括国家图书馆、CALIS、香港特别行政区大学图书馆长联席会、台湾地区汉学研究中心和澳门地区图书馆,协调委员会经过多次的学术探讨和规则协调,于2009年建立“中文名称规范联合数据库检索系统”,为用户提供中文名称规范的一站式检索平台,利用网络环境实现了规范数据共享。规范控制联合共建共享取得一定的成绩,但由于行政体制等原因,合作的范围仍然有限,且仅限于对中文普通图书和古籍的名称规范控制,还未实现连续出版物、非书资料、学位论文和电子资源等的名称规范控制[53]。

2.4 名称规范控制变革探索阶段(21世纪10年代以后)

随着关联数据环境的发展驱动效应以及图书馆服务的扩展,语义网环境下图书馆规范控制的理念、方法和技术经历了一系列变革。刘炜在2011年发表《关联数据:概念、技术及应用展望》一文[54],指出关联数据是驱动“编目”和“规范控制”转型的基础性技术,自此展开对名称规范控制的变革探索研究。

2.4.1 规范控制理论研究

(1)由标目选择到身份(实体)管理

语义网技术为万维网时代的规范控制提供了原生解决方案,通过URI标识概念实体,而不需要选择任何一种优先名称形式作为标目,可使得“标目”问题得到完美解决[55]。规范控制从标目选择向实体管理方向发展,由从不同的名称形式中选择唯一的规范标目形式,走向接受不同机构采用不同“首选形式”的实体管理,如虚拟国际规范档采用的方式[56]。在由名称标目向身份管理转型的过程中,编目理论和实践经历从数字化到数据化的发展变化,区分和厘清实体及其名称、实体及其描述、实体描述及其对描述的描述的概念,对于书目数据建模和应用实践非常关键[57]。规范控制应从封闭单一的“记录”走向开放关联的实体关系数据,推动规范数据向更广范围开放与应用[58]。

(2)规范数据的关联数据化

利用关联数据技术和知识库资源可改进规范文档自身的语义不足、应用有限等问题,研究包括:①规范语义描述模型研究。一是以Schema为核心的语义模型,包括中文个人名称[59]、机构名称[60]、档案名称规范数据语义模型[61]等,模型表达完整性强,复杂度较低,有助于互联网环境下实体的关联、共享和重用[62]。二是多种标准词汇表的融合模型[63],包括复用FOAF(Friend-of-a-Friend)、RDA、SKOS(Simple Knowledge Organization System)和VIAF等词汇的基础上,设计中文名称规范数据语义描述集;以BIBFRAME 2.0和Geonames本体为基础设计地方文献地名模型[64]。②规范数据与其他知识库的数据聚合。名称规范基础设施可通过调和和解析建立到VIAF、Wikidata等通用资源之间的链接。VIAF被认为是万维网利用图书馆规范数据的门槛,将中文规范文档加入VIAF可实现中文名称规范数据的国际化关联和共享[65]。实现中文规范文档与 Wikidata 的实体对齐,建立连接并提供语义化表示,可提高规范数据的曝光率和应用价值[66]。

(3)命名实体识别算法研究

大数据环境下,传统的规范控制著录方法难以满足大规模数据的处理要求,需要结合机器计算进行命名实体识别和消歧。命名实体识别方法包括:①基于规则和相似度的算法,如以高校科研机构为研究对象,从词性统计和构词方式等方面进行机构命名规则构建,利用编辑距离算法探索名称的识别和机构名称的归一[67]。②基于统计的机器学习方法,通过对大规模人工标注的语料库进行训练,构建统计模型,包括隐马尔可夫模型、决策树方法、最大熵、条件随机场、支持矢量机等[68],如基于作者-机构共现的同一机构识别算法[69],基于机构-人员矢量相似度视角的科研机构名称演化识别方法[70]等。

(4)责任者唯一标识符研究

为责任者分配唯一标识符是网络环境下实施名称规范控制的重要方法,研究主题包括:①对唯一标识符系统发展概况的引荐。对包括ISNI(International Standard Name Identifier)、ResearcherID、ORCID(Open Researcher and Contributor ID)、OpenID、DAI(Digital Author Identification)、PubMed Author ID等唯一标识符系统的介绍、功能、问题及其相关建议等,这些系统存在管理机制、多标识符、解析、诚信、推广机制、元数据应用、信息更新等一系列技术、管理和社会问题[71-72]。②ORCID相关研究。在上述众多标识符类型中,对于ORCID的研究最为集中,除了对其构建模式、声明与验证机制、元数据规范、关键技术和实施推广等问题的研究外[73-74],还包括ORCID在学术成果精确归属、科研产出评估等方面的发展前景预测,以及ORCID在机构知识库、学术期刊等场景中的应用研究,并且正在实现与多个平台系统的关联应用[75-76]。

(5)规范控制应用领域的扩展研究

规范控制对象从专著书目规范延伸到网络资源、机构知识库、文献数据库等;规范控制应用场景扩大到知识关联、知识发现、社交网络、虚拟社区、科研信息管理、数字人文等领域[77]。除传统专著资源的名称规范控制外,还对非书资料目录、会议、期刊、机构、基金等规范文档进行了探讨[78-80]。名称规范控制在科研管理和科研评价中可实现对科研实体的识别和成果的精确归属,是规范文档研究的新应用领域[81]。此外,名称规范按照数字人文研究的要求进行重组和丰富后,可成为“数据基础设施”的有机组成部分,提高系统查全率和查准率,支持动态展示实体间的关联关系,亦可助力社会网络关系分析[82]。

(6)相关标准规范研究

相较于上阶段标准规范研究,此阶段内容涉及:①身份管理标准规范研究,在身份或实体管理成为国际编目界的主要发展趋势下,FRAD、LRM(Library Reference Model)、BIBFRAME、RDA和3R项目,以及MARC21格式等标准规范,已为身份管理描述做好准备[83]。②FR模式对名称规范控制的影响,如FRBR模式在OPAC系统中实现名称规范控制,FRAD化的名称规范记录制作等[84]。③基于IFLA-LRM的名称规范建模。将中文个人名称规范文档的数据元素进行E-R实体关系映射和建模,LRM中新增Agent(行为者)实体,要注意命名实体和行为者实体的属性区分[85]。④RDA对于规范控制规则的影响研究。RDA充实了规范控制规则,MARC21增加046、3xx等字段,细化丰富了规范记录的个人属性[86-87]。

鉴于传统规范控制方法不能满足网络环境下大规模命名实体识别的需求,此阶段更加关注技术在规范控制中的应用探索,开展基于关联数据技术的中文名称规范语义描述和关联研究,以及自动识别算法、唯一标识符等新型规范控制机制方法,弱化了传统规范控制标目选择和形式确定研究,由传统的名称标目转向基于唯一标识符的身份管理的趋势已经明显。

2.4.2 规范控制标准规范

此阶段由重视对检索点的描述转变为实体描述,并出台针对行为者实体的元数据描述规范,如《科技人才元数据元素集》《信息与文献——机构名称元数据》《信息与文献——创作者与机构名称标识符》等国家标准或计划,涵盖既适合本地应用需求同时又能容纳外界标识符系统的行为者描述体系。唯一标识符可实现对网络环境下的实体识别和关联,如由原新闻出版总署发布的《中国标准名称标识符》,可标识数字环境下的各种媒体内容在创作、生产、管理和发行产业链上参与者的公开身份。中国标准关联标识符(International Standard Link Identifier,ISLI)可标识和识别相关实体之间的关联关系,以实现诸如复合应用等目的。

2.4.3 规范控制应用实践

此阶段除了我国图书馆的名称规范数据量不断积累,并继续上传至中文名称规范联合数据库检索系统供成员共享外,该阶段名称规范控制应用实践还体现在对如下三方面的探索:

(1)科研服务机构和数据库商等开展名称规范控制服务。如中国科学院建立了其所属机构的名称规范库。中国医学科学院医学信息研究所基于《中国生物医学文献数据库》开发研制了“中国生物医学机构名称规范管理系统”。万方和中国知网(CNKI)等数据库构建的学者库和学者圈,科研在线开发的科研人员主页,百度学术的学者主页等,在学者身份识别以及提高学术影响力方面发挥了相应的作用,满足了机构科研信息管理和数据库检索的需要。

(2)名称规范数据的关联数据化走向实践。上海图书馆利用关联数据技术探索人名、地方和收藏机构名称等在互联网上的规范控制。台湾地区汉学研究中心将名称规范记录上传至VIAF。国家科技图书文献中心(NSTL)积极探索语义网环境下名称规范控制机制,构建了NSTL名称规范数据库,实现以实体为单位建立描述集,以唯一标识符系统标识规范对象的做法。国家图书馆的书目数据和规范数据也成为跨网域开放互联的开放数据集,如Wikidata实现对其规范数据的关联和链接。

(3)我国唯一标识符项目的实施。中国科学院文献情报中心与ORCID合作开发了 iAuthor 平台,中国工程科技知识中心采用ISNI名称标识方案,并提供名为KnowledgeID(简称KID)的唯一标识注册解析服务。清华大学提供ThuRID(Tsinghua University Researcher ID)注册服务。虽然我国标识符项目实施取了一定的成绩,但在覆盖范围上还存在不足,影响力有待进一步增强,且面临多标识符互操作等问题。

3 我国名称规范控制发展演化特点及启示

3.1 我国名称规范控制发展演化特点

纵观我国名称规范控制研究、标准规范和实践发展历程,规范控制历经从相对封闭到逐渐开放,从依靠国外模式的“拿来主义”到结合我国实践及中文名称特点进行开拓创新过程,构建了较为完整的书目规范控制理论和实践体系。总体来讲呈现如下演变特点:

(1)理论研究逐步深化和扩展

随着实践的逐步深入、网络信息技术的发展以及用户需求的转变,我国名称规范控制研究内容不断深化,领域不断扩展,方向不断调整。首先,由于名称形式的多样性,统一(规范)标目形式成为起步和稳定发展阶段的中心研究议题,但随着关联数据的发展驱动和唯一标识符项目的示范,名称规范从重视标目检索点的选择到重视实体(身份)管理方向转变。其次,传统规范控制方法不能满足不断扩大的规范控制对象以及新的规范控制需求,基于唯一标识符的身份管理、MARC规范数据的关联数据化、机器自动识别算法等方法和机制开始逐渐受到重视,寻求名称规范在网络环境下更高层次、更广范围的应用扩展。再有,由最初介绍和借鉴国外名称规范控制理念和方法,到后来结合我国名称规范控制实践发展困境,针对中文名称特点开展标准规范修订、实践反思等研究,并提出具有针对性、深入性的指导规范控制发展的建议。

(2)标准规范逐步建立和完善

名称规范控制标准规范对于实践具有重要指导意义,我国在标准化建设方面取得了一定的可喜成果。首先,我国规范控制工作虽然起步晚,但是在标准规范建设之初即瞄准国际性标准,并结合我国编目工作实际制定了一系列国家标准和行业标准,对于我国各机构规范数据的著录统一发挥了重要作用。其次,随着规范控制实践的深入全面开展,对于编目规则的认识逐渐深入,尤其是与实践工作脱节的规则条款逐渐凸显其不合理之处,同时结合国际标准态势的最新发展,对我国编目规则和条例进行修订和完善。再有,标准规范呈现从零散到逐渐体系化的发展态势,如既有编目规则条例中的标目法,又有包括专门指导规范数据制作的内容标准和格式标准;国家标准、行业标准和业务标准体系完善,并显示出从行业标准过渡到国家标准的动态发展过程,影响范围逐渐扩大。

(3)应用实践逐步实施和扩大

研究者吸收国外先进经验并结合我国编目工作的实践,取得了一定的成果。首先,实施规范控制的规模不断扩大。我国名称规范控制工作虽起步较晚,但经历从无到有,数量规模逐渐扩大的发展历程。除了国家图书馆和CALIS等机构创建的规范数据规模不断增长外,还包括各类科研机构、数据库商等构建的名称规范库,在信息检索、科研管理和评价等领域发挥了重要作用。其次,自动化水平不断提高。随着图书馆自动化系统的引进,联机规范系统开始建立,部分图书馆着手将卡片记录转换为机读规范数据,对于我国规范控制的发展来说是重要的一步。再有,部分规范数据实现关联数据化发展,基于URI和RDF实现规范数据的开放关联共享,突破了原有MARC数据格式的应用局限,是我国未来名称规范数据的实践应用方向和趋势。

3.2 对我国名称规范控制的发展启示

我国名称规范建设虽取得了一定的成绩,但实际上与国外编目界相比还存在较大的发展进步空间,尚未在图书馆中实现大规模应用和普及,尤其在进入智能化数据化发展时代,所需的书目规范控制已变得完全不同,必须重新对传统规范控制模式进行全面系统的审视,因此,面向未来的名称规范控制需求,本文提出如下启示:

(1)名称规范的关联数据化发展

随着关联数据的发展驱动效应,不断发展的开放数据网络要求规范文档向开放关联数据格式迁移和转换。刘炜曾撰文指出,关联数据是语义网时代对网络资源和数字对象进行“编目”和“规范控制”的基础性技术[54]。国内名称规范数据的开放语义关联程度不足,且图书馆规范文档以“字符串”为中心的规范控制方式不符合以“事物”为中心的实体管理方式,因此将实体名称重新概念化为“事物”而不是“字符串”,需要通过URI对实体进行标识、链接和关联,可更好地在开放网络中进行数据交换和交流,扩大规范数据在网络环境中的应用范围。

(2)推动传统规范控制到身份或实体管理转型

国外对于规范控制向身份管理的转型问题进行了积极探索和研究,而国内尚未形成热点,但是有所推动。如基于关联数据的规范控制模式研究、规范数据的语义描述和数据聚合研究,网络环境下名称规范控制方法与机制的探索,以及规范数据在网络环境下的新用例等,可见国内学者一致认为未来的趋势将是基于标识符的身份管理,而不再是将名称字符串作为规范控制的基础。这些成果对于把握规范控制向身份管理转型的趋势,从而推动相关机构和学者开展深入和系统研究具有重要引领作用。那么如何在现有研究成果的基础上,探讨传统规范控制向身份管理转型的策略,从而根据我国名称规范发展现状和特点,实现向身份管理的转型是一项长期而艰巨的任务。

(3)基于社区协作的规范文档建设

图书馆名称规范控制主体力量有限,需要扩大贡献者范围,促进其他社区对于规范控制工作的广泛参与并进行数据共享。受Wikipedia的启发,OCLC于2009年组织了专家社区实验,尝试了“社交编目”,结果证明很成功,因此可尝试将该模式应用到规范数据的协作编目[88]。由德国科学基金会(DFG)资助的文化数据GND4C(GND for Cultural Data)项目,反映了社区协作构建规范数据的需求[89]。在数据网络中,规范数据是跨学科和领域连接文化遗产、图书馆馆藏和研究数据的理想资源。最初为图书馆设计的GND,引发了其他保护文化遗产的机构的兴趣,这些机构不仅具有使用规范数据的需求,而且有协作创建和维护新的规范数据集的需求,如博物馆对象、档案文件和研究数据等。PCC NACO成立身份管理小组,最大限度利用来自图书馆内外社区的专业知识,推进协作进行身份管理。

(4)将名称规范工作纳入国际化发展

目前与中文资源相关的数据基础设施还非常匮乏,名称规范基础设施建设如不能加入国际合作,也应通过调和和解析建立到VIAF、Wikidata等通用资源之间的链接[90]。目前编目工作开始由孤立状态走向国际协作发展,作为编目工作重要一环的规范控制也不例外。一方面,应积极加入VIAF、ISNI和Wikidata等国际化集中聚合平台,参与身份管理的国际化协作,将图书馆的规范名称贡献给共享的“身份池”,扩大更大范围内规范数据的可见度和可用性;另一方面,积极在国际化平台贡献中文名称实体数据,增强中文名称数据在国际化环境中的共享和重用,履行UBC(Universal Bibliographic Control)目标。

(5)积极与国际标准规范接轨

我国在标准化建设方面虽取得了一定的成绩,制定了一系列标准规范指导名称规范控制实践工作的开展,但这些编目规则和条例均依据和参考AACR2制定,是传统MARC编目环境下的产物,主要围绕“规范检索点”或者“标目”为中心构建的标目法标准体系,指导规范控制实践的标准体系应转变为支持实体的描述,适应唯一标识符取代名称主标目的趋势。国际编目界支持规范控制向身份管理转型的标准规范已经部分完成转换,但是国内的编目规则和机读规范格式尚需根据我国国情进行修订,并保持与国际标准规范的一致和协调。随着关联数据实践的应用探索,从规范控制到身份管理的转型还需要注意与关联数据语义社区描述规范保持一致,以支持规范数据在更大语义社区的交流和共享。

猜你喜欢

标目标准规范编目
国家图书馆藏四种古籍编目志疑
《传奇汇考标目(别本)》的版本及其他
中文图书在版编目数据标目中存在的问题及对策研究
工业锅炉标准规范数据库管理系统实现
粤剧编目整理之回顾与展望
CALIS联机合作编目中的授权影印书规范著录
韩国拟修订食品容器和包装标准规范
央行发布两项征信行业标准规范征信机构信息安全
橱柜行业标准规范引导发展
图书馆编目业务外包发展探讨