知识检索功能框架及其在图情术语分析中的应用*
2022-02-14魏向清
郑 洁 魏向清 王 淼
(1.南京大学 南京 210023;2.西北大学 西安 710127)
1 引言
学科是工业时代知识专门化、制度化的产物[1],随着信息时代的来临,日渐频繁、多元的知识交流加剧学科知识融合及跨学科研究深化。知识组织与术语学的知识交流与融合在二者形成早期就已初现端倪,如知识组织奠基者布利斯(H. E. Bliss)和阮冈纳赞(S. R. Ranganathan)从图书分类角度谈及术语定义与命名,达尔伯格(Ingetraut Dahlberg)提出信息编码分类法(Information Coding Classification)的理论基础之一即为术语学的概念理论,现代术语学创始人维斯特(Eugen Wüster)将图书分类法运用于科技术语词典编纂中。21世纪以来,随着知识组织的语义化[2]与概念化演进[3],知识组织与术语学的跨学科方法融合渐成趋势,如宋培彦[4]等的相关研究,二者的跨学科理论探讨亟待深化[5-7]。
学科知识融合为专业词表的功能或性能及构建方法研究提出创新需求。词表是知识的词汇集合,狭义词表指“受控词表”[8]141,广义词表指知识组织系统(KOS),本文的词表外延为广义;专业词表是学科领域知识体系的词汇集合,供用户检索特定专业知识点,以专业词汇为对象的研究侧重知识组织的“微观层次”,即“对知识节点与知识关联的组织”[9]41。学科知识融合意味着专业知识节点的多维性,相关研究或因面向计算机的检索性能提升而未能充分体现学科领域知识融合的诉求,如检索语言的“全、准、快”等指标[10]10,或涉及具体方法而未能深入机理,如词表控制相关标准[11],或因面向特定自然科学领域而对人文社科专业词汇解释力不足,如基于框架术语学理论构建的环境领域术语知识库 EcoLexicon[12]。针对上述理论研究空间,文章以知识组织的功能为切入点,通过文献综合,并结合术语学特点,聚焦知识检索这一基本功能,探讨其概念内涵与外延及其主要指标和影响因素,以构建面向专业词表尤其是术语词典检索性能设计与评价相关研究的知识检索功能框架。
术语是专门知识领域概念特征的语言指称,术语分析是对“基于使用一个指称或定义表示的”各项专业概念特征的分析,以明晰、优化名实对应关系的一种术语研究活动[13]4;术语编纂是术语学的一个新兴分支领域,发展近半个世纪,以构建专业词表尤其是术语词典为主要实践目标,其理论和实践是各门学科建设的基础工作[14-15];图书情报学(以下简称图情)术语编纂工作是构建图情学学科体系的基础,对图情术语编纂产品中的术语分析是基于实践的理论反思,对相关实践工作具有直接或间接的借鉴或指导意义。我国图情术语编纂产品始于20世纪80年代以词汇、简明词典等命名的结构较为简单的专业词表,兴于20世纪90年代以后,以大型专科词典《中国大百科全书·图书馆学情报学 档案学》以及《图书馆学情报学大辞典》为代表,术语词典鲜有(如2006年崔红娟主编的《英汉图书馆学情报学术语词典》),2019年8月出版的《图书馆·情报与文献学名词》(以下简称《名词》)是我国图情学最新术语编纂产品,旨在规范图情术语。《名词》的相关研究涉及部分图情术语分析,如不规范现象梳理[16]、《名词》编纂工作介绍[17]及个别核心概念探讨[18-19]。本文将理论框架应用于《图书馆·情报与文献学名词》前630个图情词条的人工分析,包括前两个类目“图书馆学情报学基础”和“图书情报工作管理”的所有词条,属于图情基础概念,以期对专业词表尤其是术语词典的构建方法研究有所助益。
2 知识组织的基本功能及其框架
2.1 知识组织的基本功能
我们根据Bliss在1929年《知识组织和科学系统》(The Organization of Knowledge and the System of the Sciences)一书中谈到的组织的三个方面——结构的、功能的和发展的,提取出知识组织的三个基本原理或原则(principles):系统性、功能性和适应性。本文围绕知识组织的基本功能展开理论探讨。通过文献细读,如下知识组织领域专家文献与功能性直接相关,分别为:布利斯提到的最大功效性(maximal efficiency)等[20]18-133,阮冈纳赞提出的图书馆学五定律[21],肯特州立大学信息学院曾蕾教授提出的词汇控制方法[22],布法罗大学图书情报学院Dagobert Soergel教授提及的语义路标(semantic road map)[23]29,南京大学信息管理学院苏新宁教授等谈到的“分类”“聚类”等功能[24]17。由上述文献可见,20世纪初期至今,知识组织方法研究在学科领域、研究对象和具体方法等方面发生了转变:学科领域由最初的图书馆学转向信息科学,研究对象由文献内容逐渐语义化或概念化,具体方法也随之细颗粒化,并出现跨学科、跨语言的概念组织方法。虽历经上述转变,知识组织领域专家对功能性的解释始终围绕信息/知识检索这一基本功能展开。
知识检索由情报检索、信息检索和文献检索衍化而来,指“通过对检索对象语义层次上的标引,提高查全率和查准率”(《计算机科学技术名词》第三版),“从知识资源或知识库中,按照一定的方式和技术,并根据用户的需求找出相关知识的过程”(《管理科学技术名词》第一版),或“一种基于知识组织体系,能够实现知识关联和语义检索的智能化的检索方式”(《图书馆·情报与文献学名词》第一版);在辞书学中,检索这一概念通常对应search和access两个术语,前者指利用检索词(search word)查找特定信息的过程[25],后者指辞书中的信息能被相对便捷地查检到(relative ease with which information can be located)[26]2。为进一步明晰知识检索的概念,使其适用于专业词表尤其是术语词典编纂研究,我们有必要对知识检索进行定义。
知识检索以知识为研编对象。对知识的第一种理解维度源于哲学认识论,侧重波普尔“三个世界”理论中的“世界3”,即相对于“主观知识”的“客观知识”[27]20-22。达尔伯格[28-29]认为,知识可分为知识因子(knowledge elements)、知识单元(knowledge units)等四个层次,我国知识组织研究奠基者王知津等[30]6将这种知识表述为由众多“知识因子”和“知识关联”组成的“网状结构”;辞书学将词目承载的知识分解为各类信息范畴(information categories)[26]73;专科词典是特定“学科领域知识体系化语言表达的结果”[31],Henning Bergenholtz和Sven Tarp[32]111-144将专科词典中的知识分为语言知识和百科知识及其子类。第二种理解维度源于信息/知识管理领域,以DIKW模型为代表,指相对于数据、信息乃至智慧的知识。其中,信息是经过结构化加工后带有意义的数据,而知识被视为经过加工后可“被利用”[33]10、“助于产生新信息”[25]或带有判断的信息(information with judgement)[34]34。结合研究对象特点,本文侧重第一种解释,将知识检索的对象视为术语词条承载的各类客观知识。
知识检索以检索为研编活动。检索有广狭之分,广义的检索“对信息工作者而言”,指信息/情报存储与检索,“通过建立检索系统来解决文献查找问题”;狭义的检索“对用户而言”,仅包括广义检索的“后半个过程”,即“信息查检”[10]2,[33]48-49。结合研究对象特点,本文侧重广义检索中的检索系统设计和评价研究,突出学科领域专家在术语分析中的作用。
2.2 知识检索功能框架
根据上述对知识检索的定义探讨,面向专业词表尤其是术语词典的知识组织功能性研究以对专业知识体系及其构成要素的检索为基本功能,以检索系统设计或设计特征为研究重点,包括有效性和增效性两个外延。
(专业)知识检索的有效性,源于信息/情报检索中的“检索效率”。广义检索效率衡量指标包括“查全率、查准率、检索方便性及成本等”;狭义检索效率以查全率和查准率为主[10]10,[25]。王知津等[30]19基于情报学的“专指性”与“查准率”、“网罗性”与“查全率”等概念,提出“知识组织概念模型”;曾蕾[22]160针对知识组织系统,提出歧义消解(简称消歧)、同义控制、关系建立和表呈特性的功能及其方法;美国国家信息标准组织文件ANSI/NISO Z39.29—2005(R2010)收录了曾蕾提出的前三项功能及其方法,将其作为词汇控制的主要原理和方法,利于提升词表检索系统的查全率和(或)查准率。检索效率现已拓展于基于本体、动态的知识检索模型研究等[35],而术语知识检索属于细粒度的知识组织研究,仍待发挥研究者的学科领域专业优势,作为智能检索研究的理论基础和必要补充。
较之有效性,(专业)知识检索的增效性是基于特定领域知识多维性原理的特色设计,超出潜在用户对查全率、查准率等有效性指标的基本心理预期。随着知识关联研究的深入[36-37],多维度知识关联与融合研究渐成趋势,如苏新宁等[24]57谈到知识组织的“多维性原则”以及“不同学科”、“同一学科内不同维度”的知识关联。该视角与术语工作相关标准相契合,如国际标准ISO860:2007和国家标准GB/T 16785—2012《术语工作 概念和术语的协调》谈到“概念的多样性”,源于“专业”、“科技”、“文化”及“社会经济”等方面的不同而形成的概念差异(或称歧义、多义)。术语标准化工作要对此类概念进行协调,但若从知识检索角度而言,术语概念多样性及协调可被视为知识增值的契机,因为检索到一个术语可获得超出基本心理预期的多维度专业知识。
通过文献综合,我们搭建出知识检索功能框架(表1),该理论框架面向专业词表尤其是术语词典检索性能设计和评价相关研究,涉及知识检索的有效性和增效性两个外延。知识检索有效性的主要指标参考狭义的检索效率,包括查得全和查得准(在量化研究中表述为查全率和查准率),其主要因素借鉴张琪玉等[10]13和ANSI/NISO[11]16的相关内容。知识检索的增效性借鉴“知识增生”这一术语,指通过知识点间的多维度关联与对照,可提供新的理解角度,促进新知的产生,从而“在知识服务中发挥更大效应”[24]57。我们根据现有规范名词(2016年《管理科学技术名词》)代之以“知识增值”,其主要因素参考概念协调相关内容,以及“知识关联”的类型[33],整合为不同媒体间以及同一媒体内的概念协调。根据研究对象的媒体和领域等特点,主要因素可适当增减。
表1 知识检索功能框架
3 知识检索的有效性
知识检索的有效性以查得全和查得准为主要指标。《名词》根据名词委相关规定,通过文献保证和同义控制等原理及方法保证查得全,通过分类与主题结合的检索语言、简单概念关系等保证查得准。蒋颖和黄长著[17]3谈到《名词》的多种选词来源,包括图情专业“工具书”、“国家标准”、“网络词典”、“中外文期刊”及专业“教材”,实则涉及文献保证原则。他们以“情报”和“信息”为例,介绍了《名词》“定名过程中”的“同义词规范工作”,涉及同义控制原理和方法,还谈及《名词》的分类情况。笔者系统分析了《名词》对前630个图情术语词目在汉语和英语中所做的同义控制工作(表2),参考语料来源按先后顺序依次为:中国知网文献关键词、主题词或全文,读秀文献全文,Bing浏览器国内和国际版,并求证专业文献及工具书。
表2 图情术语的同义控制状况
同义指一个概念对应多个意义相同或相近的语言单位,同义词涉及一种语言内的同义关系和准同义关系以及不同语言间的完全对等关系和部分对等关系,同义词会降低查全率,这就使同义控制成为必要。美国国家信息标准组织[11]2规定,受控词表必须补偿由同义带来的问题,确保一个概念仅被一个优选术语(a single preferred term)表示,同时应列出其他同义词和变体作为非优选术语,并通过“USE”等参见符号关联到优选术语。《名词》前言也提及图情术语的“一义多词”现象及其给术语规范工作提出的要求,实则涉及同义控制原理。
同一语种的同义控制。如上表2所示,所考察的630个词目中,8个在汉语中有同义术语,通过“又称”将词目与非优选汉语同义术语关联,优先顺序首要依据词频高低,其次依据全称+简称的方法以及一致性原理。词频优选方法在图情学中的理据主要为用户保证原则,即词汇控制等工作“依据用户的检索习惯和用词特点”[25],图情术语较强的专业性使其用户以专业用户为主,我们的参考语料来源反映了这一用户倾向。全称+简称的方法在图情学中通常被视为提高查准率并兼顾查全率的有效策略,例如术语“开放文档先导元数据收获协议”是外来术语“open archives initiative protocol for metadata harvesting”的词素对应译名,完整准确的命名利于提高网络环境下的查准率,其后通过“又称”关联简称“OAI-PMH协议”,语符的简明性保证了查全率与国际通用性。术语命名的“一致性”原理要求“尽量保持概念系统的一致性”,即新术语要和已有的术语集成在一起[13]27,例如词目“信息交换中心”的词频虽远低于又称“数据交换中心”,但图情学的“数据”是“数字、字母与符号的集合”,“现常指可由计算机处理的信息单元”,“信息”则侧重“消除随机不确定性的东西”[25],因此优选“信息交换中心”这一命名保证了图情学概念系统的一致性。
不同语种的同义控制。《名词》图情领域有106个术语词目(16.83%)对应224个英语同义术语,如上表2所示,同义控制原理按比例由高到低依次为词频高低、全称简称、顾名思义性、贴切性和一致性等,词频高低、全称简称和一致性与上文类似,本段着重说明顾名思义性与贴切性原理的运用。顾名思义性又称“透明性”,是术语命名的重要原理,指无需解释就可根据“名称推测出其所指称的概念”[13]27。在所考察词目中,至少9 个(1.43%)未按词频优选的术语命名运用了顾名思义性原理,包括“社会科学情报学”、“信息量”、“藏书楼”、“医学图书馆”、“检索次数”、“单面书架”、“双面书架”、“目录柜”和“掌上阅读器”。这些术语在英语命名时未选择词频作为优选依据,而更多考虑名与实的对等,其优选英语对应术语的概念更为透明。术语命名的“贴切性”原理有两种内涵:第一种内涵指“遵循语言群体熟悉、已确定的表达方式”[13]28。在所考察术语中,“馆员工作守则”、“信息交换中心”、“取书梯”、“书车”、“代书板”、“资料盒”与“出入计数器”这7个术语的英语命名主要根据此原理。例如,“馆员工作守则”的优选对应词staff handbook收录于2006年上海交通大学出版社的《英汉图书馆学情报学术语词典》,译名为“馆员指南”,非优选对应词staff introduction book同样收录于该词典,译名为“图书馆工作人员手册”,而staff handbook在Bing浏览器国内和国际版的查询结果远高于staff introduction book,结合这两个因素,优选staff handbook是遵循英语语言群体使用习惯的合理选择;“信息交换中心”的优选对应词information clearing house的命名没有非优选对应词information exchange center透明,但clearing house至少在1775年已成为金融术语(参考https://www.etymonline.com),指“银行的票据交换所”,后经跨学科借用和内涵拓展进入情报学领域[25],故优选该术语切合国内外相关专业领域群体的使用习惯。第二种内涵指尽可能选择“中性的”术语命名,特别要避免贬义[13]28。如术语“信息公开”指政府等机构依照法律规定对公众开放信息的行为,其英语优选对应词information opening较之非优选对应词information disclosure更合适。
综上,《名词》基于词频及术语命名原理,以优选或又称的柔性知识组织方法较好解决了图情术语的一义多词现象,但仍有个别术语待完善,可分为三类问题及建议。第一,规范优选原则,调整优选顺序。如术语“文献”(literature,document)的译名literature多指“某一学科或专题的文献”,而document外延更宽[38]465,建议根据概念在本学科的适用程度进行译名优选;术语“知识鸿沟”的英文对应词为knowledge divide和knowledge gap,二者的通用语义没有明显区别,但考察来源可知,该术语至少可追溯到传播学研究者Tichenor等提出的“knowledge gap hypothesis”,出现在1970年刊登于Public Opinion Quarterly第34卷第2期的Mass Media Flow And Differential Growth in Knowledge一文中,对此类语义差别不明显的同义术语,我们建议名从主科,根据来源学科进行译名优选。第二,规范命名原则,调整术语表述。如术语“信息无障碍”(barrier-free of information transmission, information accessibility)译名中的barrier-free为形容词( 2020年5月24日在当代美国英语语料库COCA检索barrier-free和barrier free,词频分别为70和14,所有例句皆为形容词用法),置于of前不合乎语法;同时,transmission常被译为传输、传播等,与该术语定义中的义素“获取和使用信息”重叠度较低。笔者2020年5月24日在Bing浏览器国际版精确检索“barrierfree information access”,得到8 120条结果,其中不乏图情领域专业文献,因此建议将优选译名修订为barrierfree information access,较能兼顾术语命名的顾名思义性、贴切性和正确性原理。术语“信息公开”的非优选译名information disclosure含贬义,建议根据贴切性原理更换为其他词频较高的中性表述。第三,广纳专业建议,优化同义聚类。如“信息采集”、“信息收集”和“信息获取”这三个术语的核心义素分别为“收集和处理”、“直接获取”和“积聚”,区别特征不明显,可视为同义术语,建议根据同义控制原理和方法进行优化。
4 知识检索的增效性
较之查得全、查得准等有效性指标,知识检索的增效性以知识增值为主要指标,指通过知识点间的多维度关联与对照,可提供新的理解角度,使用户在检索中获得超出基本心理预期的知识[24]57。在术语学中,这种多维度知识关联实则源于不同视角带来的术语“概念多样性”,即由“专业”“科技”“文化”“社会经济”等方面不同导致的概念的细微差异,会因理解的不确定性给交流带来不便,甚至造成经济损失。国际和我国术语工作通用处理方法是“概念协调”[39]2,受控词表通常采用限定词加圆括号来对学科领域差异进行歧义消解[11]13。在术语词典编纂中,考虑到实际检索需求,编者往往会采取多种柔性的概念协调方法。我们借助术语在线(www.termonline.cn)等专业资源,系统分析《名词》前630个图情术语词目的概念差异成因及协调状况(表3),结果表明:由于学科领域、应用范围、理论视角、历时演变或语言文化因素,至少三十余个术语存在概念多样性,《名词》主要通过定义谱系、区别特征和外延特征三种柔性的概念协调方法,促进知识增值。表3中的加号(+)表示有,减号(-)表示无,星号(※)表示概念差异涉及不同成因,“+(义项)”表示通过义项划分定义谱系。
表3 图情术语的概念协调状况
“定义谱系”是钟立信探讨“信息”的定义时提出的一个术语,指不同约束条件按照某种规则形成的“定义的有序排列”,可根据约束条件的松紧程度依次排列为“本体论信息”、“认识论信息”乃至“最局限的领域信息”[40]22-23;叶继元[19]18认为,《名词》对“信息”的定义建立了“广义和狭义”的“二维定义谱系”,大致对应于本体论和认识论维度,并提议可增加“中义”或者“外延”。如表3所示,在三十余条存在概念差异的术语中,大部分(27条)针对上述五种概念差异成因,分别使用了广义狭义对照、应用范围对照、理论视角对照、历时特征对照及文化异同对照的定义谱系。学科领域差异通过广义狭义对照来进行概念协调,广义一般为各学科公认的基本定义,具有普适性,狭义一般为本学科专门定义,如“数据”、“信息”、“信息管理”和“认知学派”这四个术语跨越多个学科领域,其概念具有多样性,其中,“信息”和“信息管理”借助释义元语言“广义”或“狭义”明确二维定义谱系,“数据”仅借助释义元语言“现常指”标明狭义,即“可由计算机处理的信息单元”,以此区别于其前的“客观事物与主观思维的具体表达”。应用范围对照的定义谱系大致对应于钟立信先生所说的“越局限的领域信息”和(或)“最局限的领域信息”,一般没有明显的释义元语言,如“消息”“公共接入点”等9个术语都采用语文词典编纂常用的义项划分方法,即通过加圆括号的阿拉伯数字如(1)、(2)划分义项。理论视角对照的方法顺应了学科理论发展现状,对同一概念从不同理论视角建立定义谱系,如“图书馆”可理解为“文献信息机构”或“文化教育机构”等,“信息通道”涉及“信息论”或“社会活动”等理解维度。历时特征对照的方法针对概念的历时演变,术语“信息无障碍”、“图书馆”、“图书馆要素说”、“战略情报”和“情报控制”通过时间限定词如“传统”和“当代”、“最初”和“目前”或具体年份等,将由历时演变造成的概念特征关联和对照。文化异同对照的方法针对在不同社会文化中有细微差异的同一概念,如“图书馆学情报学硕士”运用了“在国外”和“在中国”这两个社会文化限定词,以示异同。总之,定义谱系体现了“统一性寓于多样性”的客观规律[40],而《名词》针对不同的概念多样性成因,使用了相应的释义元语言或标识,初步建立了具有针对性的定义谱系。
区别特征在术语学中是相对于共同特征而言;本文的区别特征就同一概念(即术语)的不同理解维度而言,指可区分不同学科领域、应用范围、理论视角、历时特征或语言文化的概念特征。在表3的三十余个多义术语中,大部分(28个)具有明显的区别特征。就学科领域差异而言,“数据”“信息”“情报”等9个术语的定义含有学科领域间的区别特征。如从术语“情报”的狭义定义中可提取出图情区别特征“机密性质或对抗和竞争性质”,较之《管理科学技术 第一版》的“情报”定义“针对特定需求被激活的知识”具有学科特殊性;术语“认知学派”作为“情报学理论流派之一”,“以认知过程为参照,观察、解释信息现象,展开情报学研究”是其学科区别特征,较之《管理科学技术名词 第一版》的“认知学派”定义“借鉴认知心理学研究成果,发现战略形成的含义”具有鲜明的学科区别。就应用范围差异而言,“消息”“公共接入点”等9个术语都具有区分应用范围的特征。如从术语“知识产权管理”的两个义项可提取出三组信息元,三组的左项或右项共同构成该应用范围的区别特征:①主体“国家有关部门”或“某些组织”;②客体“公民知识产权”或“相关知识产权”;③活动“行政及司法活动”或“保护和经营的活动”。就理论视角差异而言,大部分相关术语都含有区分不同理论视角的特征,如术语“信息通道”在信息论中的区别特征为“能保障信息的单向和多向流动”,在社会活动中“不仅由通信设施所构成,还包含传递信息的人”。历时演变因素涉及三个多义术语:“信息无障碍”的定义通过区别特征“信息获取和利用设施”和“网络信息和服务的可感知、可操作、可理解和兼容性”将传统和网络时代区分开;“战略情报”通过“统帅部进行战略决策、制定战略计划”和“包括科学技术、经济和社会发展”作为最初意义和当前意义的区别特征;“图书情报工作”的第一个义项“图书馆工作与情报工作的统称”侧重早期的图情二分状况,即20世纪50年代情报学“从图书馆学中分化突起”直至20世纪80年代这一阶段[41]58,第二个义项“对各种载体的信息进行选择、搜集”则体现了改革开放以来的图情一体化内涵。总之,区别特征与上文的释义元语言或标识一起构成定义谱系的约束条件,既能突显狭义定义的独特内涵,又能与其他维度的定义相对照。
术语工作一般首选内涵定义,即属概念+种差,有必要时,才添加外延等补充信息。外延定义“通过概念的数量范围来描述概念外延”[42]176,外延特征是描述概念外延的各个客体或要素。《名词》对部分内涵定义解释力有限的术语补充了外延特征,包括“资源共享”、“信息通道”、“图书馆系统”、“图书馆”、“图书馆要素说”、“情报控制”和“图书馆学情报学硕士”。以术语“资源共享”为例,其内涵定义为“图书馆之间实现各类资源互通有无、共享共用的活动”,但对于何为资源,仍存在学科领域间的概念差异,如《计算机科学技术名词 第三版》的“资源共享”对象是“用户数据和信息”,而《图书馆·情报与文献学名词》列举共享资源包含“馆藏资料、书目数据、人员和设备等”,并补充根据规模划分的外延特征“地区性”、“全国性”和“国际性”,既是对内涵定义的必要补充,又是跨学科概念协调的有益举措。
综上,《名词》审定工作除了考虑知识检索有效性策略,还体现了对增效性策略的专业思考。针对学科领域、应用范围、理论视角、历时演变和语言文化因素导致的概念多样性,《名词》初步建立了相应的定义谱系,并辅以区别特征和外延特征,通过多维度知识关联和对照,促进了知识增值。
5 结语
跨学科“理论融合”是学科领域间“知识交流”的必然结果,又反哺于本学科领域的“研究深化及创新”[43]。本文以知识组织的功能性为切入点,运用文献综合法,聚焦(专业)知识检索这一基本功能,整合为知识检索功能框架(表1),包括检索的有效性和增效性及其相关指标和影响因素。该理论框架旨在为专业词表尤其是术语词典设计、编纂和评价相关研究“限定研究范围”、充当“分析工具”[44],其本身的合理性与有效性有待今后验证与完善,知识组织的功能也有待多元探索。
知识检索的有效性以知识序化为前提,知识检索的增效性以知识增值为保障。信息/情报检索通常以查全率和查准率等作为衡量检索有效性的指标;信息时代加速了知识的跨界流动与融合,专业词汇是跨界知识融合的语言结晶,知识检索的增效性则顺应了这一知识交流背景,通过概念协调方法,将源于不同学科领域、应用范围、理论视角、历时演变和语言文化等方面的多样性概念进行多维度关联和对照,促进知识增值。
《图书馆·情报与文献学名词》面向广大受众,不能以术语词典的专业深度来衡量,但经过图情学科专家、术语学家、辞书学家及技术专员多年协力,其规范性对于知识检索的有效性和增效性研究具有较强的解释力,也对今后面向专业用户的术语编纂实践具有启发意义。在知识检索功能框架下,我们借助专业文献及学科背景,系统分析了630条图情术语,结果表明《名词》基于词频和术语命名理据,对汉语术语和英语对应词分别采取了别称和优选这两种同义控制方法(表2),并通过定义谱系、区别特征和外延特征这三种概念协调方法,对不同学科领域、应用范围、理论视角、历时特征和语言文化这五类成因导致的多样性概念进行了协调(表3),以柔性知识组织方法兼顾了术语知识检索的有效性和增效性,在图情术语规范化和学科体系建设道路上迈出了关键一步。