映射之难
——人文社科学科评价中跨库数据的学科归属问题*
2023-08-08郝晋清
张 蒂,郝晋清,王 珺
0 引言
在推进“双一流”建设进程中,高校图书馆积极开展学科评价服务。这项服务依托图书馆数字资源,应用文献计量法及分析工具对多源数据进行整合分析,通过不同评价指标实现对特定机构的学科竞争力评价。由于学科评价的基础数据来自不同数据库,而每个数据库独特的文献分类体系与确定评价学科所依据的教育部学科分类体系并不一致,因而如果无法将获取的数据与评价学科进行匹配,就会降低数据准确性,直接影响评价结果的合理性。因此,科学判别数据的学科归属成为学科评价中亟待解决的重要问题。对人文社科学科评价而言,研究对象复杂化、研究范式多样化、学科成果多元化等特点决定了评价体系是综合性的系统工程[1],不仅评价指标的设定与自然科学学科有所差异,而且评价数据的来源也必须是多维的,除应用国际权威的引文数据库外,还要充分应用其他可行的中文数据库源[2]。多源异构的跨库数据和学科本身的复杂性,为人文社科评价中学科归属的判别带来了更多挑战。
跨库数据的学科归属问题直观地表现为应用数据库获取学科数据时比较困难,这也促使业界积极从构建数据库的映射方案层面着手解决此类问题。目前已有的数据库映射方案集中于WoS、ESI和Scopus等外文数据库,而缺少对CNKI和CSSCI等数据库的探究和分析,这无疑是人文社会科学评价中实践研究成果层面的缺失;同时由于缺少从映射方案中提炼出的可借鉴的方法和策略,从业者面对来自不同数据源的学科判别问题时仍然显得办法不多。在理论层面,虽然学界对学科分类及映射原理早有研究,但相关研究成果没有与多维数据库的学科归属判别情境发生链接,无法为解决实践问题提供更多的理论支持。可见,针对人文社科学科评价中判别跨库数据学科归属过程中所出现的理论与实践脱节、数据库实践范围不完整以及缺乏从业者可借鉴的应用策略等问题,进行有针对性的研究并提出合理解决策略势在必行。本研究聚焦人文社科学科评价中跨库数据的学科归属问题。应用案例研究法全方位地展示了南开大学图书馆在开展人文社科学科评价进程中,根据数据库特点及映射理论,在辨析学科分类体系的基础上,通过制定多维度的学科映射方案对来自CNKI、CSSCI和WoS等数据源的评价数据实现合理判别学科归属的实践过程。基于案例实践,本研究全面剖析了学科评价中跨库数据学科归属问题的本质及根本原因、解决途径及制约性因素,并提出了包括情境性因素、映射思路和实践方法在内的应对策略。
1 研究现状及述评
1.1 理论基础梳理
(1)关于学科分类的内涵及分类体系的对比。有学者[3-5]从范式发展或认识论视角研究学科分类,认为学科分类是为了确定学科在整个科学体系中的地位,根本问题是按照原则揭示体系的内在关系,并以严格的符合逻辑的排列形式进行表述[6];也有学者注重分析不同分类体系之间的差异,如对比国内外学科分类体系[7],指出我国人文社科学科分类体系的问题并提出新的分类框架。
(2)关于学科映射方法的探究。学科映射方法是解决数据学科归属问题的理论基础。在信息学研究中,映射指建立一个或多个词汇的概念与另一个词汇的概念之间的关系[8]。人工映射和自动映射是常见的两类分类法映射方式,人工映射一般通过领域专家对映射类目集进行对比分析;自动映射是指用计算机通过统计或设计利用相关算法对类目进行映射[9]。詹萌论证了学科分类与文献分类之间进行映射的可行性[10],提出多种映射方案。这些基础理论和学科映射方法的探究为解决数据库的学科归属判别奠定了理论基础,提供了方法论上的指引,但具体的映射方法还要根据评价情境进行合理构建。
1.2 实践策略分析
(1)剖析学科评价实践中凸显的数据的学科归属难题。开展学科评价服务是近年高校图书馆在“双一流”建设大背景下的重要服务模式,很多从业者就实践中凸显的学科数据判别问题从不同层面进行了分析。吴爱芝等[11]根据北京大学开展的学科竞争力评价实践,提出数据的学科匹配与归属是评估中需要解决的重点问题。赵飞等[12]指出大部分科研成果的学科划分均是参照来源数据的学科划分来定义,由此产生的问题和误差也是科研评估中无法回避的难点。谢慧珍[13]以天津师范大学的实践为例,指明数据的权威性和广泛性是进行数据源选择的重要考虑因素。
(2)提出针对特定数据库的学科映射方案。基于实践,许多学者对特定数据库进行了有针对性的映射研究,为学科数据判别提供了有参考价值的实证案例。陈雨[14]应用分类体系差异测度工具,全方位地比较了WoS和Scopus分类体系的差异;刘苗苗等[15]基于ESI工具进行了社会科学总论学科域的映射研究;付凯丽[16]在对制约学科评价服务的多种因素的分析中提出正确利用数据库分类体系是全面准确获取数据的前提,并以心理学为例建立了WoS及Scopus的学科映射方案。
1.3 研究现状述评
综上,虽然学界和业界已经注意到了学科归属问题给学科评价实践带来的影响,并通过制定针对特定数据库的映射方案,为解决数据获取层面的难题提供应用依据,但理论研究的缺陷及实践中亟待解决的问题仍旧存在。首先,缺乏关于CNKI 和CSSCI 数据库学科归属判别的研究成果。目前相关论文中针对的研究对象几乎全部集中于WoS、ESI和Scopus等外文数据库,很少涉及对人文社科学科评价所必须应用的CNKI和CSSCI等中文数据源的探讨。研究成果上的缺失既有可能是实践中应用数据库的范围不完整造成的,也有可能是难以解决CNKI和CSSCI的数据学科归属判别难题的真实写照。无论何种原因,人文社科学科评价中数据的权威性和广泛性均有赖于对多源异构数据的收集分析,因此必须展开全面的跨库数据学科归属判别的实践和分析。其次,映射理论与数据库实践脱节。图情领域对分类法映射的研究由来已久,但研究成果却很少应用于学科评价的数据库映射实践中。吴爱芝等在关于北京大学学科评价实践的论文[11]中虽然提出已经分别建立了各数据库与评价学科的映射关系,但没有详细阐述理论依据。可见,目前学科映射理论与数据应用实践呈现出某种程度的脱节。同时,由于缺乏依据学科评价情境形成的一整套解决同类问题的有效策略,从业者往往在面对产生于不同数据库的数据学科归属判别难题时显得无所适从。因此,为研究人文社科学科评价中跨库数据的学科归属问题,应借鉴已有映射理论,积极探索人文社科学科评价情境中可行的映射方法;拓展人文社科评价的数据库实践范围,对多元异构数据学科归属判别的实践案例进行全面剖析。
2 研究方法、理论基础与映射思路
2.1 研究方法与数据来源
本研究采用案例研究法。通过南开大学图书馆开展人文社科学科评价服务的实践案例,剖析其应用多种学科映射方法,对来源于CNKI、CSSCI和WoS数据库的评价数据进行学科归属判别并有效获取学科数据的过程。数据主要来源于2017年至今南开大学图书馆开展学科评价服务中的学科数据,数据库源为南开大学IP范围内可应用的CNKI、CSSCI和WoS数据库平台及部分试用数据库平台。
2.2 判别学科归属的理论基础
2.2.1 辨析学科分类体系与文献分类体系
自2002年起,教育部学位与研究生教育发展中心(以下简称“学位中心”)依据《学位授予和人才培养学科目录》[17](以下简称《学科目录》)对全国具有博士或硕士学位授予权的一级学科进行评估,该目录即成为高校图书馆学科评价服务所依据的学科分类体系。此外,我国的学科分类指导性文件还有《中华人民共和国学科分类与代码国家标准》(GB/T13745-2009)以及《普通高等学校本科专业目录》(以下简称《专业目录》)。另外,与学科分类体系相对应的是文献分类体系。文献分类通常是指根据文献内容和形式的异同,按照一定体系有系统地组织和区分文献[18]。数据库的学科分类在本质上是一种文献分类体系,在功能应用及划分形式上均与学科分类有差异,正是这种差异才不可避免地导致了获取学科评价数据时的难题。为了更直观地解读这两类分类体系,本研究分别对3种学科分类体系和两种常用的中外文数据库的文献分类体系进行了多维度辨析,具体内容见表1。如表1 内容所示,学科分类体系与文献分类体系在应用范围、分类原则构成等方面均有差异。根据分类示例的展示,可知3种学科分类体系的类目表达方式十分接近,而《中国图书馆分类法》(以下简称《中图法》)作为文献分类体系对于学科内涵的揭示与学科分类体系之间有相通性,由此也为建立映射关系提供了可行性。
表1 主要学科分类体系与文献分类体系概览
2.2.2 探究学科映射方法
人工映射和自动映射是两种常用的映射方式。建立人文社科学科评价的映射关系既需要明晰学科分类体系的应用范围及分类原理,也需要厘清不同数据库的文献分类规则,同时更需要了解评价学科的研究范畴甚至其独特的发展历程。从这个意义上讲,现阶段主要由学科评价从业者和学科信息专家通过人工映射完成定性研究的学科映射方案更符合目前人文社科的评价情境。具体映射过程中采用更为科学和规范的映射方法则可以有效降低主观性因素的影响。詹萌的研究[10]表明,可以通过对《中图法》进行类目解析、建立基于字面和语义相关性以及寻找专业或学科知识点相关性等途径来构建学科分类体系与文献分类体系之间的映射关系。在借鉴该项研究成果的基础上,本文案例对这3种方式均有应用,但相对更广泛地使用了基于语义相关性的映射法和基于知识内涵相关性的映射法。语义映射法是以学科类目名称作为映射元素,在两类分类体系之间寻找学科名称的同一性或语义相关性,由此建立映射关系的方法,根据实际情况也可以细分为字面相关性和语义相关性的具体映射途径。基于知识内涵相关性的映射是以学科或专业的知识点作为映射元素,通过确定学科在两类分类体系中所覆盖的知识点层面的相关性来确定映射关系的方法。
2.2.3 学科映射方案的总体思路
根据相关理论基础,本研究设计了用以指导南开大学人文社科学科评价中判别学科归属的学科映射方案的总体思路(见图1),主要包括如下步骤:(1)梳理分类体系及了解学科评价情境;(2)对需建立映射关系的学科分类体系与数据库文献分类体系进行同质性或异质性辨析;(3)根据辨析过程,规划同质性或异质性分类体系下的学科映射方案;(4)基于学科映射方案,分别采用以学科类目名称作为映射元素的语义映射法和以学科内涵知识点作为映射元素的知识内涵映射法完成映射工作;(5)对其他映射方案的可行性探索、验证与特殊学科的处理。
3 南开大学图书馆学科评价服务中跨库数据的学科归属判别实践
2017年至今南开大学图书馆根据学科特点和实际需求,先后为政治学、中国史、世界史、理论经济学和应用经济学等人文社会科学一级学科提供了学科评价服务[19]。本部分案例展示的是对来自CNKI、CSSCI和WoS等数据源的评价数据实现合理判别学科归属的实践过程。每个数据库的具体实践分析都包括两部分内容:分别是学科分类体系辨析及数据库学科评价功能揭示,以及在此基础上设计的特定学科规划并实施的学科映射方案。
3.1 CNKI数据库的学科归属判别实践
(1)分类体系辨析:基于《中图法》学科分类体系。中国知网系列数据库(CNKI)是评估学科中文科研成果的重要数据来源。CNKI 在“使用手册”中提到其文献分类是根据《中图法》独创的学科分类体系[20],与确定评价学科所依据的《学科目录》是两种本质不同的异质性分类体系。而且,其检索项中没有设立“学科”检索字段,因此无论是其检索字段的设置还是其独创的学科分类体系都无法契合学科评价的检索需求,必须重新规划学科映射方案。
(2)映射方案1:基于知识内涵相关性的学科映射。通过分析CNKI文献分类原则及检索特点,在针对政治学一级学科的学科评价服务中,学科馆员规划了基于知识内涵相关性的映射方案,以实现在该平台上政治学的学科数据归属判别,具体步骤及详细内容见表2。
表2 基于知识内涵相关性的政治学学科映射具体步骤
根据知识点内涵相关性映射方法,完成上述映射过程主要包括明确学科内涵、梳理两类分类体系下的学科分类方法、提取学科映射的知识点元素和完成映射4个步骤。需要指出的是,并不是所有知识点都可完成映射匹配。根据学科发展情境的变化,有些知识点的学科归属还需要视学科变化进程而定,目前暂时无法完成映射。根据对可产生映射关系的学科内涵知识点的挖掘,完成了对CNKI 社会科学I 辑文献中政治学学科的具体映射,提炼出“政治学”“中国政治与国际政治”“政党与群众组织”3个学科类别中的19个具体研究专题的学科数据。
(3)映射方案2:基于《中国高校教学科研成果大数据分析平台》的字面相关性学科映射。2017年南开大学图书馆试用《中国高校教学科研成果大数据分析平台》,该平台是知网研发的评定高校教学科研成果的定量分析工具。平台最突出的特点是学科分类是以教育部2011年《学科目录》与《中图法》(第五版)为基础设置。该平台的文献分类体系与教育部一级学科目录完全一致,属于同质性分类体系,可以采用语义映射法。依据语义相关性选择字面相同的学科名称,即可获取相应的学科数据。为了在多种映射方案中形成相互印证,学科馆员分别将在两种方案中得到的科研产出数据进行对比,其结果数据的差异在可接受的范围内,因此这两种方案仍是CNKI数据库中进行学科归属判别的最为可行的方式。
3.2 CSSCI数据库的学科归属判别实践
(1)分类体系辨析:数据库学科分类依据的多元化。中文社会科学引文索引(CSSCI)是我国人文社会科学重要的文献信息查询与评价工具。关于其分类体系的依据,在其网站上公布的遴选标准[22]中明确指出数据库学科分类的依据是《中华人民共和国学科分类与代码国家标准》(GB/T13745-2009),并参照《学位授予和人才培养学科目录(2011年)》(学位[2011]11号)和《国家社会科学基金学科分类目录》进行。CSSCI的检索系统及与学科相关的检索字段的设置均是数据库学科分类依据的多元化带来的结果。这种现状为学科归属的判别实践带来两个难题:首先是如何甄别“学科类别”与“学位分类”这两个与学科数据检索与获取相关的检索字段;其次是难以应用一种映射方案完成人文社会科学全域范围内的学科数据的判别。可见,对于CSSCI数据库的学科归属判别必须融合多种映射方案完成。
(2)映射方案1:基于字面相关性的13个人文社科一级学科的映射。CSSCI高级检索方式中分别设有“学科类别”与“学位分类”检索字段,选择哪个检索字段作为学科数据的检索字段与其所依据的分类体系紧密相关。CSSCI在其附表中分别提供了“学科代码”“学科类别”的具体含义,其中“学科代码”与《中华人民共和国学科分类与代码国家标准》(GB/T 13745-2009)中的学科代码完全一致,从而也说明CSSCI“学科类别”字段所代表的分类体系来源于国家标准中的学科分类体系;而根据检索实践的结果,“学位分类”检索字段的分类体系更多的是依据《学科目录》。因此,选择“学位分类”字段进行学科数据获取是合理且适宜的。通过对检索字段内涵的甄别,不仅解决了选择检索字段的问题,也完成了对CSSCI学科分类体系的辨析及在此基础上映射方案的规划。由于“学位分类”字段所依据的分类体系就是教育部的《学科目录》,这种分类体系上的同质性使我们可以应用字面相关性的映射方法完成学科数据归属的判别。根据《学科目录》以及教育部学位中心开展学科评估中对人文社会科学学科的设定,人文社科类共包括17个具有博士或硕士学位授予权的一级学科。应用以上映射方案,17个人文社科一级学科中的13个一级学科在学科名称字面上是完全匹配的,可以直接通过“学位分类”字段的检索来获取学科数据,完成映射。
(3)映射方案2:基于语义相关性的2个人文社科一级学科的映射。CSSCI“学位分类”字段包括17个一级学科中的13个学科,无法实现人文社科一级学科的全域映射,马克思主义理论、考古学、中国史和世界史这4个一级学科的学科名称没有出现在“学位分类”字段,必须寻找新的映射途径。
CSSCI“学科类别”字段所依据的分类体系来源于《中华人民共和国学科分类与代码国家标准》(GB/T13745-2009),这与教育部的《学科目录》虽然并不完全一致,但它们本质上都属于同质性学科分类体系,这为应用同质性分类体系下的映射方法奠定了基础。CSSCI高级检索“学科类别”字段的学科范围中设有“马克思主义”和“考古学”两个学科,其中“马克思主义”在字面上与教育部《学科目录》中的“马克思主义理论”学科名称不完全一致,但学科类目名称的语义层面是一致的。因此,对于无法在“学位分类”中获取学科产出数据的马克思主义理论和考古学一级学科,通过语义相关性判别学科归属,选择“学科类别”字段进行数据获取的检索方式也不失为一种可行的方案。
(4)映射方案3:基于《中图法》类目分析的2个人文社科一级学科的映射。世界史于2011年2月正式成为一级学科,与中国史和考古学并列成为历史学学科门类下的一级学科。这种来自学科发展过程的变化没有及时在数据库文献分类中体现出来,目前CSSCI的“学科类别”和“学位分类”字段都只能检索到“历史学”的学科文献,无法将“中国史”和“世界史”文献从其中较为清晰地分离出来,因此根据学科映射方案的总体思路,针对这种特殊学科的处理,需要结合数据库特点探索其他映射方案。
CSSCI设置有“中图分类号”检索字段,可以揭示每篇文献的中图分类号,有利于应用《中图法》类目分析的方法来判别学科数据。具体做法是:选择CSSCI数据库中的“中图分类号”检索字段,收集评价机构在特定评估年份中CSSCI历史学论文的总体数据及中图分类号的相关数据,对照《中图法》,将论文分为“K0 史学理论”“K1世界史”“K2中国史”“K3-7世界各国和地区史”“K82中国人物传记”5个区间,逐一统计分析。其中“中国史”学科数据包括“K2中国史”,“世界史”学科数据包括“K1世界史”和“K3-7世界各国和地区史”。这种方法基本上可以实现“中国史”和“世界史”学科数据的归属判别,但无法做到数据的完全精确,其中数量较少的“史学理论”及“中国人物传记”部分的学术论文的归属还都需要经过与专家协商,从论文的内容中判别学科归属。
CSSCI是人文社会科学学科评价的重要数据来源和分析工具,探讨它在数据学科归属判别实践中的应用具有重要意义,有必要进行全方位整理。关于分别在CSSCI数据库中应用“字面相关性”“语义相关性”及“《中图法》类目解析”3种方案实现对学科数据的判别及有效收集的整体思路总结如图2所示。
图2 应用CSSCI数据库判别人文社科学科数据归属的思路及路径
3.3 WoS数据的学科归属判别实践
(1)分类体系辨析:WoS核心合集学科分类体系的特殊性。Web of Science(WoS)是科睿唯安公司的信息服务平台,支持自然科学、社会科学、艺术与人文学科的文献检索,该平台的WoS核心合集是世界上最有影响力的多学科学术文献文摘索引数据库。作为学科国际科研成果的重要数据源和评价工具,WoS对人文社科学科评价服务的重要意义不言而喻。WoS核心合集包括254个学科类别[23],学科粒度划分细致,其学科体系的划分与业界熟悉的3类中文学科分类体系以及《中图法》文献分类体系均有本质差异,仅从学科名称难以实现对评价学科的准确匹配,必须以新思路实现数据的学科归属判别。
(2)映射方案1:基于知识内涵相关性的学科映射。根据相关理论及过去几年的学科评价实践,南开大学学科服务团队认为可以基于异质性学科分类体系下的知识内涵相关性的方法来规划WoS 平台的学科映射方案,其中的关键在于对学科内涵的深入和全面理解。以政治学为例,从学科名称上看,WoS 核心合集的Web of Science类别字段中有“Political Science”学科,但除了学科名称字面上的对应之外是否还有其他学科也有对应关系,需要进行学科内涵的理解和挖掘。WoS核心合集中的“Master Journal List”部分就收录文献与其学科类别的归属进行了说明,详细描述了254 个学科的文献收录范围,这对我们理解WoS每个学科类别的具体内涵大有裨益。表3 是Categories&Collections(Scope Notes)[24]对Web of Science 类别中的“Political Science” 和“International Relations”学科内涵的描述。根据表3中对这两个学科内涵的描述,看出它们在研究内容、研究范围及所覆盖的知识点上与《学科目录》中“政治学”学科内涵较为一致,可以成为“政治学”的映射学科。在进行学科映射的过程中,由于无法确定是否将Web of Science类别字段中的“Area Studies”也作为政治学的对应学科,学科馆员积极与院系的学科信息专家进行探讨,发现“Area Studies”的学科内涵阐述中虽然也包含政治学的部分内容,但其知识点内涵上更倾向于历史学和跨学科研究。因此,对于映射过程中交叉学科的辨析,在院系学科信息专家的协助下认真完成对学科知识内涵的深度挖掘是十分必要的。
表3 WoS核心合集中Political Science和International Relations的学科内涵描述
(3)映射方案2:应用InCites评估工具的字面相关性的学科映射。InCites是科睿唯安公司基于Web of Science Core Collection 引文数据建立的综合性科研绩效评估工具。自2017年起,南开大学图书馆开始应用InCites进行学科数据获取工作,这主要得益于该平台提供了多种学科分类体系的选择,其中就包括与教育部学科分类体系进行映射后呈现的China SCADC Subject 97 Narrow(教育部110个一级学科中的97个)学科分类体系。由于该分类体系与教育部学科分类体系一致,可直接应用字面相关性的映射方法,选择“研究方向”字段来获取学科数据。例如,选择研究方向=“0202 Applied Economics”,就可以获得应用经济学的学科数据。表4是InCites平台中China SCADC Subject 97 Narrow分类体系与教育部学科评估分类体系中人文社科学科的对应情况。从表4 分析看出,InCites 平台China SCADC Subject 97 Narrow学科分类体系可以实现与教育部学科分类体系中17个人文社会学科中的15个一级学科的对应,只有“0305马克思主义理论”和“0501中国语言文学”2个一级学科,目前暂时无法实现学科映射。
表4 教育部学科分类体系中人文社科学科与InCites平台China SCADC Subject 97 Narrow学科分类的对应
4 案例启示
4.1 学科评价中跨库数据学科归属问题的本质及根本原因
数据的学科归属问题是伴随着学科评价服务的深入逐渐凸显的,在从业者的实践中通常表现为无法通过数据库获取评价学科的科研成果数据,或者说它更为直观地表现为数据库检索难题。事实上,这类问题是涉及学科分类体系、文献分类体系、学科映射方法以及数据库学科评价功能应用等多维度的科学问题。学科归属问题的根本原因是在学科评价服务的特定情境中由学科评价需求联结的两类分类体系之间的差异造成的。这两类分类体系分别是产生学科信息检索需求所依据的学科分类体系和满足检索需求的数据库文献分类体系,它们在分类原则等方面的本质差异引发了数据的学科归属问题。
4.2 规划可操作的映射方法是根本途径
在两类异构的分类体系之间建立可操作的映射关系是解决数据学科归属问题的根本途径,由此关于映射方法的探究成为本文重要的理论基础。本项研究提出规划学科映射总体思路的重要前提是对学科分类体系和数据库文献分类体系进行同质性或异质性辨析,这既需要明确学科分类体系的设置原理及类目层级,也需要分析数据库文献的分类原则及学科评价功能。基于对分类体系的辨析,本文分别构建了基于语义相关性和基于知识内涵相关性的映射方法,并就每种方法在不同数据库中的应用进行了具体阐述。
4.3 对CNKI 和CSSCI 数据库的实践探索是人文社科学科评价数据源全面性的保障
人文社科学科评价中数据的权威性和广泛性有赖于对多源数据的全面收集,但目前所见的研究成果中针对的研究对象几乎全部集中于WoS、ESI和Scopus等外文索引数据库,很少涉及对中文数据源的探讨。本文应用案例研究法,分别探究了如何对来自CNKI、CSSCI 和WoS等数据源的评价数据实现合理判别学科归属的实践过程,尤其是创新性地对CNKI 和CSSCI 数据库规划了多种学科映射方案,这种多维的跨库探索是人文社科学科评价中数据源全面性的重要保障。
4.4 促进多种学科映射方案的相互印证
数据库文献分类体系极具复杂性,一个数据库有时会涉及多种分类体系,同时数据库的学科服务功能也呈现动态性,新的学科评价功能及检索方式时有更新,针对这些变化及数据库的特点,为每个数据库规划多种学科映射方案,并尽力在多种映射方案之间完成学科数据的有效验证十分必要。
4.5 学科映射实践中的制约性因素
应用多种学科映射方案可以完成特定学科在CNKI、CSSCI 和WoS 数据库中的学科映射,但仍会面临一些制约性因素。在基于知识点内涵映射方法的实践中,对学科知识点的提炼十分重要,这既需要充分了解该学科内涵,更有赖于对学科在不同分类体系中的类目揭示的深入分析。例如CNKI数据库的实践中,3种学科分类体系与《中图法》文献分类体系在政治学学科类目层级的划分上呈现高度的一致性,可以较为顺畅地完成知识点映射元素的提取,但这是否适用于所有的人文社科一级学科,有待继续探究。同时,学科评价中一些新情况的出现,例如教育部学科目录对一二级学科设置的变化等,都会影响映射关系的产生。另外,交叉性强的学科的数据归属判别以及数据库学科评价功能的更新等因素都会在一定程度上制约学科映射实践的完成。
5 人文社科学科评价中合理判别跨库数据学科归属的策略
鉴于数据学科归属问题在人文社科学科评价中的重要意义,有必要从单个数据库的个性化实践中提炼出共性的具有指导价值的整体应对策略。根据数据库映射实践案例,提出人文社科学科评价中合理判别跨库数据学科归属的主要策略,如图3所示。解决评价数据的学科归属问题需要从理论到实践,从宏观到微观的全面规划,因此在应对策略中既包括在理论基础上构建映射思路,也包括执行学科映射方案的具体方法,更值得注意的是其中需要考虑的情境性因素。合理、动态的实践情境对于人文社科学科评价的学科归属判别具有重要意义,这既有赖于从事学科评价服务的馆员与院系信息专家的深度合作,也需要馆员始终以动态的思维和发展的眼光关注学科发展的进程和数据库学科评价功能的不断完善。
图3 人文社科学科评价中合理判别跨库数据学科归属的策略
6 结语
在“双一流”建设的大背景下,学科评价中数据的学科归属问题不仅直接影响着学科评价数据的精准性,也会对交叉学科及学科分类研究产生间接影响,因此对此类问题的持续关注和探究意味着要继续从理论上展开对多种学科分类体系和学科映射方案的探讨,也意味着要积极推动和鼓励形成可推广的实践对策。同时,本项研究主要应用了人工映射方式下的不同映射方案,这与目前人文社科学科评价情境及学科发展的动态性和复杂性较为契合,但未来是否可以在处理好诸如学科分类体系变化、学科内涵丰富、数据库评价功能更新等因素的基础上实现人工映射与自动映射的融合值得进一步探索。