学科导航系统语义化研究与探讨
2017-07-18李福林王庆民
邰 峻 李 博 李福林 王庆民
(中北大学图书馆,山西太原 030051)
学科导航系统语义化研究与探讨
邰 峻 李 博 李福林 王庆民
(中北大学图书馆,山西太原 030051)
为提升学科服务效能,促进学科资源的有效组织与整合,针对学科导航建设存在的问题,提出利用领域本体技术构建语义化学科导航。在分析领域本体语义表示机制和学科导航语义关系的基础上,给出了语义化学科导航构建方法和流程,并以中北大学兵工学科导航建设为例,验证了可行性,经导航功能测试,可以实现语义导航。
学科导航;语义;学科资源;领域本体
1 引言
近年来,随着学科服务在国内外图书馆服务中的推进和深化,学科资源建设成为图书馆界关注和研究的热点。为有效组织、整合学科资源,各高校图书馆纷纷搭建学科导航,为学科建设提供强大的信息支撑。但从学科导航建设现状来看,由于没有统一的建设规范,缺少智能化的资源组织工具,缺乏对资源的深层次加工。学科导航主要采用等级列举式的分类导航和主题导航,基本是以网页链接为主,资源形式单一,资源揭示深度不够,难以体现学科资源的内在关联关系,及学科知识之间的内在逻辑关系[1]。而本体作为一种知识组织的理念与方法,具有良好的概念层次结构和对逻辑推理的支持,用作领域知识的抽象和描述,能够对学科资源的本质及其内在关联进行揭示和控制,其与传统的主题法、分类法相比,可以增强语义表达,利于实现语义检索[2]。为此,笔者提出基于本体的语义化学科导航建设,借助领域本体语义表示机制设计、构建学科导航,以提高学科导航的服务效能。
2 领域本体语义表示机制及作用
本体是概念化的明确的规范说明[3],被越来越多地应用于计算机知识工程领域。Neches认为“本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则”[4]。领域本体是专业性的本体,特征是针对特定的学科领域,描述某一学科中的概念、概念的属性、概念间的关系以及属性和关系的约束[5],是对领域中的知识、概念、实体及其关系进行明确规范的概念化描述,提供特定领域中的概念和概念之间的关系及主要理论等[6-7]。领域本体通过利用语义表示元素——概念、属性、关系、函数、公理、实例,定义领域中基本的概念、概念的属性、实体及他们之间的关系,实现对领域知识的表达[7]。领域本体作为知识表示工具,通过对领域知识规范的抽象和描述,可以构建特定领域的概念模型,构造特定领域中概念间的语义关系,准确描述概念含义以及概念之间的内在关联,形式化能力最强,并具有高度的知识推理能力,能通过逻辑推理获取概念之间的蕴涵关系,体现特定领域的知识结构体系[8]。
将领域本体的语义表示机制引入学科导航的构建,可以以一种结构化、语义化的概念知识组织为基础实现对学科资源的描述与整合,形成一个包含有学科专业知识在内的有序的学科资源体系。借用领域本体的语义表示元素将学科领域的学科资源、概念抽象化,并定义资源、概念之间的相互关系,可以揭示学科体系中除一般的隶属关系、等级关系外的其他如平行关系、功能关系、对象关系、作用关系等,利于展现学科体系中主客体之间丰富、复杂的语义联系,如合作者关系、相互引用关系、关联关系等。相比于传统等级列举式体系结构的分类导航和以关键词匹配检索的主题导航的线性、简单组织方式,领域本体组织方式在强调概念间的层级聚合和类别体系的同时,更加注重知识资源之间关联关系的揭示,增强语义表达,能够以可视化的网状结构揭示学科体系结构中的各种关联,使学科知识的表示从信息的集合上升到知识网络和知识地图,对学科资源的组织更加专业,更加适合个性化、专业化的学科知识服务[9]。
3 学科导航语义关系
学科导航是对学科领域的学科资源进行揭示和提供利用的信息组织模式,学科资源包括学科专业、学科主题、学科领域的人物、机构及学术资源。其中,学科主题是由学科领域知识单元、知识术语或概念组成的集合,构成学科知识概念体系;学科领域的人物由学科领域专家、学者组成,机构是指学科领域的科研机构,包括高校、科研院所和实验室;学术资源包括学科领域的文献资源,包括学术著作、学术期刊、学术论文、科技成果、专利文献、会议文献、视听资料等。语义化学科导航是利用领域本体技术对学科资源的语义结构进行描述、揭示与整合,以揭示学科资源之间的关联。学科导航的语义结构框架,如图1所示,包括类目语义信息、属性语义信息、实例语义信息等[7,10-11]。
(1)类目语义信息。指学科资源之间的相互关系,包括层级关系、对象关系、功能关系、作用关系等。如图1中的学科专家与学科主题之间研究与被研究的关系、学科专家与文献资源之间创作与被创作的关系、学科专家与研究机构之间工作单位的关系、学科专家与学科专业之间研究方向的关系以及学科专家之间的合作关系、学科资源之间的互引关系、学科主题之间的上下位及相关关系等。类目之间语义关系的设置可以通过定义属性来实现。
(2)属性语义信息。属性包括对象属性(Object Property)和数据属性(Data Property)。前者用以描述类目间关系,如前述“研究”“合作”“创作”等关系;后者用以描述类目自身的内在特征。如图1中学科专家的属性有姓名、性别、职称、学历等。属性间也可以设定层级关系,如被引、共引可以是引用的子属性,密切相关、一般相关可以是相关的子属性。
(3)实例语义信息。实例是对类目的具体化。通过依照类目的属性设置对实例赋值,可以建立个体实例间的语义互联。如某学科专家和某研究机构的关系可以通过对图1中学科专家和研究机构的属性设置及对该学科专家和该研究机构进行赋值来完成。
(4)类目与属性间关系。主要指为类目定义属性。如可以将图1中属性定义在对应的类目下,即上层类目的属性定义在上层类目下,下层类目的属性定义在下层类目下,因为下层类目会继承上层类目的属性。如题名、作者、主题、摘要为文献资源的共有属性,可以定义在文献资源类目下,刊名、ISSN是学术期刊的特有属性,可以定义在文献资源的子类学术期刊类目下。
(5)类目与实例间关系的确定。类目与实例间的关系主要通过为类目添加实例来定义,如可以通过为图1中类目“学科专家”添加实例“李强”来定义李强与类目学科专家的实例关系。
(6)实例与属性间关系。可以通过为图1中的实例进行属性赋值建立实例与属性间关系。
构建语义化学科导航的关键是语义分析,语义关系设计的优劣直接影响所建导航的应用效果。
4 语义化学科导航构建实例
以中北大学重点学科——兵工学科导航建设为例,构建方法与流程如图2所示[3,5]。
4.1 确定学科领域和学科资源范围
图1 学科导航的语义结构框架
根据学科导航构建目标及导航功能,参照国务院学位委员会、教育部印发的《学位授予和人才培养学科目录》中学科目录的设置,结合学科研究方向,确定导航系统的学科领域、学科专业和学科资源范围。中北大学兵工学科导航以中北大学重点、特色学科——兵器科学与技术学科为依托,参考中图分类法、汉语主题词表、中国分类主题词表、国防科技名词大典和中国知网文献数据库,结合我国数字图书馆标准与规范建设项目(CDLS)的相关标准,对2005年以来中北大学在兵工学科领域的重要研究成果进行搜集和组织加工。学科资源范围为:兵工学科专业、兵工学科主题、兵工学科研究机构、兵工学科专家及其科研成果,包括学术著作、学术论文、学位论文和专利等。
图2 语义化学科导航构建流程
4.2 学科导航语义模型设计
学科导航语义模型设计是采用自然语言设计学科导航类目体系层次结构,即学科导航类目体系的构建,以体现学科导航中的语义关系,包括以下步骤[6,10]。
(1)类目体系设计
中北大学兵工学科资源导航采用自顶向下展开的方式进行设计,包括学科资源体系的顶层分类设计及向下展开的子类设计。导航的顶层类目设计为“中北大学兵工学科导航”,顶层类目下的一级类目划分为:学科专业、学科主题、学科文献、学科专家、学科机构等,一级类目下还可以继续划分二级类目、三级类目、四级类目,最终形成学科导航体系。学科主题概念等级层次的划分可以参考中图法对学科类目等级的划分。
(2)类目属性设置
类目的属性包括对象属性和数据属性,用以描述类间关系和类的自身内在属性,以此体现学科资源之间的语义关联。按照前述学科导航的语义结构框架设置中北大学兵工学科导航的类目间关系属性(表1),学科主题中主题概念(知识术语)间关系的设置可以参考中图法中类目等级关系及参照关系的设计,并可以根据需要进行扩展;类的自身内在属性可以根据类自身的特征来设置,如文献资源的属性可以结合DC元数据的15个核心元素,如题名、主题、创作者等进行设置;学科专家的属性可以结合人物特征如性别、职称、学历等进行设置。
表1 类目间关系属性设置(对象属性)
(3)导航类目的实例创建
对学科导航中的类目层次结构及属性定义后,需要为类目添加实例,即根据导航功能对学科资源进行实例化,并按照之前设计的类目属性对实例进行描述。实例是学科资源的具体化个例,如文献资源中的个体实例(资源实体)构成资源导航的文献源。因此,个体实例的创建质量会对导航的效果产生影响。
4.3 导航系统的实现
学科导航模型框架设计完成后,需要利用本体描述语言将导航模型规范地、形式化地表示出来,即从自然语言的表示形式转化成机器可理解的逻辑表达形式。由斯坦福大学研制开发的Protégé开源软件,是基于Java的本体开发工具,可以直接采用自然语言进行编辑,并能实现查询推理的功能,为学科导航本体构建提供了较好的开发环境[12]。图3为Protégé工具中的中北大学兵工学科导航的编辑界面,左侧为中北大学兵工学科导航资源类目层次结构,中间为创建的学科专家中教授的个体实例,右侧为某专家教授的属性赋值。利用标签、、和可以对学科导航类目进行编辑、属性设置和实例创建。学科主题导航、学术期刊导航、学术著作导航及学术论文导航的编辑界面及方法与此类似。
图4为中北大学兵工学科导航(片断)的可视化展示,其中圆点代表类,菱形代表实例,实线箭头指向下一级类目或类目的实例,虚线箭头表示连接的两个类或实例是相关的,左上角带加号的类目是可以进一步展开的类目,点击加号可以显示与该类目相关的类目或实例及其间的关联关系,若将鼠标悬停于箭头上,则会显示箭头连接的类目之间的关联关系。
5 导航功能测试
5.1 可视化浏览导航
在图4所示的导航图中点击所需的信息节点时,系统会以星形或树形向用户展现与该节点相关的其他信息节点及其间的相互关系。如在图4中进一步点击个体实例,会展示与该实例相关的信息节点及其间的关系,由此,通过资源之间的关联关系浏览感兴趣的信息节点,可以实现语义导航,与等级列举式的导航相比,能够获得更多的相关信息。
5.2 关键词检索导航
图3 中北大学兵工学科导航编辑界面
在导航图的search查询框中输入某一关键词,可以同时检索到与该检索词相关的主题、学术论文、专家、学术期刊、学科专业等。图5是输入关键词“装药”后的检索结果,可以看到检索到的相关学术论文、学科专家、学科专业、学科主题、学术期刊等,如果将鼠标指针置于某一个体实例,可以看到该个体实例的其他相关信息。
图4 中北大学兵工学科导航(片断)
图5 关键词检索样例
同例,在search查询框中输入某一专家姓名,可以同时检索到该专家的研究成果及合作者等信息。如果将鼠标指针置于该学科专家的姓名时,会显示该专家的个人信息,包括姓名、性别、出生年月、职称、学历、研究方向等;如果想查看专家某一具体的成果信息,可以点击成果名称左边的加号图标。
6 结语
为提升学科导航的应用效能,促进学科资源的有效组织与整合,提出利用领域本体技术构建语义化学科导航。在分析领域本体语义表示机制及作用和学科导航语义关系的基础上给出了构建流程,并以中北大学兵工学科导航建设为例进行了实践。利用Protégé工具对中北大学兵工学科资源进行概念、属性及关系的语义标注,为资源赋予检索标识,完成对学科资源的整序,实现学科导航的可视化展示。经导航功能测试,可以实现语义导航、关联检索,相比于传统等级列举式的分类导航和以关键词匹配检索的主题导航,在语义表示和导航功能上更具优势。利用领域本体技术构建语义化学科导航有利于揭示庞大的学科知识体系,构建过程中需要发掘领域知识的每个类、概念及节点,理清各类及概念之间的语义关联,并合理把握基本概念单元范围的大小以及描述程度的粗细。构建一个功能完备的学科导航是一项巨大的工程,鉴于笔者水平所限以及对领域知识了解不够,所建学科导航在规模、深度上都比较简单,仅通过实例对利用领域本体技术构建学科导航进行了可行性的验证。所建学科导航在资源范围和知识深度方面都有待扩展,后续还需要继续扩展和完善新的类以及类与类之间的关系,使知识体系更加完善,最终建成动态开放、实时更新、全面共享的学科导航,为科研用户提供更加专业化的服务。
[1] KLESS D, MILTON S, KAZMIERCZAK E. Relationships and relata in ontologies and thesauri: differences and similarities[J].Applied Ontology, 2012, 7(4): 401-428.
[2] 秦春秀, 赵捧未, 窦永香.一种基于本体的语义标引方法[J].情报理论与实践, 2005(3): 244-246.
[3] 邱均平, 楼雯.基于CSSCI的情报学资源本体构建[J].情报资料工作, 2013(3): 57-63.
[4] 付永林.基于领域核心的本体碰撞与演化研究[J].情报理论与实践, 2012(4): 38-42.
[5] 杜小勇, 马文峰.学科领域知识本体建设方法研究[J].图书情报工作, 2005(8): 74-78.
[6] 邱均平, 杨强, 楼雯.资源本体构建理论与实证研究[J].情报理论与实践, 2014(5): 1-6.
[7] 刘云, 张玉峰.基于本体论的语义导航模型研究[J].图书馆杂志, 2005(10): 52-56, 33.
[8] 杨发毅, 陆敏, 赵晶.基于本体的学科资源建设辅助决策系统研究[J].情报理论与实践, 2011(6): 107-110.
[9] 冯玉, 雷菊霞.学科信息门户的知识组织体系分析[J].情报理论与实践, 2006(1): 33-36.
[10] NGUYEN L T T, MATOKHINA A V, KIZIM A V. Cretion and use of ontology of subject domain “electrical engineering”[C]//International conference on application of information & communication technologies,IEEE, 2015: 25-29.
[11] 王功辉, 黄奇, 秦超, 等.本体构建中的语义分析方法研究[J].图书情报工作, 2013(7): 106-111.
[12] 孙瑾.本体编辑工具的分析与研究: Protégé 2000对中文本体编辑的适用性探析[J].图书情报工作, 2006(12): 26-29, 97.
Research and Discussion on the Semanteme of Subject Navigation System
TAI Jun, LI Bo, LI Fulin, WANG Qingmin
(Library, North University of China, Taiyuan 030051)
In order to improve the efficiency of subject service, and promote the effective organization and integration of subject resources, and aiming at the problems existing in the construction of subject navigation,this article puts forward using the technology of domain ontology to construct semantic subject navigation.Based on the analysis of the semantic representation mechanism of the domain ontology and the semantic relations of the subject navigation, this article o ff ers the construction process, and uses ontology construction tools Protégé in the ordnance science navigation construction of North University of China. The navigation function test showed that the semantic navigation can be achieved.
subject navigation, semantics, subject resources, domain ontology
G354
A
10.3772/j.issn.1674-1544.2017.03.005
邰峻(1972—),女,中北大学图书馆副研究馆员,硕士,研究方向:信息组织、情报研究(通讯作者);李博(1972—),男,中北大学图书馆馆长,副教授,博士,研究方向:图书馆管理;李福林(1978—),男,中北大学图书馆馆员,硕士,研究方向:图书馆自动化与数字化;王庆民(1976—),男,中北大学图书馆讲师,硕士,研究方向:计算机应用技术。
山西省科技基础条件平台建设项目“山西省兵器科技文献资源保障与服务中心平台”(2009091001-0905);中北大学高等教育教学改革研究项目“兵工特色学科资源建设研究与实践”(2014);中北大学高等教育教学改革研究项目“新时期高校图书馆发展与变革”(2014)。
2017年1月9日。