基于本体构建的人文社科专题资源应用场景研究
2021-11-07张缘圆宋歌袁曦临
张缘圆 宋歌 袁曦临
摘 要 现有的人文社科资源组织与应用形式难以支持知识的利用与共享,而基于本体的人文社科资源应用形式能实现资源关联,凸显检索与可视化等优势,有助于促进人文社科领域研究范式的转换。以家庭伦理研究领域为示范,通过确定范畴领域、构建概念层级和设置属性等步骤,采用Protégé工具实现了本体构建,并运用图数据库探索了可实现的资源应用场景:存储、检索与导航。基于本体的家庭伦理专题资源应用不仅可以为领域研究提供更为准确的内容逻辑关联,也有助于提升专题资源的存储、检索等应用水平。
关键词 本体构建 资源应用 人文社科资源 家庭伦理
分类号 B823.1;G253
DOI 10.16810/j.cnki.1672-514X.2021.09.001
Abstract The existing humanities and social sciences resource organization and application forms are difficult to support the use and sharing of knowledge, but the humanities and social sciences resource application forms based on ontology can realize resource association, highlight the advantages of retrieval and visualization, and help promote the transformation of the research paradigm in the field of humanities and social sciences. Taking the field of family ethics research as an example, through the steps of determining the category field, constructing the concept hierarchy and setting attributes, the Protégé tool is used to realize the ontology construction, and the graph database is used to explore the subsequent achievable application scenarios: resource storage, retrieval and navigation.Ontology-based application of family ethics special resources can not only provide more accurate content logical associations for field research, but also help improve the application level of the storage and retrieval of special resources.
Keywords Ontology construction. Resource application. Humanities and social sciences resources. Family ethics.
专题资源是面向特定领域、特定主题等特定对象的知识型资源集合[1],人文社科专题资源种类繁多,资源间的关联关系错综复杂。传统的资源组织方法如分类法、主题词表法等侧重于从内容特征与物理特征等方面展现资源属性,难以揭示专题资源的内在关联关系[2],在体现资源间的逻辑关系上存在一定困难。随着数字化转型的深入,数字人文、社会计算等蓬勃发展,人文社科资源的数字化建设与应用逐渐兴起[3]。以数字化的方式组织、揭示与应用专题资源,为研究者和读者提供便捷和可用的数字访问成为我国人文社会科学研究的一个新领域。
1 人文社科专题资源建设及其应用瓶颈
我国人文社科领域专题资源的建设与应用情况并不理想,许多人文社会学科仍通过传统资源组织方法如主题词表、分类法等进行资源组织与建设,资源之间的层次化、关联化程度较低。近年来,人文社科领域开始借助计算机和数字信息技术对文本资源进行数据化建设[4],但在数字化建设与应用的过程中也存在一些问题。一方面,人文社科资源建设与应用涉及系统工具选择、数据收集与加工、数据存储等多个方面,但长期以来,各类主体在建设与应用资源时缺乏沟通联系,数据格式、数据标准、开放与共享机制等缺乏普遍共识[1],资源孤岛与碎片化现象严重;另一方面,以核心概念与情境为中心的人文社科资源建设与应用尚在起步阶段,许多数据建设平台功能单一,检索效率低下,可用性较差[5]。总体来看,我国人文社科专题资源的建设与应用存在着主体各自为政、数据共享程度低、应用效果差等问题,导致最终成为“封闭式”的“死”资源。
在知识共享与重用需求的推动下,本体成为语义网环境下资源组织与应用的关键工具[6]。“本体”一词最早出现在哲学领域,指事物的本源和本质。Gruber[7]指出“本体是概念化的明确的规范化说明”,构建的本体可以揭示资源本身及资源之间更为复杂和丰富的语义信息,体现专题资源概念规范性、资源关联性等特点[8],解决语义层次上资源的共享和交换[9]。Chinnapong A等[10]设计了多媒体语义传感器网络本体用于定义与检索各领域中的事件;Wonchul S等[11]利用本体方法实现了知识密集型服务中的人员角色分配。总之,本体具备良好的概念层次结构且支持逻辑推理,能够将资源的语义特征及其相互之间的语义关联充分揭示与呈现;同时提供可视化服务,帮助用户更加有效、便捷地浏览信息、利用资源、发现知识,相对而言是一种建设人文社科专题资源的良好工具[12]。通过本体构建,可以为人文社科专题资源的分析、表示提供良好的解决方案,从而为提供后续的检索等应用奠定良好的语义基础。目前已见有相关研究,如盈艳等[13]采用半自动化方法构建了面向新闻网站应用的新闻社区领域顶层和中层本体模型;郝挺雷[14]基于CIDOC CRM概念模型构建了传统节日知识本体,并以端午节为例予以实现。但是基于所构建的本体,进行进一步的应用场景设计,并最终予以实现的研究尚不多见,特别是在人文社科专题资源领域。本文将本体思想融入人文社科专题资源应用场景的探索中,构建人文社科专题资源本体并以此为基础实现资源的有效应用,以期进一步提升专题资源組织与应用水平。
2 问题域的选择及其理由
选择中国家庭伦理研究相关领域,作为本研究的问题域。我国传统文化与世界其他国家的显著区别之一是对于家庭伦理的高度重视。蔡元培指出,我国从唐虞三代开始便将实践道德纳入理想[15]5。张岱年认为,我国道德观念始于殷周时代,作为体系化的理论则由孔子提出[16]4,可以说在古希腊的同时期,我国伦理学研究已经兴起。中国伦理学立足中华民族传统道德文化,注重从人格本质的角度对伦理精神和道德心理进行研究,在一定程度上开辟了属于中国人自己的路径。家庭伦理是家庭领域的伦理学,是调整家庭成员之间以及个人与社会之间在婚姻家庭问题上相互关系的行为规范的总和[17]。家庭伦理不仅是社会道德的基石,而且在不同社会历史时期也反映着不同社会家庭状况及相应的家庭社会关系,体现社会发展进程,反映人类文明进步。因此家庭伦理领域不仅是伦理学研究的重要组成部分,也是中国人家庭关系和社会生活的汇聚焦点。
所谓窥一斑而知全豹,在家庭伦理领域进行本体构建并探索其资源应用形式,有助于解决人文社科专题资源的关联组织、语义理解和逻辑推理问题,有助于帮助实现人文社科资源的高效存储、检索与导航等应用,提高领域知识的复用和共享水平。目前家庭伦理领域的概念梳理、组织与数字化应用是相对薄弱的,现有家庭伦理领域分类表和主题词表中并未对家庭伦理领域做更为细致的分类,《中国图书馆分类法》中有关家庭伦理的类目为“家庭道德”,其没有下位类目,较为笼统;《汉语主题词表》中也只有少数主题词与“家庭伦理”相关。经调研国内目前以“伦理”为主题的工具书只有23本,其中17本是20世纪出版且多以百科全书分卷的形式呈现,21世纪以来伦理学的工具书出版数量较少,没能做到紧随时代变化不断更新概念;以“家庭伦理”为主题的工具书仅有一本,即1993年出版的《中国伦理百科全书·婚姻家庭伦理卷》。另一方面,传统的词表无论是纸质版还是电子版,都只提供了一种用、代、属、分、参的词间参照关系,尽管有词间关系,但这种关系是固化的、线性的,不能提供语义理解和推理功能,不能满足数字环境下的语义搜索和查询,在使用过程中作用有限。而家庭伦理领域涉及主题、关系众多,概念及其关系较为复杂,现有词表等无法展现复杂的词间关系,也无法提供更为深入便捷的应用,与用户期望效果相距甚远。以概念本体为基础探索家庭伦理领域资源组织与应用不仅可以有效整合领域内的核心概念词汇,将词汇间的显性关系及隐形关联通过可视化及推理进行展示,还可以为研究者和读者提供便捷有效的存储、检索和导航等资源应用,更好地推动领域与数字时代的对接。
3 家庭伦理领域本体构建
常用的领域本体构建工具主要包括两类:第一类包括Ontoligua、Ontosaurus、Webonto等,与某种本体语言有着紧密的联系, 有很强的本体语言依赖性;第二类包括Protégé、Ontoedit等,这类工具支持独立于本体的描述语言,可以导入导出多种语言格式如XML、RDFS等[18]。Protégé属于开放源代码软件,支持可视化视图,在推理机制方面支持语法检验和一致性检验,支持插件扩展,同时支持多种格式输出,因此本研究选择Protégé5.5.0[19]作为本体构建工具。领域本体的构建方法有骨架法[20]、五步循环法[21]、METHONTOLOGY法[22]、七步法[23]等方法。本研究以斯坦福大学开发的七步法为基础,结合其他本体构建方法的优点,按照确定领域本体构建范畴、构建概念等级层次、定义概念属性与创建实例这四个步骤构建家庭伦理领域概念本体。
3.1 家庭伦理本体概念层级构建
家庭伦理是在一定的社会历史条件下形成的处理家庭成员之间关系的行为准则[24]。我国社会主义社会的家庭伦理强调继承和发扬中华民族的优良道德传统,大体包括三个方面的内容:建立夫妻平等相爱的关系、父母抚育子女的关系和赡养尊敬老人的关系[25]。本文的研究对象是新时期(中华人民共和国建立至今,以改革开放为界划分为两个阶段)我国家庭伦理专题资源。
由于现有分类表和主题词表中并未对家庭伦理领域做更为细致的分类,既有本体研究项目也并无相关本体可以进行复用,所以本研究对家庭伦理领域概念层级进行了整体梳理。首先,以家庭伦理为整体概念对象,总结出五大概念类:“时期”“人物”“地域”“内容”和“现象”。每个概念类都有其关注焦点,每个对象只能在每个概念类的一个子类上找到一种对应关系;其次,借鉴已有的分类词表、著作、论文、相关网站等,并结合专家经验,形成家庭伦理领域核心概念集合;最终,确定子类,将核心概念整理分类并建立等级层次关系。分类时采用自顶向下法[26]将核心概念按自上而下的原则进行归纳整理,抽象出具有规范化定义的类,确定子类名,分类时要减少冗余;另外,借鑒ODP开放式目录来确定核心概念间的等级层次关系。家庭伦理本体的概念类最少为3个层级,最多为5个层级,如图1所示。各个类目下的子类都可以分别再进行更为细致的分类,分类数量众多,因篇幅所限没有在图中全部展示。如“人物”类目下的“年龄”可以分为“18周岁以下”“18周岁及以上”;“婚姻状况”可以分为“未婚”“已婚”和“离异”;“现象”类目下的“社会事件”可以分为“经济事件”“政治事件”“文化事件”等,其子类下也可以再进行更加详细的划分。
3.2 家庭伦理本体属性设置
要建立一个相对完整的领域本体,不但要提取和捕获这个领域中的核心概念,还要明确概念间的相互关系。因此,要构建逻辑关系完备的本体必须要明确本体中概念和实例的对象属性(Object Properties)与数值属性(Data Properties)。其中对象属性指不同概念之间的关系,连接的是概念与概念;数值属性连接的是概念与数值[27]。
家庭伦理本体对象属性的设置如表1所示,可分为外部属性和内部属性。外部属性是指概念类与子类之间的关系,内部属性是类别及概念间的一些固有属性。
“ is attribute of ”“ is instance of ”三种,如图2所示。其中“ is a ”和“ is attribute of ”虽然都连接的是具有上下位类层级关系的两个概念,但“ is a ”所连接概念的本质是相同的,即同质异构体;“ is attribute of ”则表达一个概念是另一个概念的特征或属性,概念的本质并不相同。例如“家庭伦理剧”“家庭伦理电影”“家庭伦理著作”等都与“艺术作品”是上下位类关系,它们的本质都是“艺术作品”,因此与“艺术作品”是“ is a ”关系;而“性别”“年龄”“职业”等都只是“人物”的某一方面特征,其本质并不是“人物”,因此与“人物”是“ is attribute of ”关系。
家庭伦理本体中对象内部属性关系共有8种,如图3所示,用来表示家庭伦理本体中对象的固有属性。比如,三从四德适用于女性、已婚、改革开放前,就可以表示三从四德“ has user ”女性、已婚,“ has era ”改革开放前。
由于只有“创作作品”类目下的实例具有数值属性(Data Properties),因此仅对“创作作品”的实例设置数值属性。通过整理归纳最终得出的数值属性有年份(Year)、版本(Version)、时长(Duration)、页数(Page numbers)、价格(Price)5种。
3.3 创建实例及可视化
本研究在家庭伦理本体模型构建的基础上添加了实例,选取四种家庭伦理创作作品作为实例样本:家庭伦理剧——《我的前半生》和《渴望》,家庭伦理电影——《狗十三》和《过春天》,数值属性为年份(Year)、版本(Version)、时长(Duration)。电视剧和电影的信息(包括电视剧播放年份、剧集数、总时长、版本)均来自视频APP爱奇艺。在本体模型构建、实例信息获取的基础上,笔者利用本体构建工具Protégé实现本体编码。借助Protégé5.5.0自带的OntoGraf插件可以实现本体的语义关系查询及其可视化,以“《渴望》”为例进行检索展示,展开检索到的相关概念(如图4所示),可以发现实例间丰富的语义关联。图4中带箭头的实线表示对象外部属性,带箭头的虚线表示对象内部属性;点击某个特定实例或概念时,会以该位置为起点,将与其直接相关的概念或实例间的连线加粗,方便用户查看关联情况;将鼠标移至连线上可以显示此连线代表的关系名称;数值属性在可视化中不以个体形式出现,可以在操作面板或通过点击实例查看。
语义关系的揭示是本体建设与检索的重点,通过检索所得图示可以发现实例与理论概念之间的相关关联,推论出一些构建本体时没有发现的关联关系和隐性内容。通过图4可以发现,两部家庭伦理剧讲述的都是“華东地区”的“城市”中的“夫妻关系”,适用人物主要为民族为“汉族”、年龄为“18~55周岁”、职业为“单位工作者”的“女性”。但两部剧也有不同之处,《渴望》属于“改革开放前”,而《我的前半生》属于“改革开放后”;同时《渴望》涉及的是“三从四德”属性,而《我的前半生》则与“相敬如宾”相关,这可以在一定程度上体现出夫妻关系随着时代的发展在不断改变,女性地位有所提高。分析图4中与“家庭伦理剧”实例相关的概念属性与路径可以发现,实例间的关联关系得到拓展,即《渴望》与《我的前半生》有一定的继承发展关系;还发现一些实例间的隐性内容,如“夫妻关系”是在以城市生活为背景的家庭伦理影视剧的聚焦点,“18~55周岁”的“汉族”“女性”是主要聚焦人物。
本研究构建的家庭伦理概念本体建立起了领域中核心概念、实例间的关联关系,体现了本体语义的优势[28],可以为今后家庭伦理研究提供准确的内容逻辑关联。概念本体厘清了家庭伦理领域中的概念流变过程,明晰了概念间的关系,便于学科概念间的连接,同时可以将领域概念及其涉及属性与实例相链接,使得理论研究可以得到社会实例支撑,社会实例可以对应到理论依据,保证了理论研究与实际运用的紧密结合。
4 基于家庭伦理本体的专题资源应用场景实现
本体构建完成后通常在关系型数据库中进行存储与应用,但关系型数据库在进行存储、查询等操作时存在存储空间浪费、查询效率低下等问题。非关系型数据库(NoSQL)更适合存储与操作多关系型数据,不仅可以实现更高效的数据存储,还提供效率高于关系型数据库的查询及可视化操作。Neo4j图数据库是一种高性能的NoSQL数据库,具有持久存储、支持海量数据等特点,而且该数据库使用图的遍历算法设计数据查询算法,在查询性能与可视化效果上具有独特优势。因此,本研究选择Neo4j图数据库对本体进行存储,通过构建Cypher查询语句并利用Neo4j提供的最短路径等图算法实现家庭伦理专题资源应用。
4.1 资源存储场景的实现
基于Protégé平台实现的家庭伦理本体存储采用的是RDF/XML Syntax的存储格式。完成本体构建后会生成相应格式的代码文件,为后续存储场景的实现奠定基础。在家庭伦理本体构建过程中形成的领域核心关联词汇集可以解决语义层次上资源的共享与交换,为伦理学知识库提供基本结构,同时在后续研究中图数据库可以作为系统后台,通过自主开发实现更多领域前沿应用。
Neo4j图数据库的基元主要有节点、关系和属性三种元素,这种图结构与RDF三元组十分相似但仍有所不同。为了实现较好的存储与可视化效果,需要将构建的OWL领域本体与图架构相匹配,即将家庭伦理本体的RDF数据与Neo4j的基本组成元素进行映射转储。
(1)节点映射。Neo4j节点表示领域本体中不同类型的资源,如概念类、具体概念和实例。家庭伦理本体中的概念与实例分别映射至Neo4j中的类与实例,分别创立“Class”和“Individual”标签;节点则为具体的概念名与实例名,如“夫妻伦理”“《渴望》”等。
(2)关系映射。Neo4j关系连接的是不同类型的资源节点,即通常所说的对象属性。外部对象属性如概念之间的“is a”“is attribute of”关系,概念与实例之间的“is instance of”关系,在利用本体工具Protégé构建本体时已经生成,可直接转储;自定义的内部属性则通过手工添加进行映射。
(3)属性映射。经过上述调整,属性仅作为概念与实例性质的基本描述,即本体中的数值属性,包括年份(Year)、版本(Version)、时长(Duration)、页数(Page numbers)、价格(Price)5种。
4.2 资源检索场景的实现
以往资源检索通常仅以列表形式呈现符合用户直接需求的检索结果,缺乏对资源语义关联的呈现,对专题资源的检索过于简单与单一。但基于本体所实现的资源检索不仅能够准確匹配符合用户需求的资源,还可以返回与该资源直接相关的所有资源,并以可视化的方式呈现资源间的关联关系;同时可以实现对资源关联路径的检索等,极大地提升了资源检索质量,使用户可以更准确、更直观、更全面地获取所需资源。本研究基于本体所实现的专题资源检索严格来说属于狭义资源检索范畴[29],即采用语义匹配方式[30-31],实现本体库中资源的有效查询,主要包括以下3种功能。
(1)C-path(x)语义检索。C-path(x)语义检索是指以单个概念或实例作为检索词进行检索。如果该概念在领域本体库中存在,则以可视化的方式返回与概念节点直接相关的所有节点,包括上位概念、下位概念、实例等,实现全面的资源检索服务,便于用户快速准确地了解与掌握领域资源。例如,用户想要查询“夫妻关系”概念,则通过构建查询语言:MATCH (e:Class {name:"夫妻关系"})return e,准确定位至“夫妻关系”,点击“夫妻关系”将其展开,得到图5。从图5中可以清楚发现与“夫妻关系”直接相关的11个概念,相关概念间的关联关系也会显现;同时在图上方会显示检索语句、概念与关系个数和涉及到的各个具体关系及其个数。Neo4j检索与Protégé检索的区别在于前者以星形方式呈现检索结果且概念间关系会直接在图中显示,而后者以树形方式呈现检索结果而概念间关系需要通过点击才会出现。
(2)C-path(x,y)路径检索。C-path(x,y)路径检索指的是进行节点即概念或实例间的关联路径检索。如果概念或实例均在领域本体库中存在,则以可视化的方式返回两个节点的关联路径。例如,用户想要查询“夫妻关系”与“《过春天》”之间的关联路径,则通过构建查询语言:MATCH p=(a:Class {name:"夫妻关系"})-[*3]-(b:Individual {name:"过春天"}) RETURN p,得到查询结果如图6所示,图中黑色节点代表概念,灰色节点代表实例。由图可以发现“夫妻关系”与“《过春天》”共有7条关联路径,1条2关系路径,5条3关系路径和1条4关系路径。
C-path(x,y) 路径检索还可以利用图算法进行最短路径检索,即查询两个节点间的最短关联路径。以查询“夫妻关系”与“《过春天》”之间的最短关联路径为例,构建检索语言:MATCH (a:Class{name:"夫妻关系"}),(b:Individual {name:"过春天"}), p=shortestpath
((a)-[*..5]-(b)) RETURN p,得到检索结果如图7所示,即以“女性”为中介,以“has user”和“is instance of”2条关系为连接形成的“夫妻关系”与“《过春天》”的最短关联路径。
(3)适用范围检索。适用范围检索指的是检索符合某些条件的概念或实例并以可视化方式返回检索结果。以检索符合“18周岁以下”的“女性”适用的家庭伦理内容为例,构建检索语言:match (a:Class {name:”女性”}), (b:Class {name:”周岁18以下”}), (c ) With a,b,c,(a)-[*1]-(c)-[*1]-(b) as per RETURN per,返回的检索结果如图8所示。图8展示了同时符合“18周岁以下”和“女性”两个条件的家庭伦理概念及实例,共有7条。
4.3 资源导航场景的实现
领域本体以面向对象的方式对领域内资源进行有效组织,基于本体实现的资源导航一般通过知识地图的方式实现。知识地图是一种以可视化节点方式组织和描述领域内知识点及其关系的资源应用工具,不仅可以提供顺序浏览的引导服务,还能够在资源检索基础上进行资源间导航,便于用户对领域资源有概括性的了解与认识。本研究实现的资源导航主要包括分类浏览导航和检索导航。
(1)分类浏览导航,是指利用构建的领域本体,使领域资源按类别及属种关联以层次结构向用户展示,通过动态浏览和可视化操作实现对本体不同类别的导航。此应用通过Neo4j数据库中的Class模块和Individual模块可以实现,其中Class模块仅导航概念,Individual模块仅导航实例。当用户点击感兴趣的概念或实例时,数据库会以星形方式向用户展示与该概念或实例直接相关的其它概念或实例及其之间的相互关系。图9展示的是人物类别的局部效果图(因该图幅较大,图中文字显示太小仅截取其局部放大进行展示),图中箭头指向的是与其直接相关的类目与子类概念,其相关关系通过箭头中的文字进行展示。
(2)检索导航,是指在C-path(x)语义检索结果的基础上,用户选择检索结果中自己的兴趣点,通过层层点击进一步发现与特定检索概念间接相关的概念或实例资源。例如,以C-path(x)语义检索中查询的“夫妻关系”概念为基础进行检索导航,在原有检索结果(图5)的基础上展开“婚姻伦理”和“女性”得到图10,图10不仅包括与“夫妻关系”直接相关的概念,还包括与“婚姻伦理”和“女性”直接相关的概念与实例,可以发现与“夫妻关系”通过2条关系路径连接的概念与实例;若在此基础上再点击展开概念或实例,则可以得到与“夫妻关系”通过3条关系路径连接的概念与实例。检索导航以语义检索为基础,通过可视化方式提供资源定位与资源关联解析服务,图10以知识地图的形式展式了与指定检索词直接、间接相连的概念与实例及其之间的关联关系,不仅可以强化对特定检索概念的理解,也便于用户了解领域资源之间的关联;同时,检索导航还可以实现关注点转移与查询扩展,例如用户试图以“夫妻关系”作为检索词进行文献查询前先在本体知识库中进行查询导航,通过导航结果图10,用户发现还可以利用“婚姻伦理”“相敬如宾”等作为扩展检索词汇,有助于用户完善检索策略。
5 结语
本文面向应用,通过确定领域本体范畴、构建概念层级和设置属性等步骤,采用Protégé工具实现了家庭伦理领域的概念本体构建,在此基础上运用Neo4j图数据库实现对家庭伦理资源的存储、检索与导航等应用,其研究意义如下。
(1)基于概念本体实现的家庭伦理领域资源的存储、检索等一系列应用场景可以更好地满足用户多方面、多层次的信息需求。本体确立了家庭伦理领域资源的组织结构,深入揭示了资源之间的关联关系;存储应用可以消除冗余信息,实现更高效率、更少空间的存储;检索应用以可视化方式呈现符合用户需求的资源及其关联关系,极大地提升了检索质量;导航应用便于用户把握资源整体情况,加深对资源的理解;语义揭示可以挖掘出各类资源之间的潜在关联与隐性内容,利于用户发现问题。
(2)面向应用的人文社科资源组织形式有利于促进人文社科领域专题资源的有效整合与建设。本文以数字化的方式建立、组织、揭示与利用中国伦理道德的专题资源内容,对于实现大数据背景下人文社科不同领域概念、实例及其关系的精确发现、深层挖掘以及检索利用等具有重要意义,便于引导与关联不同领域的各种数据与资源。
(3)基于本体的人文社科专题资源应用有助于实现真正意义上的领域知识重用与知识共享。本文从家庭伦理资源组织与应用的角度出发,利用Protégé和Neo4j两种工具,将领域概念、关系、实例等清晰而全面地标注与展现,實现资源存储、检索等应用,并提供便捷的推理和可视化功能将隐性知识显性化,提高了领域资源积累、利用效率,提升了研究者对领域资源的利用水平,实现知识增值。
本文在家庭伦理本体构建及数据转储方面均采用手工编辑方法,虽能保证构建与转储的质量但效率较低;同时限于人力与时间,构建的领域本体数据量不够大,涵盖的内容不够全面,概念细化工作较粗糙,在今后的研究中将探索半自动或自动化构建与转储方法,并寻求专家帮助,扩充本体涉及的知识概念与相关关系,实现与人文社科其他领域资源的合并与扩充。
参考文献:
李阳,孙建军.人文社科专题数据库建设规范化管理的若干问题[J].现代情报,2019,39(12):4-10.
KLESS D, MILTON S, KAZMIERCZAK E. Relationships and relate in ontologies and thesauri: differences and similarities[J]. Applied ontology, 2012, 7(4):4-1-428.
李阳,孙建军.人文社科大数据研究的价值追寻[J].图书与情报,2019(1):1-7.
朱学芳,丁笑舒.基于本体的LAM数字资源服务融合可视化研究[EB/OL].[2020-05-21].http://kns.cnki.net/kcms/detail/11.1762.G3.20200317.1526.006.html.
王晓光.加强人文社科数据资源建设与共享:现状、问题及对策[N].光明日报,2018-07-05(11).
金家琴,夏翠娟.数字人文数据基础设施建设中机构本体的构建:研究和应用[J].图书馆论坛,2020(4):30-39.
GRUBER T. Ontoligua: a translation approach to portable Ontology Specifications[J]. Knowledge Acquisition, 1993,5(2):199-200.
VIGNOLI R G, SOUTO D V B, CERVANTES B M N. Organization of knowledge systems with focus on ontology and taxonomies[J]. Informacao&sociedade-estudos, 2013,23(2):59-72.
苏玉宁,姜艺,陈贺胜,等.基于Ontology的农业科学领域知识库构建[J].江苏农业科学,2018,46(5):194-198.
CHINNAPONG A, RICHARD C, YUDITH C. MSSN-Onto:an ontology-based approach for flexible event processing in multimedia sensor networks[J]. Future Generation Computer Systems, 2020(108):1140-1158.
WONCHUL S, SUNGCHUL C, KWANGSOO K,et al. An ontology-based approach to role-human assignment in human processes for knowledge intensive services[J]. Expert Systems with Applications, 2011 (38):8352-8369.
陈涛,刘炜,单蓉蓉,等.知识图谱在数字人文中的应用研究[J].中国图书馆学报,2019,45(6):34-49.
盈艳,曹妍,牟向伟.新闻社区领域本体构建研究[J].计算机工程与科学,2016,38(9):1937-1942.
郝挺雷.传统节日知识本体的构建及表示方法研究[D].武汉:华中师范大学,2011.
蔡元培.中国伦理学史[M].北京:商务印书馆,1965:5.
张岱年.中国伦理思想研究[M].南京:江苏教育出版社,2009:4.
王恒生.家庭伦理道德[M].北京:中国财政经济出版社,2001.
徐国虎,许芳.本体构建工具的比较与分析[J].图书情报工作,2006,50(1):44-48.
Protégé官网[EB/OL].[2020-03-06].http://protege.stanford.edu/.
USCHOLD M, GRUNINGER M. Ontologies: principles, methods and applications[J]. Knowledge Engineering Review, 1996,11(2):14-17.
MAEDCHE A, STAAB S. Ontology learning for the semantic Web[M]. Boston: Kluwer Academic Publishers, 2001: 37-44.
FERNDANDEZ M, GORMEZ-PEREZ A, JURISTO N. Methontology: from ontological art towards ontological engineering[C]//Proceedings of the AAAI97 Spring Symposium on Ontological Engineering. Stanford University,March 24-26th,1997: 33-40.
NOY N F, MCGUINNESS D L. Ontology development 101: a guide to creating your first ontology[EB/OL]. [2020-05-16]. http://www. sfu. ca/dmarques/federation/pdf/Noy-Ontology101. pdf.2001.
李桂梅.中西家庭伦理比较研究[M].长沙:湖南大学出版社,2009.
罗国杰.伦理学[M].北京:人民出版社,2014.
战学刚,林鸿飞,姚天顺.中文文献的层次分类方法[J].中文信息学报,1999,13(6):20-25.
蒋银,常娥.基于淘宝网分类体系的数码产品本体构建研究[J].图书馆理论与研究,2017(3):44-48.
NIRENBURG S, RASKIN V. Ontological semantics(language, speech, and communication) [M]. Cambridge:the MIT Press, 2004.
陈慧平,陈永超.国内知识检索研究进展[J].图书情报工作,2011,56(10):126-129.
KIRYAKOV A, POPOV B, TERZIEV I, et al. Semantic annotation,indexing,and retrieval[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2004, 2(1): 49-79.
JIANG X, TAN A. Learning and inferencing in user ontology for personalized semantic Web search[J]. Information Sciences, 2009, 179(16): 2794-2808.
張缘圆 东南大学经济管理学院硕士研究生。 江苏南京,211189。
宋 歌 东南大学图书馆副研究馆员,东南大学经济管理学院硕士生导师。 江苏南京,211189。
袁曦临 东南大学图书馆研究馆员,东南大学经济管理学院硕士生导师。 江苏南京,210096。
(收稿日期:2020-08-31 编校:谢艳秋,曹晓文)