APP下载

基于多元语义网络的民族信息资源库构建研究

2018-09-20俊,

关键词:资源库服务平台语义

王 俊, 高 炜

(1.云南师范大学 高等教育与区域发展研究院,云南 昆明 650500;2.云南师范大学 民族教育信息化教育部重点实验室,云南昆明 650500;3.云南师范大学 信息学院,云南 昆明 650500)

民族信息资源一直以来都受到国家的重视。20世纪80年代,国家就组织开展过全国范围内的少数民族相关古籍文献的搜集、整理和出版等工作。经过几十年的建设和发展,取得了卓越的成绩,民族信息资源建设已经具有一定的特色与规模,但是民族信息资源仍然没有得到充分的开发和利用,使得某些民族文化、风俗和宗教等民族信息资源面临着传承中断、特色丧失的困境。

随着改革开放的深入和城市化的发展,少数民族地区年轻人受城市化影响,放弃原有的民族生活方式和传统职业,外出工作并长期居住于大城市,他们的下一代出生于大城市,受大城市环境的熏陶,不愿再回原来的民族部落居住地。因此,西部少数民族地区出现文化断层的现象,少数民族特有的语言、传统礼仪、风俗民情、传统手工业等正在逐渐消失。因此,为了中国传统文化的及时保护和传承,构建民族信息资源库已被提上议事日程并成为迫在眉睫需要解决的问题。

笔者的贡献在于利用语义网络表示有关事实性知识之间的复杂联系,并由此构建各知识之间的联系,并设计基于多元语义网络的民族信息资源库服务平台原型系统。

1 语义网络

语义网络这一概念是1968年奎廉[1](J.R.Quillian)在研究中首先提出,当时作为一个心理学模型,之后用作知识表示;1972年,西蒙[2](Simon)提出可以将语义网络用于自然语言理解系统;1975年,亨德里克[3](Hnedrix)提出分块语义网络的思想,把复杂问题分解为若干个简单的子问题,每一个子问题用一个语义网络表示,把自然语言理解的研究向前大大推进了一步,使之具有广阔的发展前景[4-5]。蔡鸿明[6]提出语义网络是一种以网络图的形式表示人类知识构造的知识表示方法,反映了实体之间的类比结构,能够较好地表示事物的继承和变异等概念,并采用分层语义网络结构提出了一种提高资源关联性及利用率的资源库系统模型。李跃新[7]在论文中提出语义网络的关系模型,并用实例论述了语义网络知识的关系数据表的存储。荣月婷[8]在论文中提出用“搭配”、“词族”、“同义词”、“插图”、“词汇扩充”、“释义”等方法进行词汇语义网络构建。其他基于语义网络的相关研究可参见文献[9-12]。

1.1 知识的语义网络表示

语义网络既可以表示事实性的知识,也可以表示有关事实性知识之间的联系。

1.1.1 表示事实

图1 语义网络表示事实

如图1所示,该语义网络表示了木鼓舞和芦笙舞都是一种舞蹈,并且分别指出他们所具有的属性。其中节点表示一个事实性的知识,弧表示上下级关系,如木鼓舞和芦笙舞都是舞蹈的下级,横线表示节点的属性,如舞蹈的属性有表演和娱乐,木鼓舞表演需要木鼓,芦笙舞表演需要芦笙等。

语义网络的属性具有继承的特点,语义网络的下层可以继承语义网络上层的属性,在此特点下,可以在语义网络下层中找出其单独的属性。语义网络的下层中也可以对它的上层的属性进行细化和补充,使它能更准确地反映语义网络下层的特征。

1.1.2 表示有关事实之间的联系

语义网络可以描述事物间多种复杂的语义关系,主要有以下几种:(1)分类关系,如“是一种”;(2)聚集关系,如“一方面”、“一部分”;(3)推论关系;(4)时间、位置关系;(5)多元关系。

在语义网络中,一条弧只能从一个节点指向另一个节点,适合表示一个二元关系。但是多数情况下需要用一种关系把几个事务联系起来。为了表示语义网络中描述的多元关系,可以用节点来表示关系。如图2所示,楚雄彝族自治州位于昆明和大理白族自治州之间。

图2 用节点来表示多元关系

1.1.3 用语义网络表示比较复杂的知识(多元语义网络的表示)

假设有如下两个事实,需要把这两个事实用语义网络描述出来:张三是白族,传统的服饰主要以白色为主;李四是佤族,传统的服饰主要以黑色和红色为主。

以上两个事实,如果写成两个语义网络很容易,但是对知识的利用不方便。分析发现,它们都是关于服饰的,因此,只要把服饰作为一个通用概念用一个节点表示,而把两种不同的服饰作为实例,就可以用一个语义网络把他们表示出来,如图3所示。当需要寻找有关服饰信息时,只要首先找到服饰这个节点就可以了。

图3 多元语义网络表示多个事实

1.2 民族信息资源多元语义描述

利用二元关系模型,可描述语义网中的起始节点和终止节点之间的关系:

Initial Node(ID,Title,Index)

TerminalNode(ID,Title,Attribute,Relationship)

Initial Node是语义网中的起始节点,它的属性分别为ID起始节点编号,Title起始节点标题,Index起始节点序号。TerminalNode是语义网中的终止节点,它的属性分别为ID终止节点编号,Title终止节点标题,Attribute两个节点之间的关系,Relationship两个节点之间关系的值。把两组节点构建一个二维矩阵,Initial Node作为行元素,TerminalNode为列元素,Attribute做为元素的值。

由此可见,节点之间的连接是二元关系,语义网络从某种意义上只能表示二元关系,如果所要表示的事实是多元关系,需要把这个多元关系先转化成一系列二元关系的组合。例如,多元关系R(X1,X2,…,Xn)可以转换成 R1(X11,X12)∧R2(X21,X22)∧…∧Rn(Xn1,Xn2)。

在民族信息资源库中,不仅有知识概念所形成的二元关系,还存在着拥有几种不同语义关系的框架间的多元关系。民族信息资源库记录了知识概念有关层级、总分、参见、域、起始及因果关系的信息。标注这些关系是建民族信息资源库的一项重要工作。

2 基于多元语义网络的民族信息资源库构建

利用知识元的方式把所有民族信息资源进行分类存储,并进行统一管理。在此基础上,利用多元语义网络建立各知识之间的联系,以便于后期进行更精确的民族信息资源检索。比如牛头和佤族的关系,如果对佤族没有了解的读者想不到他们之间的联系,即使计算机根据检索的关键词、近义词、各语言之间的翻译等相关技术都无法检索出相关的信息,如果利用语义网络的方式建立起各知识之间的关系,检索时就可以把相关知识检索出,为读者提供更好的服务。知识之间的联系多种多样,各个知识之间的联系不止一层,故使用多元语义网络对各个知识进行联系。

根据以上分析,基于多元语义网络的民族信息资源库设计结构如图4所示。

图4 知识元集合中知识元联系及知识元描述资源

根据以上关系设计知识元之间联系的数据结构见表1。

表1 知识元关系数据结构设计

假设剽牛的知识元ID为100001,拉木鼓的知识元ID为200001,两个知识之间的联系见表2。

表2 知识元关系在数据库中表示

随着知识元及其关系的不断充实完善,即可根据某个知识元得出有联系的知识元,形成知识元网络,从多方面为研究者和学习者提供帮助。

3 基于多元语义网络的民族信息资源库服务平台原型系统设计

应用以上研究的理论与方法,设计了基于多元语义网络的民族信息资源库服务平台原型系统。该平台采用Visual Studio 2015搭建的ASP.NET(C#)开发平台,运用.NET+SQL Server+AJAX等技术。基于多元语义网络的民族信息资源库服务平台原型系统逻辑结构包括资源层、知识层、管理层和服务应用层[13-14]。

资源层将现有的信息系统平台、信息资源及网络资源进行整合,并对资源进行转换,得到统一的资源体系(文字、图像、声音、视频、动画)并进行统一管理。

知识层将现有资源中的知识提取出来,并用标准的描述方式进行描述,把相关联的知识联系起来。

管理层功能是统一管理资源层、知识层和服务应用层中的用户、资源、知识、关系、服务和应用。

服务应用层将资源的获取、处理、计算和管理等方法封装成为标准化的服务接口,并通过不同的应用,如网站、移动APP、微信等平台对民族信息进行共享与服务[15]。基于多元语义网络的民族信息资源库服务平台原型系统结构如图5所示。

图5 基于多元语义网络的民族信息资源库服务平台原型系统结构图

4 结语

文中,笔者运用多元语义网络的知识表示方法表示民族信息资源中的相关知识,在此基础上设计民族信息资源库,利用语义网络为各个知识之间建立了联系,并进行了服务平台的设计。在未来的工作中将要继续收集整理更多的民族信息资源到民族信息资源库中,并记录相关的数据,以便进行更深层次的研究。

猜你喜欢

资源库服务平台语义
真实场景水下语义分割方法及数据集
打造一体化汽车服务平台
幼儿园课程资源库建设之浅见
健身气功开放课程资源库建设研究
江苏省一体化在线交通运输政务服务平台构建
论基于云的电子政务服务平台构建
语言与语义
基于云计算的民航公共信息服务平台
数控加工专业资源库建设中存在问题及对策
基于共享资源库的混合式教学考核模式研究