智能知识库系统的设计
2020-11-06王朝扬夏松
王朝扬 夏松
摘 要:智能知识库实现了知识的自动获取,经过人工处理将形成专业的知识库,为各类智库、科研机构提供了决策支持和数据支撑。良好的智能知识库设计是智能知识库成功建设的保障,文章分析了智能知识库的设计思路、建设原则,提出了一种智能知识库系统设计的结构示意图和技术框架图,并将其应用在李冰特色资源库建设中,实践表明,该系统设计可行性较好,具有较高的实用价值。
关键词:智能知识库;李冰特色资源库;系统设计
中图分类号:TP391.3;TP182 文献标识码:A 文章编号:2096-4706(2020)12-0016-04
Abstract:The intelligent knowledge base realizes the automatic acquisition of knowledge and forms a professional knowledge base after manual processing,which provides decision support and data support for various think tanks and scientific research institutions. A good design of intelligent knowledge base is the guarantee of the successful construction of intelligent knowledge base. This paper analyzes the design ideas and construction principles of intelligent knowledge base,and puts forward a kind of structure diagram and technical framework diagram of the system design of intelligent knowledge base,and applies it to the construction of Li Bing characteristic resource database. The practice shows that the system design is feasible and has good practical value.
Keywords:intelligent knowledge base;LI Bings characteristic resource library;system design
0 引 言
智能知识库是一种使用智能技术,按照一定主题对某一学科或某一专题的多元化信息进行收集、分析、评价、处理、存储,并根据一定标准和规范快速构建特色资源库系统,能够满足多元化用户的个性化需求[1]。有效地進行智能知识库的设计,才能保障其功能合理、运行稳定。智能知识库是作者承担的赛尔网络下一代互联网技术创新项目的研究内容,本文在之前的研究基础上[1,2],分析智能知识库的设计思路和系统设计,并将其在西华大学李冰特色资源库建设中进行了应用。
1 智能知识库系统的设计原则
1.1 设计思路
智能知识库系统的设计思路是:建立一个可智能化管理、开放式、易扩展的平台,实现系统内集中统一管理特色资源,使得各类资源的数据格式按照国家标准、行业标准或系统的标准进行统一的数据编码、用户展示界面或风格要相对统一;达到系统内各类资源能够得到安全可靠的存储和最大限度地授权共享利用。
特别是在用户查询栏目的设计上,要依据特色资源库的实际情况来进行设计,提供按照不同的资源类型、责任者、作者、机构、发表媒体、发表年度等分类进行一站式的检索服务,同时要注重各个专题或主题资源之间的有机联系,全方位、立体式地向用户呈现形态多样的信息。
1.2 建设原则
特色性原则。智能知识库构建的是专业的、具有特色的资源数据库,要做到人无我有,人有我全,人全我强的目标。人无我有是要做特色的、独具一格的数据库,如江西萍乡高等专科学校的萍乡傩文化特色资源库是研究当地的傩文化、福建福州闽江学院的三坊七巷特色数据库是当地三坊七巷景点为研究点、淮阴师范学院的周恩来研究专题数据库是以周恩来的故乡为切入点。人有我全是要做出小而精或大而全的专题特色资源库,一个专题资源库要集成该专题的全部的、各类文献资源,如曲阜师范大学的儒学文献特色数据库是孔子故里进行的以儒学古籍文献和儒学研究成果,以及本地儒家文化资源的集成。人全我强是要有资源的快速更新、资源的便捷获取和引用等,做到较好的用户体验,实现数据的最大化共享,进而吸引研究者或使用者。
共享性原则。资源库的建成不是一蹴而就的,而是需要长期的建设和更新,同时建设会受到人、财、物和资源等多方面的影响,因此资源库建设建议共建共享。共建是指各方共同建设,以某一个主体牵头,其余单位共同投入人、财、物和资源进行建设和数据的更新,如宝鸡民俗文化资源库的建设由宝鸡文理学院牵头,宝鸡市图书馆、宝鸡民俗博物馆、宝鸡文化馆、青铜器博物馆等多家单位共同参与,协助完成[3]。这样建设的资源库的数据更新具有可持续性,同时也有一定的用户群体。共享是指资源库数据的共享、互操作或复用。共享实现的方式主要是采用标准化和规范化的建设,资源的描述要采用国际、国内和行业标准,没有标准的要依据相关标准的构建自己的标准,以实现元数据的分类、编码、描述、著录、标引等规范控制,以便数据的查询及不同系统之间数据的互操作或复用。
持续性原则。特色资源库的维护和更新必须是可持续的,如果只重建设轻维护,这样的资源库是没有生命力的,很快会被淘汰。应该建立数据维护和更新的长效机制,定时更新最新的数据并对数据进行备份,保证数据的时效性和可靠性,同时要结合用户的反馈信息进行改进。
移动化原则。2020年4月28日中国互联网络信息中心(CNNIC)发布的第45次《中国互联网络发展状况统计报告》显示:中国网民规模超9亿,99.3%使用手机上网[4]。因此系统开发要适应移动端的要求,在有需求的时候可采用H5技术对系统进行封装,以适应不同的移动终端,而不必采用原生开发APP的方式;也可以采用小程序的方式实现。
2 智能知识库系统设计
2.1 结构示意图
智能知识库的结构示意图如图1所示。
用户查询的实现过程是:用户在使用该系统进行信息查询时,用户接口接收用户输入的查询信息,将查询信息的各种形式的指令并转化为系统可以识别的内部查询方式传递给转换查询模块;转换查询模块将信息转换为具体的存储查询方式,并传递给数据存储模块;数据存储模块按查询条件查询出所需的信息,并以信息输出的方式回传给用户接口模块[5]。
评价反馈时,用户对所查得的信息给出评价,数据存储模块记录该信息的评价,以便后期信息的删减或更新。
信息录入与查询时相同,如果查询到此信息已存储于知识库中则可对该信息继续进行编辑处理;若未查询到该信息,系统则会进行创建操作。
通过三个模块实现的资源的查询,资源的评价以及资源的修改、添加。三个模块需要进行权限的分级授权,合理分配访问权限,实现资源的合理利用。
2.2 技术框架图
一个良好的智能知识库系统技术框架如图2所示。系统分四层从下到上依次为数据层、管控层、应用层、展示层。数据层的功能是对各类资源、数据的整合;管控层的功能是采用统一身份认证的方式对用户以及权限的控制、数据转换为元数据、前后台操作日志统计等的管理;应用层的功能是各类应用的服务发布(如数据采集服务提供数据采集的接口配置、字段的定义等)以及后台业务自动化的调度;展示层是提供个性化统一服务门户,按照用户的特征进行信息的呈现。
3 李冰特色资源库系统设计
使用上述智能知识库的设计原则和系统的结构、框架设计,项目组完成了李冰特色资源库建设并上线运行中,系统的建设还在要持续完善之中。
3.1 李冰特色资源库系统建设的必要性
李冰这位2017年首批入选四川省历史名人文化传承创新工程的十大历史名人之一,缔造的都江堰水利工程,创世界水利工程之最,至今惠泽于民。李冰承载着中华民族优秀的精神品格,闪烁着四川人民独特的气质风范,在中华历史文化长河中占有独特而重要的地位,他所建设的都江堰水利工程是四川发展的宝贵资源和突出优势[6]。基于此,西华大学依托四川省社会科学重点研究基地——李冰研究中心的研究,建设了李冰特色资源库,集成了李冰相关的各类文献。
李冰特色资源库的建设及时挖掘了各类文献,对文化的传承起到了良好的保护作用,并体现了地方名人文献的独特价值。依托现代信息技术,对地方名人文献资源进行收集整理、分类加工及二次开发,精心构建具有地域文化特色的地方名人数据库,将散见于学术期刊、网络百科、报纸、年鉴、古籍等媒介,以文本、视频、图像等形式展现的相关名人资料、文献等进行分类整理,不仅便于用户检索,同时也可以扩大地方名人影响力、彰显地域文化特色、延续中华优秀传统文化的巴蜀脉络,推动中华优秀传统文化传承创新,提高人民群众文化素养,增强四川文化软实力、影响力、竞争力,具有重大的现实意义,并对优秀传统文化的传承产生深远的影响[6]。
3.2 李冰特色資源库系统功能设计
李冰特色资源库中最主要的功能是各类资源的整合,并进行资源的合理分类以及元数据标记,尤其是资源的分类,在这里做一个简单的说明。
李冰特色资源库建设中李冰和都江堰市无法分离的,因此按照李冰和都江堰两个主线进行。李冰相关资源主要分类有治水、治蜀、李冰与都江堰、李冰文化;都江堰相关资源主要分类有都江堰学、都江堰文化资源、都江堰文化遗产、都江堰与水利工程、都江堰与河道治理、都江堰与灌溉供水、都江堰与工程管理、都江堰与生态治理、都江堰与社会发展、都江堰与水文化、都江堰与李冰等。
按用户的不同需求,收集图书、论文(期刊、学位、会议、报纸等)、报告、网页资源、图像、音频和视频等资源,选编目录索引、摘要、全文和知识单元;按主要文献类型建立了图书、论文、新闻、网源、图像等资源库的内容查询。该库采用共建共享的建设形式,若发现新的资源,经过相关人员遴选后进行数据更新。
3.3 界面设计
李冰特色资源库是嵌入在李冰研究中心网站中的,也就是将该资源库作为一个单独的模块融入了网站中。界面如图3所示。
为了更好地提供数据资源,对资源进行了描述,属性主要有11个,具体如图4所示。
4 结 论
智能知识库系统的设计是一个个性化的过程,对应不同的知识和用户的类型则需要在设计过程中有所差异,文章提出了一种通用的设计思路,并依据该思路对系统结构进行设计,最后结合实际的智能知识库进行了应用。虽然基于该设计思路系统已经上线使用,但功能还在不断完善之中。知识库的设计一定要以服务为导向,满足各类用户的需求,具备多样化的资源呈现,便捷的信息获取;要以内容为中心,全方位集成信息,根据用户的评价对资源进行优化,按照最新研究成果对内容进行及时更新;遵循合作建设的原则,与建设对象合作、与相关建设机构合作、与使用者合作等,才能设计和建设出符合用户的、可持续发展的智能知识库。
参考文献:
[1] 肖博淳,王朝扬,赵成芳.智能知识库建设技术探讨 [J].信息与电脑(理论版),2020,32(6):138-140
[2] 夏松,王朝扬,李兆延.智能知识库系统建设研究——基于CiteSpace的可视化分析 [J].信息与电脑(理论版),2020,32 (4):140-142.
[3] 江娜.民俗文化特色资源库建设研究——以宝鸡地区为例 [J].图书馆学刊,2017,39(6):42-46.
[4] 中国互联网络信息中心.第45次《中国互联网络发展状况统计报告》 [EB/OL].(2020-04-28).http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/202004/P020200428596599037028.pdf.
[5] 王欢.智能知识库工程模型浅析 [J].数字技术与应用,2018,36(10):205-206.
[6] 微信公众号“川报观察”.四川公布首批本省历史名人名单,大禹、李冰等10人入选 [EB/OL].[2020-05-01].http://www.thepaper.cn/baidu.jsp?contid=1730911.
作者简介:王朝扬(1999.11—),男,汉族,四川成都人,本科在读,研究方向:信息安全、计算机应用。