基于层次结构的农作物种植知识库本地化建模技术研究
2020-07-28赵旖旎陈建英杨曙光阮绍翔
赵旖旎,陈建英,杨曙光,阮绍翔,高 丹
(1.西南民族大学计算机科学与技术学院,四川成都 610041;2.电子科技大学信息与软件工程学院,四川 成都 610054)
当前,农技服务工作要么依托农业专家的线上线下指导,要么基于业务系统数据库或专门的农作物种植知识库搭建的自动应答系统. 相比之下,前者基本能满足农业种植个性化需求,但需要投入大量的人力物力,非借助政策或市场支持不能长久;后者充分利用信息化技术实现了基于知识的农作物种植自助服务,其中,业务系统数据库模式业务针对性强,与农作物种植技术相关的知识普遍较为分散,缺乏合理的组织与管理[1],在较高层次整合困难,因此,越来越多的自动应答系统更推崇知识库模式.农作物种植知识库是农作物领域知识的聚合体,为农业生产者和经营者提供了多样化的信息服务以及多元化的农业技术支持[2-3],但在实际的应用过程中仍然存在着地域、土壤、地理环境和气候条件等差异性带来的本地化问题没有得到妥善解决.
本文基于层次结构的知识库建模技术,构建通用的农作物种植知识库,并为当地农业专家提供修正知识库的通道,以认定采纳或修正覆盖的方式完成农作物种植知识库本地化过程,确保自动应答系统的本地技术指导有效性,提高农技服务系统的服务质量.
1 通用农作物种植知识库建模技术
1.1 基于层次的模型架构
农作物种植知识库作为农技服务应用系统的重要组成部分,在提升为农服务质量的过程中发挥着重要的作用.相关学者针对农作物种植相关知识展开研究并提出了基于层次结构的知识库模型架构如图1所示[4-6].
图1 通用农作物种植知识库模型架构图Fig.1 General crop planting knowledge Base Model Architecture Diagram
1.2 模型构建技术及步骤
农作物种植知识库的构建突出表现在知识获取以及知识表示两个方面[7].针对农作物种植领域的零散知识对象,通过数据采集以及知识提取过程实现农作物种植知识的获取,采用知识表示技术完成通用农作物种植知识库的构建,最后通过搭建交互接口实现为用户提供知识浏览、知识检索、知识共享等服务的功能.
1.3 存在的问题
通用农作物种植知识库对农业信息资源的高效利用起到较好的推动作用,但在实际的应用过程中仍然存在着一些问题:(1)大量与农作物种植技术相关的信息缺乏有效的分类、定义和描述[8];(2)地域差异导致同一种农作物存在不同的种植方法,本地化服务的欠缺严重影响了农技自动应答系统的实用性;(3)未能积极引入当地经验丰富的专家对知识库进行修正与更新.为此,本文提出一种考虑了地域维度的农作物种植知识库本地化建模技术,用以改善现有农作物知识库个性化问题.
2 农作物种植知识库本地化模型架构
结合本地化农作物种植知识库的地域性及共享性构建原则,设计了一个基于开放式结构的层次化农作物种植知识库模型架构,从上到下共有5 层:用户层、服务层、业务逻辑层、处理层以及数据层. 如图2所示:
图2 农作物种植知识库本地化模型架构图Fig.2 Architecture diagram of localization model for crop planting knowledge base
用户层位于知识库的最顶层,是本地专家修正及更新知识的入口层.服务层是知识库模型实现为用户提供农作物种植知识服务的功能层.业务逻辑层是实现知识表示与知识管理的功能层,也是构建知识库的核心层.处理层的知识来源为数据层,通过对知识进行一系列处理完成对知识的存储与更新.数据层是知识库模型的基础资源层,借助数据采集,数据清洗,数据融合等数据挖掘技术形成[9].五层结构层层递进共同构成了农作物种植知识库本地化模型,使得农作物种植知识库本地化模型具有开放性、延展性、独立性和交互性等特征.
3 农作物种植知识库本地化模型的构建
根据农作物种植知识库本地化模型架构,自底向上的具体构建步骤是首先根据知识分类挖掘大量与农业相关的网站,利用Web 挖掘技术以及人工获取方式从海量农业数据中获取知识并注入知识库中,通过业务逻辑层对知识进行合理表示及管理,最后通过为应用系统提供接口更好的实现本地化服务功能.
3.1 知识分类
合理分类知识是构建本地化农作物种植知识库模型的必要条件. 为了实现本地化技术指导,必须结合特定地区的地理环境以及气候条件,因此,可将地域性作为分类农作物种植知识的首要属性.考虑到农业信息具有一定的横向无序性,借助知识标引技术将农作物种植本地知识库分为品种知识、地区知识、种植技术知识和本地专家经验知识4 个模块.
3.2 知识获取
知识获取是指在确定知识范围的条件下自动或半自动的从信息源获取结构化信息[10],它是构造知识库的基础.完成知识获取的关键技术及过程如下:
图3 知识获取过程Fig.3 Knowledge acquisition process
(1)知识抽取:根据农作物种植知识库本地化模型的知识分类,把蕴含于信息源的知识采用Web 挖掘技术经过识别、分析、理解、筛选、归纳整理等过程抽取潜在的有价值的知识.主要用到的方法是实体名提取与语义类抽取.其中实体名提取的主要任务是从垂直站点中提取目标知识,利用命名实体识别技术从相关网页及自然语言句子中进行知识提取.语义类抽取的任务是通过从文本中抽取信息来建立实体和语义的关联关系.
(2)知识转换:将抽取的农作物种植领域中的显性知识及隐性知识完成从网页及文档到知识的转换.
(3)知识存储:通过编译将模型所表示的知识注入到知识库中.
(4)知识检验:通过对注入的知识进行检验确保知识库的正确性.
3.3 知识表示
知识表示是将领域知识和专家经验等有效地表示成计算机能够工作和运行的形式[11]. 通过发现知识与表达之间的映射把事实、规则、概念编码为合适的数据结构并用计算机可以理解的语言将农作物种植领域知识形式化、结构化.
目前常用的知识表示方法主要有逻辑表示法、产生式表示法、框架表示法、面向对象的表示方法、语义网络表示法以及本体表示法等[12]. 为了突出本地化特征,我们采用了由“框架”表示法、“规则架+规则体”构成的综合知识表示方法. 该知识表示方法是以“框架”表示为主体,将“规则架+规则体”表示的规则嵌入到框架中更好的达到相互融合相互调用的目的.
框架(Frame)是储存事物所有知识的一种复杂的数据结构[13].“框架”表示法通常采用的是“节点-槽-值”的表示结构,主要用于描述复杂事物内部结构以及复杂事物之间的类属关系.采用“框架”表示法能够将所论对象的属性通过实体或实体集的形式表示出来.框架的存储结构如下表1 所示,其中rule 栏中存储的是“规则架+规则体”表示中所定义的规则.
表1 “框架”表示法的存储结构Table 1 Storage structure of "frame" representation
“规则架+规则体”的知识表示方法是产生式规则表示的最新发展,通常用于表示具有因果关系的知识[14],由规则架和规则体两层形成一个规则组,其中一个规则组相当于一个子问题. 其基本表示形式是:IF P THEN Q,其中 P 是前提条件,Q 是结论[15].形式化表示为:
规则架(n):
IFP1,P2,P3…,PnTHENQ1,Q2,Q3,…,Qn
规则体:
IF(P1=A)∩(P2= B)∩(P3= C)…THEN Q(q1,q2,q3,…,qn)
可信度:
CF(Q,P)
其中规则架(n)中的n 指的是规则架编号. 规则体中的A,B,C… 是变量因素,其值可表示前提条件P范围内的因素,规则体中的前提条件之间可表示为“与”的关系.可信度是指根据前提条件得出结论为真的可相信程度,其取值范围为[ 0,1],其值由当地权威农业专家给出.
农作物种植知识库本地化模型构建中规则架的前提条件由种植品种和种植地区组成,结论为具体种植技术.规则体表示的是规则架中具体属性值的推导.形式化表示为:
规则架前提::= <种植品种,种植地区>
规则架结论::= <种植技术>
规则体前提::= <种植品种名称,种植地区名称(气候条件,土壤条件,环境因素,其他影响种植因素)>
规则体结论::= <本地化种植技术>
规则组法能够将同类知识如种植技术领域的知识集中于同一个规则组中,将“框架”表示法表示的描述型知识与过程型知识及逻辑型知识三者集成于一体,采用具有层次结构描述的规则组形式将本地化种植技术这一子问题更清晰的表达出来,使推理更具有逻辑性.
3.4 知识管理
知识管理通过对农作物种植知识库本地化模型中海量且繁杂的数据进行有效管理,从而提高知识库存取知识的效率.知识管理时序图如下图4 所示.
图4 知识管理时序图Fig.4 Knowledge management sequence diagram
4 案例分析
下面以农作物樱桃的知识表示为例,构建四川省凉山彝族自治州冕宁县樱桃的种植技术知识库,加以说明上述知识库模型的实用性.首先通过网络采集以及人工获取方式获取冕宁县相关数据、樱桃种植相关数据以及冕宁县农业专家种植樱桃的经验知识,借助数据处理技术使用MySQL 8.0 存储知识和管理规则知识,然后通过知识表示技术以及知识管理工作构建冕宁县樱桃种植知识库.冕宁县农作物樱桃的种植技术知识表示如下:
规则架(RS):IF 种植品种,种植地区 THEN 播种季节,播种方式,播种深度,施肥量,栽培密度,栽培深度
规则体(RB):
IF 种植品种 = 樱桃 THEN
播种季节 = 春季∨秋季
播种方式 = 条播∨精量播种
播种深度 = 3 ~6 cm
施肥量 = 尿素加硼砂再加六百倍的磷酸二氢钾
种植密度 = 土地瘠薄地10 ~15 公分 ∨ 土地平坦肥沃地15 ~20 公分
种植深度 = 秋播4 ~6 公分 ∨ 春播1.5 ~4公分
IF(种植地区 = 冕宁县)∧(种植品种 = 樱桃)THEN
播种季节 = 春季
播种方式 = 条播
播种深度 = 3 cm
施肥量 = 0.3%尿素、0.1 -0.2%硼砂、0.2 -0.4%钾混合液
种植密度 = 播幅宽五公分,行距二十公分
种植深度 = 3 公分
冕宁县樱桃种植知识库的工作原理是根据冕宁县自身的地理环境,气候条件、土壤类型等因素并结合农作物樱桃自身的种植特性推导出樱桃在冕宁县的具体种植技术,并向冕宁县的农户提供樱桃种植技术服务,切实解决农技指导本地化服务问题. 冕宁县樱桃种植知识库工作原理如图5 所示.
图5 冕宁县樱桃种植知识库工作原理图Fig.5 Schematic diagram of cherry planting knowledge base in Mianning County
5 总结
本文通过发现并且整合现有的农作物种植技术信息资源,结合本地种植经验和当地农业专家知识,提出了一种基于开放式结构的层次化农作物种植知识库模型,并将大数据时代下的数据挖掘技术和农业种植实际问题相结合,采用知识库建模技术构建了基于本地化的农作物种植知识库,并对构建过程中的关键技术进行了研究.研究成果可复用于特定地域的农技指导相关应用系统的研发,并且具有广泛的应用价值,能够实实在在的解决农民耕作过程中的技术指导本地化需求,对解决三农问题具有重要的现实意义.