建设工程施工合同领域本体开发方法及其构建
2022-10-06周红,黄文,黄文路
周 红,黄 文,黄 文 路
(厦门大学 建筑与土木工程学院,福建 厦门 361005)
0 引 言
建设工程施工合同是承包人与发包人从事施工活动所需遵循的行为准则,对双方权利义务关系的界定起到至关重要的作用,承包商往往面临着大量的合同风险审查工作[1-3]。为了尽量避免建设工程施工合同履行过程中可能出现的法律风险,审核人员往往需要在非常短的时间内检查出所有施工合同条款内不合理的约定[4-6]。然而,这种完全依赖经验判断的人工审查方式不仅效率低下,而且还受审核人员主观认识因素的严重影响。
随着信息技术的发展,合同风险的客观性评价方法开始受到国内外学者的关注。国外研究方面,Lee等[7]将国际工程承包合同中常见的11种不利于承包人的文字表述方式转化为语义规则,开发了一种基于自然语言处理的风险条款自动抽取模型,该模型能够自动从业主提供的施工合同条件中识别出符合上述规则的风险条款。在此基础上,Lee等[8]还提出了一种施工合同风险主动评估模型,通过与FIDIC合同条件进行规则比较,该模型能够对业主提供的施工合同进行语义推理,从中发现被故意省略的、本应有利于承包商的条款部分。国内研究方面,盛越[9]提出了一种基于本体推理的技术合同风险评估方法,根据预先在技术合同本体中确立的语义规则,该方法使用Jena推理机对输入的合同文本进行规则推理,从而判断其中的逻辑风险。然而上述研究均未能发掘施工合同条款中所存在的丰富的语义知识,这是导致合同风险客观性评价方法的研究成果尚不深入的重要原因之一。例如在Lee等[7-8]的研究中,针对条款文本的语法规则分析仅停留在并列语句拆分的层面,导致风险条款自动抽取模型很容易受语句中其他修饰成分的影响而出错。而本体作为一种知识描述模型,能够存储施工合同中各类关键概念的含义及其相关关系,从而为自然语言的认识和理解提供重要帮助。
针对上述研究的不足,本文以七步法的主要步骤为基础框架,结合五步循环法和骨架法的优点,提出了适合建设工程合同特点的领域本体开发方法——八步循环法,以满足施工合同知识专业性、综合性的特点,并使用Protégé本体编辑工具,进行了施工合同领域本体的开发和语义网络关系的构建。本文所构建的施工合同领域本体,实现了施工合同条款的语义知识建模,可以在施工合同基于规则的结构化处理中提供关键知识,从而为合同风险的智能识别和诊断提供重要基础。
1 综合性本体开发方法研究
本体开发的目的是为了尽可能详细、准确地描述某一特殊领域的概念知识框架,从而方便知识的表示、组织和管理[10]。尽管近年来各种不同领域的本体及开发方法相继提出,然而现行的本体开发依旧没有完整的方法论来支撑,因此,构建一个科学、完整的本体,往往需要结合多种本体开发方法来进行构建。本文梳理现有的本体开发方法的优缺点,结合七步法、五步循环法与骨架法,并依据施工合同知识,提出一种适用于建设工程合同领域的本体开发方法。
1.1 现有本体开发方法
随着计算机技术的发展,本体论和本体技术逐步应用于信息集成、知识管理等领域,在实践中产生了一些颇具影响力的本体开发方法,例如骨架法、五步循环法以及七步法等。
骨架法[11],也称为EO工程法,由爱丁堡大学的人工智能应用研究所构建企业本体的经验总结而来,包括确定本体应用目的和范围、本体分析、本体表示、本体评价及本体建立5个步骤。该方法提供了本体开发的指导方针,具有指导意义,但缺少本体开发过程中的具体技术及方法。
五步循环法[12]适用于语义网本体的构建,重视本体构建过程中的循环迭代,包括本体导入、本体抽取、本体修剪、本体精细及本体评价5个循环往复的步骤。然而该方法对整个循环的初始步骤不够重视,不利于大规模语义网本体的建设。
七步法[13]是斯坦福大学所提出的适用于领域本体开发的方法,其步骤如图1所示。七步法已得到国内外众多学者的广泛使用,具有开发流程清晰、操作步骤简单、通用性强等特点,但缺少检查和评估以及用户反馈的环节。
1.2 综合性本体开发方法研究
合同是一种具有法律效力的书面文本语言,语法规则和文本词汇与日常生活用语存在着明显区别[14],术语专业性高,因此对其进行本体开发时需要注意术语的准确性;且施工合同知识综合性强[15],需要在本体的构建过程中不断修改、补充和细化,以保证所构建的本体具有完整的层次结构。然而现有的本体开发方法难以满足上述施工合同领域本体构建的要求。七步法缺少必要的评估和反馈机制,在构建过程中无法实现施工合同领域本体的更新和完善;五步循环法在初始化阶段存在准确性不足的问题,未能明确定义施工合同领域知识;骨架法只提出了本体构建的指导方针,对于包含大量概念与关系的施工合同领域本体来说,可操作性较低。
为解决上述问题,本文综合七步法、五步循环法和骨架法的优点,提出了适用于建设工程合同领域的本体开发方法,主要思路如下:
(1) 由于七步法经过长期的研究实践已经趋于成熟,因此新的方法以七步法的主要步骤为基本框架;
(2) 为实现本体开发时的修改、补充和细化,在枚举本体的重要术语时吸收五步循环法中本体修剪的优点,去除知识相关度低的术语,在定义类的特性时引入五步循环法中本体精细的步骤,以调整类及类的特性的概念粒度;
(3) 为克服七步法单向、一次性开发方式的弊端,使本体在循环迭代的构建过程中不断完善,在知识框架搭建完成之后,加入骨架法的本体评价环节,评价结果作为反馈重新进入知识框架的搭建环节。
由于该开发方法主要由八大步骤组成,且中间存在循环往复的过程,可称之为“八步循环法”,主要步骤包括:确定本体的领域和范围、考虑现有本体的复用、枚举本体的重要术语与本体修剪、定义类和类层次、定义类的特性与本体精细、定义特性的约束、本体评价与检验、生成实例,具体方法如图2所示。
就目前而言,Protégé是国内外最常用的本体开发工具,七步法的步骤便是斯坦福大学医学院基于Protégé所提出,本文所归纳的八步循环法以七步法为主要框架,同样可以在Protégé平台上进行领域本体的实现,可应用于建设工程合同领域本体的构建。
2 施工合同领域本体构建
领域本体的开发应遵循5条基本原则[16]:清晰性(Clarity)、一致性(Coherence)、可扩展性(Extendibility)、最小编码倾向(Minimal Encoding Bias)、最小本体化承诺(Minimal Ontological Commitment)。清晰性原则要求所构建的本体能有效表达施工合同领域术语概念的内在含义;一致性原则要求本体能在声明和内部规则内进行推理;可扩展性原则要求施工合同领域本体具有严密的分类逻辑和层次结构,可以后续添加新的合同领域术语;最小编码倾向原则要求施工合同领域本体可在其他系统环境中复用,以完成后续的语义理解及规则推理任务,并具有最小编码成本;在满足上述原则的基础上,本体的建模对象应是施工合同领域的核心概念,保证最大化精简,满足最小本体化承诺原则。
遵循上述原则,按照八步循环法的具体步骤,结合施工合同领域知识,进行施工合同领域本体的构建。
2.1 确定本体的领域和范围
对于建设工程施工合同,本体构建的目标是以形式化语言描述施工合同中的关键概念及其相关关系。由于施工合同管理与项目管理理论、建设法律法规具有很高的关联性,因此选取《中华人民共和国建筑法》作为概念补充,并在本体构建的过程中结合项目管理理论对本体的科学性进行分析论证。该本体的领域为施工合同管理,范围则以建设工程施工合同文本为主,相关法律法规和项目管理理论为辅。
2.2 考虑现有本体的复用
尽管近年来国际工程承包领域的施工合同本体开发[7,17]已经取得了一定的进展,但目前尚未发现针对我国建设工程施工合同领域本体构建的相关研究。
2.3 枚举本体的重要术语与本体修剪
由于《建设工程施工合同(示范文本)》(GF-2017-0201)(以下简称《示范文本》)是诸多国内建筑企业签订施工合同所采用的标准文本或重要参照,因此选取《示范文本》中合同协议书和通用合同条款的部分章节进行术语枚举:① 合同协议书。合同协议书是对项目基本情况的概括约定,抽取出其中的核心概念;② 第一节“一般约定”。“一般约定”对通用文本内的常用词语进行了定义和解释,而从定义中延伸出的术语也可以作为领域本体知识框架的一部分;③ 第二节“发包人”和第三节“承包人”。签订施工合同的主要目的之一就是明确合同当事人的权利义务关系,因此对这两个章节进行抽取,能够很好地覆盖当事人行动以及这些行动所涉及的其他事物;④ 各个章节条款的小标题。小标题一般以高度概括条款内容的名词短语形式出现,从中抽取到的术语可以有效提高本体知识框架的广度和深度。同时,对《中华人民共和国建筑法》全文中的重要术语进行枚举,以作为概念补充。
通过实验,从《示范文本》中提取术语374个,例如开工日期、永久工程、暂停施工等;从《中华人民共和国建筑法》中提取术语225个,例如建设单位、施工许可证、拆迁、资质审查等,总计599个。随后对术语列表进行修剪,通过合并同义概念、删除不相干术语等操作,最终得到施工合同领域词表,如图3所示,共包含术语408个。
2.4 定义类和类层次
分类学(Taxonomy)是一门讲述分类方法的科学,由于能够判断不同术语单位之间的上下位关系,在国内外本体开发研究中起到了重要作用,是进行类的层次定义和知识结构组织的重要理论依据。
本文以分类学为基础,首先确定了行为人、产品、约定、环境与条件、资源、行为、环节7个大类,再以此为基础采用从上至下的方法定义类和类的层次,最终构建出7个大类及其层次图(见图3)。
(1) 行为人。行为人是在施工合同法律关系中行使权利并承担义务的主体,可能是自然人、法人或非法人组织等。
(2) 产品。产品是指行为人通过消耗一定量的资源而创造的,能够促进合同目的实现的客观事物或智力、劳动成果。
美国法中涉外专利之诉的法律适用与执行——基于管辖与禁令执行的分析 ......................赵 雷 02.90
(3) 约定。约定是指双方当事人在合同中协商确定的,应当发生在行为人之间的某些联系,这种联系在合同管理理论中又被称作合同法律关系的内容。
(4) 环境与条件。环境与条件特指那些能够对当事人权利义务的设立、变更和消灭产生重要影响的客观事物。当合同条款中出现这些术语时,常常表示行为必须在某种情况(环境)下做出,或只有某种情况(条件)成立后才会被允许。
(5) 资源。资源是指那些行为人为从事某项行为或创造某项产品而必须消耗的、具有一定价值的事物。这些事物的价值既可能是一次性的,使用完毕后会自动消灭;也可能是重复性的,只不过在使用过程中会发生大幅折减。
(6) 行为。根据施加主体是行为人还是客观事物,可以划分为人称行为与非人称行为两个下属类。
(7) 环节。环节是指从签订施工合同开始到合同履行完毕,即双方当事人权利义务终止这段时间内施工活动的关键节点。
2.5 定义类的特性与本体精细
类的特性包括类的关系和类的属性。定义类的属性,首先需要从领域词表中去除类的集合,接着从其中筛选出属于属性名称的术语,再根据经验将其与每个类一一对应。定义类的关系,需要根据社会经验构建类的关系集合,再从集合中选取一个最能描绘两者之间相互作用的元素。在该步骤中,需不断调整本体的概念粒度,注重知识框架层次的划分。
现以项目经理和承包人的关系为例来说明类的关系的定义与应用。项目经理是承包人正式聘用的员工,能够继承其父类概念的类的关系“承包人人员-受雇于-承包人”。同时,项目经理又是工程项目管理的主要负责人,能够代表承包人行动,因此两者之间还存在一种特殊的雇佣关系——代表关系,即“项目经理-代表了-承包人”,其中“代表了”是“受雇于”的子类,并与“有职工”的子类“有代表”互逆。此时,项目经理满足“承包人人员”“受雇于-承包人”“代表了-承包人”3个必要条件。但相应地,如果某个自然人同时具备“承包人人员”“受雇于-承包人”“代表了-承包人”这3个条件,根据一般社会经验则可以判断出他的职业应当是项目经理,因此,还需要将必要条件转化为充要条件,才能最终科学、完整地表现项目经理与承包人的相关关系。
2.6 定义特性的约束
在施工合同领域本体开发中,还可以通过设定不同的约束,如域和范围(Domain and Range)等,对特性作出更加明确的定义。域是指特性的定义域,用于声明何种类才能具有这一特性;范围是指特性的值域,用于声明这一特性的值应当属于何种类。
根据《注册建造师管理规定》第二十一条和第二十六条规定,任何一个注册建造师都不得同时担任两个工程项目的负责人或同时在两家建筑企业执业。因此在一个建设工程施工合同中,一个项目经理只能代表唯一的一个承包人,它们存在普遍性限制,此时,类的关系“代表了”的域是“项目经理”类,范围是“承包人”类。
2.7 本体评价与检验
原型本体构建完成后,应当邀请领域专家结合清晰性、可扩展性等指标对本体是否具备合理性、是否满足使用需求等问题进行综合判断。如果在上述过程中发现问题,则说明原型本体还需进一步修改完善,开发流程回转到2.4节定义类和类层次。
2.8 生成实例
实例是类的具体目标对象,是类在现实世界的具象表达,因此能够继承类的属性;同时实例又是一个具有原型的实体,因此应当具有确切的属性值。生成类的实例步骤较为简单,只需先选择所属类,再根据实际填充属性值即可。
3 Protégé实现与本体评价
按照施工合同领域本体构建的流程(见图2),使用Protégé进行本体的开发与实现,并对所构建的施工合同领域本体进行了一致性与完整性检验,验证了该开发方法的可行性。
3.1 Protégé实现
Protégé开发本体通常包括建立实体类、建立对象属性及数据属性、设定域与范围和创建实体对象4个步骤,依次对应八步循环法中定义类和类层次、定义类的特性与本体精细、定义特性的约束及生成实例4个步骤。由于施工合同本体涉及概念较多,且行为人知识框架的复杂程度较高,不同概念之间的实际联系也比较丰富,现以行为人及其下属类的关系集合与语义关系网络图的Protégé实现来进行说明。
(1) 建立实体类。根据在“定义类和类层次”中所定义的行为人下属类及其层次,在Protégé中依次添加实体类及其节点,最终得到行为人下属类及其层次结构图,可视化结果如图4所示。
(2) 建立对象属性。在Protégé中分别通过对象属性(Object Properties)和数据属性(Data Properties)对类的关系和类的属性进行表示。根据项目管理经验,首先构建行为人及其下属类的关系集合,结果如图5所示。
项目经理继承了其父类概念的对象属性“承包人人员-受雇于-承包人”,同时又与承包人存在雇佣关系,即“项目经理-代表了-承包人”,因此,某个具备“承包人人员”“受雇于-承包人”“代表了-承包人”这3个条件的自然人与项目经理互为充分必要条件,可以在Protégé中通过设定“项目经理”的对象属性“Equivalent To”(等同于)及“Subclass Of”(子类)描述此类关系,如图6所示。
施工合同的语义理解和推理,只需要定义到类和类的层次即可实现,所以在施工合同领域本体的构建中暂不考虑域与范围的设定和实例的信息建模。
最终构建成功的行为人及其下属类语义关系网络如图7所示,不同颜色、虚实与指向的线代表不同的类的关系,例如承包人属于合同当事人的下属类,以蓝色实线表示,箭头由合同当事人指向承包人,同时承包人与检测机构存在提供实验服务关系,以红色虚线表示,箭头由检测机构指向承包人。
3.2 本体检验与评价
经过多次循环评价与检验,最终完成施工合同领域本体的开发工作。本文在Protégé中启用Pellet推>理机检查了本体的一致性,未发现内部声明矛盾。为进一步体现本文所开发的建设工程施工合同领域本体的适用性,随机选取了《示范文本》的部分条款及某房地产企业已应用于工程实践的施工合同的部分条款,对本体知识的完整性进行验证,结果如图8,9所示。总体来看,施工合同领域本体能够涵盖合同文本内的绝大多数核心概念,符合最小本体化承诺原则的要求。由于本研究所构建的本体只针对建设工程合同领域,诸如代词“其”、形容词“详细的”、介词“除”以及不表达专业含义的“具体内容”等词语无需构成本体内容,因此仅少量非核心字或词组未被标注,且不影响本体知识完整性。
4 结 语
目前本体技术在合同管理中已开展了一些研究,但尚未有建设工程合同领域本体的开发方法及其构建的研究。本文以建设工程施工合同文本为主,相关法律法规和项目管理理论为辅,提出了建设工程合同领域本体的开发方法,并构建了施工合同领域本体。
(1) 综合七步法、骨架法和五步循环法的特点,提出适用于建设工程合同领域的本体开发方法——八步循环法,该方法以七步法的步骤为主要框架,引入了五步循环法中本体修剪与本体精细两个步骤及骨架法的评价环节,能够在开发过程中对本体知识框架不断精细化,保证了施工合同领域本体的构建质量。
(2) 运用该方法完成了施工合同领域本体的开发,所开发的施工合同领域本体包括行为人、产品、约定、环境与条件、资源、行为和环节7个术语大类,总计408个术语概念及其相关关系。
(3) 按照八步循环法所构建的施工合同领域本体,依托Protégé实现了领域本体的开发,所保存的本体文件可导出并应用于后续建设工程领域合同风险智能化审查研究,最后采用《示范文本》片段与某工程施工合同实例完成了本体一致性与完整性的检验,验证了该开发方法的可行性与准确性。
建设工程施工合同中不同类别的条款具有不同的表意方式和语法规则特征,通过本文所构建的施工合同领域本体,它们能够转化为形式语言而被计算机所理解。本文的研究为基于规则的合同风险智能化审查算法奠定了基础,在此基础上可进一步完成施工合同风险条款的识别。