基于诉讼风险分析的智能推理应用探究
2021-05-21朱福勇龙依雯王凯
朱福勇 龙依雯 王凯
摘要:人工智能技术的快速发展为诉讼规则知识库构建奠定了坚实基础。当前在诉讼风险分析中,智能推理存在司法风险规则知识库匮乏、诉讼风险分析技术较低等弊端,以致无法从根本上化解证据、诉讼时效和行为规范等方面的风险。是以,需要就案件类型化后随机抽取,并收集案例的起诉状、证据、案情和裁判文书,在对多方证据关联分析模型进行解析的基础上,设计开发诉讼时效性规则知识库、当事人行为规范性规则知识库以及证据有效性规则知识库,结合多方证据关联模型,并与法律法规知识库和诉讼风险规则知识库融合,运用决策树算法,关系网络推理技术列举分析可能存在的诉讼风险,最终达至对诉讼风险点的识别、裁判结果的精准预测和合理分流不必要的诉讼,以期为民众提供全面的诉讼决策指引。
关键词:人工智能;推理规则;诉讼风险;规则模型;分析与运用
中图分类号:D920.4
文献标识码:A
文章编号:1673-8268(2021)01-0073-11
早在1970年,布坎南(Buchanan)与亨德里克(Hendrick)发表《关于人工智能和法律推理若干问题的考察》一文[1],拉开了司法裁判领域人工智能研究的序幕[2]。作为人工智能的核心内容,推理是从一个或几个已知的判断(前提)推出新判断(结论)的过程[3],在人工智能步入以深度学习为主导的阶段,推理技术亦与此保持同步发展,将规则演绎系統、专家系统、机器学习、贝叶斯网络、知识图谱乃至事理图谱等先进的推理技术[4]应用但不限于制定法的规则之中,将在一定程度上提升诉讼风险知识库和诉讼风险预测的准确度。实践中,我国人工智能推理规则在诉讼风险预测的应用上处于初级层面,其面临诉讼风险规则知识库匮乏和诉讼分析方法技术不高两大挑战,而理论界对此关注不多。随着最高人民法院2019年《工作报告》“全面建设智慧法院,发挥司法大数据管理和服务平台作用,为群众诉讼提供服务,为科学决策提供参考”的提出[5],人工智能推理在诉讼风险分析中的研究显得极为必要和迫切。为此,本文通过对500件案例类型化后的随机调取,并收集起诉状、证据、案情和裁判文书,在解析多方证据关联分析模型的基础上,依据法律法规中的风险点,设计开发诉讼时效性规则知识库、当事人行为规范性规则知识库及证据有效性规则知识库,结合多方证据关联模型,融合法律法规知识库和诉讼风险规则知识库,运用决策树算法、关系网络推理方法列举分析可能存在的诉讼风险点,以期精准识别诉讼风险,为民众提供全面的诉讼决策指引有所裨益。
一、诉讼风险的规则模型
(一)诉讼风险的界定
诉讼风险是指当事人在诉讼活动中可能遇到的一些争议事实以外的因素,这些因素会影响案件的审理和执行,使得当事人通过诉讼以期保全的法益增添无法实现的风险[6]。这些风险集中于证据有效性、诉讼时效性以及当事人行为规范性等方面。在此,本文以民间借贷纠纷为例,以当事人起诉为视角,对上述三个方面分别进行分析。
1.证据有效性
在司法理论和实践中,证据有效性主要从证据能力和证明力两个方面进行判断。前者是指证据资格有无的问题,后者是指证据对案件事实的证明程度或者影响力,证据证明力大小取决于证据与待证事实之间的关联程度,证据是否可靠及其有多大证明价值,由法官进行判断,属于法官依法心证的范畴。而这正是证据采信标准所要解决的问题,即证据的证明力问题[7]。在民间借贷纠纷中,当债权凭证、借款支付凭证、还款凭证等不是原件且与原件不相符时,或者上述凭证不具备真实签章或公证时,存在证据不真实的诉讼风险。支付凭证、还款凭证、鉴定意见等出具主体不合法,或者证据形式与法律规定不相符,或者证据搜集程序违反法律规定,则存在着证据不合法的诉讼风险。上述凭证以及借还款事实佐证、视听资料、鉴定意见等与起诉状中相关信息比对不一致,则存在证据无关联性的诉讼风险。对于举示证据的一方与证人有利害关系,或者本金、利息、违约金、还款时间、还款金额等与起诉状、证人证言、视听资料中相关信息比对不相符,则构成证明力降低的诉讼风险。对证据来源的可靠性分析,需要结合举示证据的一方或者证人的知识水平、身份和动机进行分析,而判断证据内容是否可信,则需要就证据内容的可能性、一致性、合理性与详细性一并考虑。对证明价值的评判是法官对证据内容、意义在法律上所做出的价值判断,需要按照先单个证据或单组证据、后全部证据的顺序进行。上述情形只要存在些许瑕疵,则可能会产生证据证明力锐减甚至丧失之风险。
2.诉讼时效性
权利人在法定期限内不行使权利,其权利即依法消减的时效称为消灭时效,我国民法称其为诉讼时效[8]。从《人民法院民事诉讼风险提示书》规定来看,原告诉至法院后,被告提出原告起诉已超过法定的保护期间,而原告未对被告主张的事实提供相反的证据证明,其诉请难以得到法院支持。我国《民法典》第188条规定,在民间借贷纠纷中,超过诉讼时效的风险主要有两种情形:一种是借据、收据、欠条等债权凭证约定还款期限到期产生的风险:借款日期到诉讼风险评估之日,超过20年或催款时间到诉讼风险评估日期超过3年;另一种是上述借款凭证未约定还款期限,起诉状、借还款佐证(证人证言、微信/支付宝/短信等)信息中有债权人催款、债务人无意还款的语义及时间,催款时间到诉讼风险评估日,时间超过3年。
3.当事人行为规范性
按照我国《民事诉讼法》第121条的规定,起诉状应当记明当事人的基本情况、诉讼请求和所根据的事实与理由、证据和证据来源、证人姓名和住所等内容。对于当事人提供的基本情况或者信息不全,诉讼请求和所根据的事实与理由含糊不清、模棱两可,证据和证据来源、证人姓名和住所缺失,以及起诉状未写明日期或无原告签章等,均存在起诉行为不规范之风险。与此同时,还存在以下诉讼行为不规范之风险:诉讼主体不适格、管辖权错误等情形。
(二)规则模型的建构
依据我国诉讼法及其司法解释的规定,通过对裁判文书、当事人举示的证据材料和电子卷宗等样本的收集、梳理、数据加工,适用关键句筛选、句法分析、模式匹配和分类预测等技术,通过Bootstrapping[9]等样本采样和多分类器投票算法进行风险规则和数据关系的高效抽取,可以构建诉讼风险规则知识库,由分析规则和数据关系构建事理图谱,最终形成诉讼风险规则模型(见图1)。
1.诉讼风险规则知识库的归入
规则知识库将专家对某个领域的经验知识转化成通用规则,通过匹配输入信息和规则知识库前提条件推出结果[10]。它“涵盖大量的程序性概念和关系、相关实体之间关系的推理逻辑,集成的数据层和模式层,以及规则模型与推理模型,使当事人能够自助获取专业化诉讼意见,正确评估诉讼走向,形成合理的诉讼预判,减轻当事人的诉讼成本,分流非必要诉讼”[11]。以民间借贷纠纷为例,诉讼风险规则知识库构建采用如下方法。
首先,对诉讼法及其司法解释分别进行分句数据加工、文本分析、关键句筛选、句法分析,运用NLP技术[12],挖掘民间借贷纠纷潜在的诉讼风险点。
其次,通过剔除语义噪音,利用触发词[13]、模式匹配和分类预测,从文本中完成相关句子的筛选,将民间借贷纠纷诉讼风险点根据特征相似度分别归入行为规范性、诉讼时效性、证据有效性,并将其标签化,建成通用的数据模型,形成民间借贷纠纷诉讼风险规则。
最后,对证据有效性法条识别并分类时,将我国《民事诉讼法》第67条和第70条第1款等法条梳理得到的诉讼风险规则归入证据有效性风险规则知识库;对诉讼时效性法条识别并分类时,将由《民法典》第188条等规定总结得到的诉讼风险规则归入诉讼时效性风险规则知识库;对行为规范性法条识别并分类时,将由《民事诉讼法》第119条和第143条等规定梳理得出的诉讼风险规则归入行为规范性风险规则知识库。
2.诉讼风险规则模型的形成
在证据关联分析模型的基础上,基于多方证据、裁判文书和电子卷宗等文书以及海量案件信息,从不同类型案件进行证据的特征提取和规律描述,标记多方证据之间的逻辑关系,利用贝叶斯网络[14]选取概率最大的证据链作为最优可信的证据链条。在技术上,采用Bootstrapping等样本采样和多分类器投票算法进行风险规则和数据关系的高效抽取,使风险规则的关键词与证据关联模型中的最优可信证据链的证据要素相匹配。例如,依据我国《民事诉讼法》第70条第1款的规定,提取诉讼风险规则中的“书证”,与证据要素库中的“债权凭证”“借款支付凭证”“还款凭证”等证据要素进行匹配,将其作为构建事理图谱的最小单位。在此基础上,形成诉讼风险规则模型。从结构上来看,事理图谱是向与环的结合,节点指向事件,向边表示事件之间的关系,它依循逻辑序列,通过对类案证据的梳理和学习,按照支持度和置信度,以及逻辑关系形成一定的规则,辅之以法律专家意见,提升证据链条的精准性[15]。例如,在民间借贷纠纷中,假设存在借贷关系,“张通过银行转账借给王1万元”“李为王提供一般保证”,事理图谱有助于对张的诉请是否超过诉讼时效、诉至法院后证据链条是否闭合的判断,以及进一步预测能否通过要求李承担保证责任来实现1万元的债权等,对各个法律事实内在逻辑进行深入挖掘,得出因果、顺承逻辑关系,形成一个对诉讼风险进行预判的完整体系。证据真实性诉讼风险规则事理图谱包括“证据是否为原件、复制件与原件是否相符”和“是否具备有真实签章或公证”两个部分。将“债权凭证”“借款支付凭证”“还款凭证”“借、还款事实作证”整合到证据真实性风险规则中,即可形成证据真实性诉讼风险规则事理图谱,进而由证据能力、证明力、诉讼时效、起诉要件等规则构建诉讼风险规则模型。
二、诉讼规则的智能推理
规则推理是专家系统中常用的推理机制,其为基于规则表示的知识系统,主要采用规则知识库推理生成问题解决结果[16]。基于诉讼风险规则模型,依托多方证据关联模型,结合证据条件可信评估方法,围绕诉讼请求,采用关系推理网络正向推理,得出对诉讼时效性、行为规范性、证据有效性的风险识别与预测。由于上述“三性”所涉问题判别的特征显著,采用浅层判别模型便能以较小的成本实现风险的预测,因此,采用决策树的ID3算法,输入诉讼证据向量,输出对诉讼规范性、行为规范性和证据合理性的二分类,进行诉讼风险预测与评估。
(一)诉讼风险规则的数据来源
通过对多方证据、诉讼材料、裁判文书和电子卷宗等研究载体中的有效信息的实体识别和证据特征提取、归类、去噪等规范化、格式化处理,得出最优可信证据链的结构化证据,作为数据来源输入诉讼风险规则模型。同时,结合诉讼风险规则知识库,对诉讼风险规则的关键词与证据关联模型中的最优可信证据链的证据要素进行匹配(见图2),奠定下一步操作之基础。
(二)诉讼风险规则特征向量的提取
诉讼风险规则特征向量的提取方法是:根据结构化的证据要素模型,基于诉讼请求、案件事实输入多方证据关联图谱,由诉讼风险规则知识库和相关证据条件可信评估概率对诉讼证据进行特征提取和量化,将离散证据要素转变为特征向量。例如,在民间借贷纠纷中,证据真实性诉讼特征设计与量化是通過“证据是否是原件或与原件是否相符”将数据分为两类:若不是原件或者复印件与原件不符,则定义为有违反证据真实性的风险,编码为1;反之,进入二级分类。以“证据是否具备真实签章或公证”为标准,将数据分为两类,即若具备,则定义为无证据真实性风险,编码为0;若不具备,则定义为有证据真实性风险,编码为1(见表1)。通过二层级别分类,筛选出无真实性瑕疵的证据,此为将证据特征化的必须操作。
与此同时,在诉讼时效性、行为规范性、证据有效性的风险辅之“设定选项”“问答”方式输入,使特定向量的提取更加明确。这里以自然人之间民间借贷纠纷(非担保型)为例予以说明。
问题1:出借人是否有借款支付凭证?(*)
A.银行汇款凭证B.现金凭证C.微信/支付宝转账凭证D.无借款支付凭证
选择A对应的特征意义:银行汇款支付凭证合法
(问题1选择B的进行此项提问)问题2:现金收据凭证是否有债务人签字或盖章?(*)
A.有债务人签字或盖章B.无债务人签字或盖章
选择A对应的特征意义:现金收据支付凭证合法
选择B对应的特征意义:债务人名称不匹配或没有签字/盖章的,现金收据支付凭证合法性存在问题
(问题1选择C的进行此项提问)问题3:微信/支付宝转账凭证是否通过鉴定?(*)
A.通过鉴定B.未通过鉴定/未鉴定
选择A对应的特征意义:电子证据借款凭证与原件相同
选择B对应的特征意义:电子证据借款凭证的真实性存在问题
(未识别到借款凭证的进行此项提问)问题4:是否订立书面的借款合同或借据?(*)
A.订立书面借款合同或借据B.未签订书面借款合同或借据
问题1选择A/B/C,问题4选择A/B的风险结果:自然人之间的借款凭证可以采用书面形式或者口头形式,自出借人提供借款时生效。认定出借人已向借款人交付了借款可以从如下五个方面进行判断:(1)自借款人收到现金款项时;(2)自资金到达借款人账户时;(3)自借款人依法取得票据交付权利时;(4)自借款人依法取得对特定资金账户实际支配权时;(5)按照约定并实际履行完成时。
问题1选择D,问题4选择A/B的风险结果:自然人之间的借款合同可以采用书面形式或者口头形式,但合同的订立并不意味着借款合同的生效。自然人之间的借款合同,自出借人提供借款时生效。出借人无支付凭证或尚未将借款交付给借款人,故而借款合同虽已成立但未必生效。
(问题4选择A的进行此项提问)问题5:借款凭证是否有双方签字或盖章?(*)
A.有双方签字/盖章B.缺少双方或一方签字/盖章
选择A对应的特征意义:借款凭证合法
选择B对应的特征意义:借款凭证缺少签字/盖章,合法性存在问题
(未识别到借款凭证借款金额,如未上传支付凭证补充信息)问题6:借款实际金额为人民币元。
(借款凭证借款信息借款金额)(银行汇款单/现金收据汇款金额/收款金额)(支付宝/微信转账凭证转账金额)
(未提取到约定利息的进行此项提问)问题7:借款是否约定了利息?(*)
A.未约定利息B.约定年利率为%(书证-借款凭证-借款信息-约定利息)
(未提取到逾期利息或违约金的进行此项提问)问题8:是否约定了逾期利率?(*)
A.未约定逾期利率B.约定了逾期年利率为%(书证-借款凭证-借款信息-约定违约金)
(未提取到约定还款日期的进行此项提问)问题9:是否约定了还款时间?(*)
A.未约定还款日期B.约定了还款日期,为年月日(书证-借款凭证-借款信息-约定还款日期)
(未提取到还款支付凭证的进行此项提问)问题10:被告是否有还款行为?(*)
A.有B.无
(问题10选择A的进行此项提问)问题11:还款实际金额为人民币元(加入借款凭证-借款信息-借款金额)
(问题9选择A的进行此项提问)问题12:目前是以下哪种情况?(*)
A.借款日期到现在已超过20年B.借款日期到现在未超过20年,距离上次向被告主张还款已经超过3年C.没有上述情况
选择A/B对应的风险结果:已超诉讼时效。对已超诉讼时效的诉讼请求,法院受理后,对方当事人提出该诉讼抗辩,经查明,无中止、中断、延长事由的,将判决驳回该诉讼请求;对方当事人未提出该诉讼抗辩,则视为其自动放弃该权利,法院不得依照职权主动审查。
选择C对应的风险结果:未发现诉讼时效风险。权利人在法定诉讼时效期间内提出诉讼请求的,法院应当受理并支持其诉讼请求。
问题13:借款发生时,借款人处于何种婚姻状况?(*)
A.婚姻关系存续期间B.离婚后C.未婚
(问题13选择A的进行此项提问)问题14:请问借款人配偶是否在借贷合同上签字?(*)
A.配偶有签字B.配偶未进行签字
(问题13选择B的进行此项提问)问题15:借款用途是以下哪种情况?(*)
A.家庭日常B.夫妻双方共同经营公司或其他业务C.没有上述情况
(加入借款凭证-借款信息-借款原因)
选择A对应的风险结果:夫妻均在贷款合同上签字或者夫妻一方事后追认等共同意思表示所负的债务,一般认定为夫妻共同债务。因此,借款应当由夫妻共同偿还。
选择B和选择A对应的风险结果:在婚姻关系存续期间,夫妻一方以其名义为家庭日常生活需要所负的债务,应界定为夫妻共同债务,由夫妻共同偿还。
问题14选择B,问题15选择B对应的风险结果:夫妻一方在婚姻关系存续期间以个人名义为夫妻双方共同经营的公司或其他義务所负债务,为夫妻共同债务,应当由夫妻借款人共同偿还。
问题14选择B,问题15选择C对应的风险结果:在婚姻关系存续期间,夫妻一方以个人名义超出家庭日常生活需要所负的债务为个人债务,应界定为非夫妻共同债务。
问题16:借款人是否有如下行为?多选(*)
A.未按照约定用途使用借款B.未按照约定还款及付息
选择A对应的风险结果:借款人未按照合同约定的借款用途使用借款的,借款人构成违约。
选择B对应的风险结果:借款人收取借款后,未按照借款合同的约定返还借款、支付利息的,借款人构成违约。
问题17:原告是否出庭? (*)
A.单独出庭B.与委托代理人一同出庭C.由委托代理人代为出庭D.不出庭,也无委托他人代为出庭
选择C对应的风险结果:由代理人或律师代替出庭可能会增加诉讼风险。委托代理人无法真正代替當事人的位置,当事人本人没有出庭有些事实很难查清,会拖长审理期限。在当事人本人不出庭的情况下,当事人的知情权会受到影响,会弱化当事人对诉讼代理人的监督。如果委托代理人与当事人本人就案件事实向法院所作陈述不一致的,以当事人本人的陈述为准。如没有特殊情况,建议当事人和委托代理人一起出庭。
选择D对应的风险结果:本人不出庭,没有其他人代替出庭的诉讼风险极高。根据民事诉讼法有关规定,对不按时出庭或者中途退庭,经传票传唤,无正当理由拒不到庭,或者未经法庭许可中途退庭的原告,法院依法按自动撤回起诉处理。
(如有上传证人证言的进行此项提问)问题18:证人是否可以出庭作证?(*)
A.是B.否
选择B对应的风险结果:除法律和司法解释规定的证人确有困难难以出庭的情形之外,当事人提供证人证言的,证人应当出庭作证并接受质询。证人不出庭作证的,可能影响该证人证言的证据效力,甚至不被采信。
问题19:双方当事人是否有以下情形?(*)
A.一方或双方是外国人或港澳台居民B.借款借出地在国外或港澳台地区
选择A对应的风险结果:若当事人一方或双方为外国人或者港澳台地区的居民,即本案具有涉外因素,需按照涉外民事诉讼的相关规定确定管辖权。
选择B对应的风险结果:如果借款是在境外借出的,即本案具有涉外因素,需按照涉外民事诉讼的相关规定确定管辖权。
(未提取到借贷凭证中有争议解决约定的进行此项提问)问题20:双方当事人有无约定争议解决方式?(*)
A.已明确约定法院管辖B.已明确约定仲裁解决C.未明确约定争议解决方式
选择A对应的风险结果:在符合法定起诉条件的情形下,可以向具有管辖权的人民法院提起诉讼。
选择B对应的风险结果:不符合法院起诉条件,请向争议解决约定仲裁委提起仲裁裁决。对仲裁裁决不服,可申请法院撤销。
选择C对应的风险结果:在符合法定起诉条件的情形下,可以向具有管辖权(被告所在地或合同履行地)的人民法院提起诉讼。
(三)决策树的ID3算法
决策树是一种用树形结构构造的分类模型,其为倒树结构,由根结点、内结点、叶结点和边组成,其中根节点是最“源头”的结点,是决策树的始端,叶节点包含特征属性测试条件,每个叶节点代表一个类别,其功效在于分类或者回归,即在对决策树上的每一个内部结点分析和判断的基础上,获得一个子结点的结果。ID3算法是决策树的一种,采用自顶向下的贪婪搜索遍历数据集来建立预测模型[17]。它是以信息增益为标准,选择决策树的节点。信息熵[18]可以描述信息的不确定性,信息熵与不确定性具有正向相关性,即信息熵愈大,由此带来的不确定性愈高。计算信息熵的公式如下
(1)式中,D表示随机变量,pk表示随机变量的可能取值k所占的比例,k的取值范围是从1到K;定义为集合D的经验熵Ent(D)与特征a给定条件下D的经验条件熵Ent(D,a)之差即为特征a对训练数据集D的信息增益Gain(D,a)[19]。计算信息增益的公式如下
(2)式中,Ent(D)为数据集D的熵,Ent(Dv)是数据集Dv的熵,Dv是D中特征a取第v个值的样本子集,V是特征a取值的个数。由公式选择最优子项继续向下分裂建树,最优的子项同样具备最强的分类能力,通过对信息增益最大的特征为决策树一个节点的选取,旨在以此递归,进而获取整个决策树[20]。
利用ID3算法进行决策判定,以“是否是原件或者与原件相符的复印件”为分裂属性,则产生两个子集,其加权和为0.5,信息增益为0.5;以“是否具有真实签章或公证”为分类属性,则产生两个子集,其加权和为0.5,信息增益为0.5。通过计算得出,二者信息增益值相等,不妨以“是否是原件或者与原件相符的复印件”作为决策树的根节点,通过递归形式对子节点分类,可得出各层节点(见图3)。
图3民间借贷纠纷中部分证据真实性决策树建构图
输出末端节点,整合为格式规范的对应于诉讼时效性、行为规范性和证据有效性预测的二分类预测。例如,在民间借贷纠纷中,债权凭证不具有真实的签章,则输出“债权凭证有违反证据真实性的风险”之结果。
三、用例与实验分析
(一)实例演示
在理论推演和解析的基础上,采用HTML、CSS程序语言,使用Access数据库作为在线数据库形成诉讼风险分析预测规则知识库,开发了一款诉讼风险预测工具(见图4)。目前,涵盖借贷纠纷、婚姻家庭、劳动争议、工伤赔偿、房产纠纷、交通赔偿、遗产继承等,进入诉讼风险分析与结果预测平台,按照案件的性质,根据流程填写相关信息,能够在线出具专业性的诉讼结果预测意见书。
下面选取一个民间借贷纠纷实例予以演示,表2为源纠纷属性,通过人工分析得出诉讼风险分析结果(见表3)
在预测工具页面内直接上传民事诉状、借款、支付凭证等信息,使其主动获得目标案例属性值,如有需特别提问的问题或未检测到需上传的重要信息,可通过问与答的形式输入,如图5将源纠纷民事起诉状等信息和所回答的重要问题生成诉讼风险分析与结果预测意见书(见表4)。
通过对比表3人工诉讼风险分析结果和表4诉讼风险分析与结果预测意见书,可以发现人工智能分析不仅涵盖了人工分析的结果,而且给当事人提出更多诉讼风险分析与结果预测意见书的实用建议,初步证明了在本文理论基础上,设计的诉讼风险预测工具的有效性和可行性。
(二)性能评估与结果分析
为了保证实验结果更具说服力,在最高人民法院案例库中随机选取民间借贷纠纷、追索劳动报酬纠纷、机动车道路交通事故损害赔偿纠纷、法定继承纠纷和房屋租赁合同纠纷5类案件各100个案例进行测试,采用混淆矩阵[21]对人工智能诉讼风险预测工具进行性能评估(见表5)。
混淆矩阵对角线元素表示各风险类别能够被工具正确预测的数量,由表5数据可知,诉讼风险预测工具的准确率达到78%,说明其对实际案例适用已达至一定水平,多数情况下,与人工分析相比,混淆矩阵的效率性和准确性均得以体现,整体运行效果良好,将该工具用于实践具有可行性。但是,该工具不能预测出部分诉讼风险结果,原因在于,其规则知识库和推理机制在模型优化过程中还有进一步发展的空间。但这并不意味着这类风险预测工具的分析性能较之人工分析能力不堪一击,相反,在优化模型与增大数据样本、扩大数据库容量的基础上,人工智能诉讼风险预测的未来具有相当的可期待性和市场竞争力。
四、结语
本文通过模式匹配、分类预测等推理技术构建了诉讼时效性、当事人行为规范性、证据有效性三个规则知识库,运用事理图谱、决策树等推理技术设计出可行的诉讼风险预测模型,并基于本文理论研发了风险预测工具且进行实例测试。在验证本文理论的可操作性及实用价值的同时,78%的准确率表明其在相较人工分析的高效基础上准确率也较高。然而,“法律是灰色的,而生活之树常青”,我们应当看到现实纷争具有复杂性,现有的知识规则库难以完全覆盖,人工智能也可能因无法自主完成冲突规则、选择规则、规则缺漏和适用规则导致个案处理不公正等情形的处理,其分析速度和程序、价值判断,以及处理路径还存在着进步空间。未来,更多的法律规则将被纳入风险规则知识库并实时更新,通过优化算法、提高机器运行速率等方式,人工智能分析速度、准确性和推介路径将得到不断提升,从而更好地提高人工智能诉讼风险分析的实用价值和用户使用体验。当然,更加成熟的诉讼风险分析应用于人工智能诉讼结果的预测,为其提供评估结果输入服务和风险识别技术支撑,也会最终应用于人工智能诉讼风险分析和结果预测平台的研发。技术革新常常带来社会的变革,人工智能技术在诉讼领域的深度运用必将掀起法律服务产品标准化推广的浪潮,引领法律科技市场的蓬勃发展,在算法的缜密推理和代码的敲击声中开启一个崭新的司法时代。
参考文献:
[1]BUCHANAN B G, HEADRICK T E. Some Speculation about Artificial Intelligence and Legal Reasoning[J]. Stanford Law Review,1970(1):40.
[2]冯洁.人工智能对司法裁判理论的挑战:回应及其限度[J].华东政法大学学报,2018(2):21-31.
[3]吴飞,韩亚洪,李玺,等.人工智能中的推理:进展与挑战[J].中国科学基金,2018(3):262.
[4]周尚君,伍茜.人工智能司法决策的可能与限度[J].华东政法大学学报,2019(1):57.
[5]2019年最高人民法院工作报告[EB/OL].(2019-03-12)[2020-03-19].https://baike.baidu.com/item/2019年最高人民法院工作报告/23340921?fr=aladdin.
[6]唐京.论民事诉讼风险[J].党政研究,2004(3):76-78.
[7]何家弘,刘品新.证据法学[M].北京:法律出版社,2007:116.
[8]谭启平.中国民法学[M].北京:法律出版社,2018:257.
[9]吕云云,李旸,王素格.基于BootStrapping的集成分类器的中文观点句识别方法[J].中文信息学报,2013(5):84-93.
[10]BABUSKA R, SETNES M, KAYMAK U, VAN NAUTA LEMKE H R. Rule base simplification with similarity measures[C]//Proceedings of IEEE 5th International Fuzzy Systems. New Orleans: The Fifth IEEE International Conference on Fuzzy Systems,1996:312.
[11]朱福勇,劉雅迪,高帆,等.基于图谱融合的人工智能司法数据库构建研究[J].扬州大学学报(人文社会科学版),2019(6):94.
[12]林奕欧,雷航,李晓瑜,等.自然语言处理中的深度学习:方法及应用[J].电子科技大学学报,2017(6):913-919.
[13]陈自岩,黄宇,王洋,等.一种非监督的事件触发词检测和分类方法[J]. 国外电子测量技术,2016(7):91-95.
[14]李硕豪,张军.贝叶斯网络结构学习综述[J].计算机应用研究,2015(3):641-646.
[15]丁效,李忠阳,刘挺.事理图谱:事件演化的规律和模式[EB/OL].(2019-07-20)[2019-12-16].http://www.360doc.com/content/19/0720/15/46162198_849962481.shtml.
[16]AVDEENKO T V, MAKAROVA E S. Integration of Case-based and Rule-based Reasoning Through Fuzzy Inference in Decision Support Systems[J]. Procedia Computer Science, 2017(103):447-453.
[17]QUINLAN J R. Induction of Decision Trees[J]. Machine Learning, 1986(1):81-106.
[18]曲开社,成文丽,王俊红.ID3算法的一种改进算法[J].计算机工程与应用,2003(25):104-107.
[19]刘航,华春杰.基于ID3算法的农村产业精准扶贫研究[J].计算机产品与流通,2019(3):176-177.
[20]林志远.基于决策树算法的心脏病预测研究[J].电子制作,2019(6):25-27.
[21]孔英会,景美丽.基于混淆矩阵和集成学习的分类方法研究[J].计算机工程与科学,2012(6):111-117.
Abstract:The strong development of artificial intelligence technology has laid a solid foundation for the construction of litigation rules knowledge base. Currently, in the process of litigation risk analysis, intelligent reasoning has some disadvantages, such as lack of knowledge base of judicial risk rules, low technology of litigation risk analysis, etc., which cannot fundamentally resolve the risks in evidence, limitation of action and code of conduct. Therefore, it is necessary to select cases randomly after they are typed, and collect the indictment, evidence, facts and judgment documents of cases. On the basis of analyzing the multi-party evidence association analysis model, according to the legal risk points, we design and develop the knowledge base of litigation prescription rules, the knowledge base of Party behavior normative rules and the knowledge base of evidence validity rules, combined with multi-party evidence relationship. The joint model, which is integrated with the knowledge base of laws and regulations and the knowledge base of litigation risk rules, uses decision tree algorithm and relational network reasoning technology to enumerate and analyze the possible litigation risks, and finally achieves the identification of litigation risk points, so as to provide comprehensive litigation decision-making guidance, accurate prediction of judgment results and reasonable diversion of unnecessary litigation for the public.
Keywords:artificial intelligence; rules of reasoning; litigation risk; rule model; analysis and application
(編辑:刘仲秋)