华宇元典:法律人工智能的探索者
2019-03-21张闻素
文特约撰稿人 张闻素
2017年5月,美国百大律师事务所Baker & Hostetler启用了以IBM的Watson计算机为基础的人工智能律师ROSS,对,Watson就是在2011年美国电视节目《危险边缘》中打败人类选手的那个机器,于是律师工作将被取代的争论见诸各大报端。
2017年10月,AlphaGo Zero在没有使用任何人类棋局数据进行训练的情况下,三天之内通过自我对弈自学成才,将曾经打败过李世石的AlphaGo版本赶下还未坐热的神坛,之后又迅速击溃所有前代版本。这揭示出在特定领域里,数据虽是淬炼AI的火焰有时却不需要普罗米修斯带来火种而进行自我点燃,亦说明AI已经站在无数人类巨人智慧的肩膀上不仅能自主学习而且还能学得更好,甚至迅速超越人类认识的局限开辟出穷尽千年万世至今未能抵达的新疆域。
元芳,你怎么看?唐代武则天时期的狄仁杰在判案件关键之际总是习惯性地征求意见,但如今我们恍若隔世地发现,福尔摩斯般存在的法官、检察官、律师等如“元芳”角色的司法业界同仁已经在线。人工智能、大数据、云计算、区块链等技术被整合运用于法律平台,日新月异的科技在法律行业的研发应用从而产生了更加高效精准的普世价值,公平正义就在弹指之间。人工智能法律平台努力想要实现的是,更好地实现论点、论据、论证之间的智能链接和科学逻辑推演,把案件的侦察、审理和判断等法律工作建立在数据、模型和卷帙浩繁资料案卷的科学分析和精准推演基础之上。
2016年诞生的人工智能法律平台名曰华宇元典,低调潜藏于中关村东升科技园。
“达特茅斯之夏”会议室的 “今日说法”
数九寒天的季节,我们在“达特茅斯之夏”会议室开始了热腾腾的深度访谈。
“达特茅斯之夏”对于法律人来说是略显陌生的词汇,但在人工智能界代表着渊源,因为1956年夏季在达特茅斯召开的人工智能研讨会揭开了AI序幕。
华宇元典专注于法律智能的研究和挖掘,在“实体识别引擎”基础之上运用自然语言理解、法律逻辑挖掘、法律概念认知等综合技术,结合专家团队对法律行业的理解和实务经验,形成法律文本知识挖掘的“法律认知引擎”,继而跨领域地对律师行业、法检行业、工商行业等等多元数据进行大数据整合,形成法律行业垂直数据库,进一步融合形成以法律知识图谱为基础、通过自然语言处理和机器学习、提供法律认知能力的大数据知识服务平台。
华宇元典的产品线贯穿于法律生态圈,迄今,元典已基本完成在法院端、检察院端和律师端的产品链布局。2017年3月12日,撒贝宁“今日说法”走进北京三中院探訪高科技法庭,对话全国首个导诉机器人,解析法院三级联动、智慧执行、步步为营、打击老赖绝不手软的断案过程,节目展现了法院利用人工智能、单兵系统作战、无人机侦查等科技手段促进判决结果精准高效且公平公正的全过程,其中就有华宇元典与兄弟公司华宇信息合作研发的“睿法官”的身影。
在法检领域,华宇元典与华宇信息合作,开发了针对法院的“睿审·智慧裁判解决方案”,以及面向检察院的“晓督·智慧公诉辅助系统”;在律师行业,元典智库、元典律师工作平台等互联网产品也在全国多地律所投入使用。它们都由元典睿核作为智能底层针对不同业务场景提供技术支持。
元典专注于法律与人工智能结合与交集的领域,致力于为法律全产业链、法律生态圈研发智能产品,真正让数据流动起来,让智能渗透于法律人日常工作,帮助法律人创造更多价值。其实,华宇元典的母公司华宇集团已经在中国电子政务领域深耕细作十余年,凭借深厚的行业经验,融合大数据、人工智能以及自然语言等技术领域的优势,为各类政府机构提供优秀的信息化整体解决方案。
但是每个单点突破,都意味着海量内容梳理与技术链接,比如知识图谱提炼过程分为几个步骤:小样本研究、监督学习、人工标记、人工检索、强化学习、交叉验证、原型开发、模型测试、部署试用、模型调整……再如已经完成的刑事50余个罪名可以覆盖95%案件量的法律知识图谱研发,已形成核心底层技术并运用到华宇元典的众多产品中。极强的专业性,复杂的工程性,正因高端纷繁,所以兴致昂然。
华宇和元典有机融合的来龙去脉与源远流长
元,始也。象征源头与事物根本,AlphaGo Zero中文译名也是“阿尔法元”。
典,意味着基准与法则。立法文件编纂的集大成者,为法典。
“元典”是清华大学法学院许章润老师的赠名。生其智谓之元,正其义谓之典。
华宇元典是华宇软件旗下子公司,源于华宇17年的坚持专注与行业积累,在法院、检察院信息化建设领域持续深耕,借道近年新兴的人工智能技术顺势而为、寻风而上,打造法律AI新概念。
华宇元典创始团队的初衷是法律和人工智能相融合,让机器逐渐习得法律认知能力,在数据孤岛间搭建连接的道路,使法律制定与实施更加公正、明智、透明,为喧嚣世界带来更好的规则。虽然人工智能的本质和范畴包括但不限于语音识别、计算机视觉、自然语言处理、信息检索、机器学习、智能控制机器人、无人机与无人车等,但精准的AI科技形态与混沌复杂的法律领域无缝对接尚有距离,华宇元典自诩为法律AI的探路者,CEO邹劭坤在多次公开演讲中谈到关于法律人工智能的真实当下与可能的未来,引用行业用语“有多少人工,就有多少智能”。
目前的法律科技领域仍然坑多水深,他们从未幻想指望把一堆文书丢给机器而坐等脱胎换骨的机器法官和机器律师,不仅仅是大数据与以往的关键词检索匹配,而是在尊重世界的复杂性而事必躬亲地进行大量地晨昏朝暮的具体工作,付出巨大的经济和时间成本,甚至踏踏实实地花笨功夫。
《三体》作家刘慈欣说,法律AI不过处在刚刚起步的史前时代。
随机森林,曾为法官检察官律师的核心团队登临忒修斯之船
华宇元典有很多间会议室,每间会议室命名都有一个故事。
“隨机森林”,1995年产生于笔者多年前曾经造访过的位于美国新泽西的贝尔实验室,在机器学习中,随机森林是包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定,恰如多个人组成的攻关团队,每个人都需要有其他人不具备的能力。元典以此命名会议室,一方面是技术团队的象征,另一方面寓意元典本身就是不同行业和领域人才的相互融合。公司希望将不同知识、经验、能力的人组合在一起,将融合智慧淬炼成机器智能。
“0725”是元典唯一一间以数字命名的会议室,0725是元典成立的日子;“薛定谔的bug屋”代表着元典对“bug无”的美好期待;“忒修斯之船”是法哲学中同一性的问题;“达特茅斯之夏”是纪念60年前达特茅斯会议AI兴起的源头……华宇元典用这些故事来启发法律问题的解决之道并为行业带来探索发现的灵感和曙光。
积沙成塔,集腋成裘。华宇集团在行业中有着深厚的积淀和品牌影响力,元典从事研究的领域也非常具有挑战性和趣味性,创新立意和深厚底蕴吸引了曾为法官、检察官和律师的优秀人才。CEO邹劭坤、COO黄琳娜之前曾是检察官、法官,从司法人员华丽转身为创业者兼职业经理人,转身的角度和力度都很大,如何实现职业角色的变换和跨界,中间肯定包含着有趣和凑巧的故事情节。
CEO邹劭坤曾从事涉外法律服务,后在检察院做公诉人,承办过大量具有典型意义的新型案件,之后又辗转做过私募和商事律师,是位喜欢挑战和尝试新鲜事物的“不安分”的人。在他看来,整个法律行业在大数据和智能化方面还较为滞后,不仅体现在工具上,还体现在意识上。这种局面一旦改变,法律行业的生产力会被进一步激发。而华宇元典就具有这样的使命感。
COO黄琳娜毕业于北京大学法学院,是香港城市大学的普通法学硕士,既有法院的民商事审判经验也熟悉律师市场。一篇访谈里提到她辞掉上一份工作时,她面对着几个不同类型的offer举棋不定,直到遇见元典,没怎么犹豫就答应了这份邀请。这位笑意嫣然的南方姑娘在那篇访谈中说,接受这个邀请,是因为这个团队对大数据的未来有深远纯粹的奇想,而且愿意付出日日夜夜的辛劳。我是个对大词儿无感的人,不爱提梦想,说服我的与其说是愿景的堂皇,不如说是诚实且认真地对待当下真实局面的态度,点滴改善,逐渐突破。所以每次对外讲座或交流,我都会泼冷水,说法律大数据是个水深坑多的行业。
华宇元典跨界融合了上市公司的稳健与初创企业的激情,也融合了法律人、NLP算法工程师、程序员、产品经理等思维气质迥然不同的群体,并把他们变成亲密伙伴,相互协同在法律科技领域深耕,探索用智能技术解锁法律领域更多可能,如今这片如意快活的随机森林已有近200名员工,包括本科和国内外硕博,他们既可以激烈争执,亦可以相视大笑,这样的状态构成了快意工作场景。
以人工智能和算法连接并精准解析数据孤岛
FOR LEGAL INTELLIGENCE,这是华宇元典官网首页的英文关键词。
让机器逐渐习得法律认知能力,在数据孤岛间搭建连接的道路。大数据、人工智能,在这些应用之间建立粘性和协同,是华宇元典以技术架构法律智能化的工作要点。譬如类案推送,必须要选择跟当前案件的案情精确匹配的类案,才有真正的参考意义。案件里存在各类因素和要件,法律本身也往往存在大量争议和模糊地带,如何让机器认知要素和整体案情,区分相似与不同,并且让区分越来越精细,如何将法律人的经验智慧转化为机器智能并在实务场景中服务于法官、检察官、律师是极具挑战性的研究领域,也是迫待解决的核心问题。虽然最终这些智能输出是机器完成,但是在研发过程中却有广大法律人的悉心参与。
之前发生的某起明星醉驾案,关于量刑众说纷纭。当法律无法被量化、结果无法可视化的时候,争议在所难免。华宇元典的智能量刑辅助系统针对此案立刻做出量刑预测,给出的量刑区间最后与实际裁判结果几乎完全符合,这是大数据和人工智能使然。目前,在量刑建议机制和智能决策系统的辅助下,广州、深圳检察机关使用认罪认罚从宽制度的量刑建议采纳率高达94.46%。
本质而言,并非人工智能替代了人,而是人工智能平台系统辅助了人,单纯的“法律+人工智能”结不出法律人工智能的果子,真正打开其宝库的钥匙并不完全在于机器学习和算法而在于人,在于法律和人工智能的连接,华宇元典正在深度尝试并践行。
法律智能领域的深度研究和豁达开放的竞合态度
问渠哪得清如许?为有源头活水来。华宇元典正在疏浚“法、检、律、司”整个司法系统资源,为公民提供法务便利,让审判更加公正高效智能,让司法管理更加有据可依,让可视化透明化且简捷高效的“阳光司法”“一键立案”落地成真。通过数据挖掘自动搜索关联信息,揭示预测法律风险点分布,为建立“精准案例信息推送”奠定基础,为官方立法修法提供数据支持,华宇元典正是与法检律司联动工作的智能审判、智能司法的技术探索者、研究者和支撑者。
案多人少和冤假错案等现象级矛盾亟需解决。正如凯文·凯利所言,科技的力量有两种,一种是效率,一种是解决其复杂性。人工智能已经在改造法律行业,规模和速度不仅仅取决于技术进步的步伐,而且取决于整个法律共同体对于新技术新模式的接纳程度。工信部前段时间发布的《新一代人工智能产业创新重点任务揭榜工作方案》对于行业而言将是重磅利好。
华宇元典非常重视域外交流,高频的切磋探讨从更专业的角度迭代跃迁,亦带来更多思考。2018年5月,全国律协领导与台湾律师公会联合会组成的台湾律师代表团一行到访元典,元典作为大陆法律科技与法律智能探索者的代表与台湾律师们分享了成果和经验;6月,元典法律业务专家受邀赴美参加2018中美人工智能产业峰会 ,在法律分论坛展示了目前元典在法律人工智能领域的研究现状……这样类似的交流于元典还有很多,未来也会继续下去。元典相信,在这条前路漫漫的法律智能之路上,只有学会聆听与分享,才能少走一些岔路,多一些改变这个行业的机会。或许未来法律人工智能行业竞争将会更加激烈,但COO黄琳娜的态度却不见忧虑,她幽默地说希望出现更多同路人,如此,创业途中便不会太寂寞。
访谈结束之际,她拿出华宇元典法律人工智能研究院主编的新书《让法律人读懂人工智能》,亲笔签名以字相赠“愿达特茅斯之夏的阳光照亮我们迈向简单的旅程。”封面竟有凯文·凯利亲笔题词:AI law will be a new kind of law.
华宇元典2017年搬到“快乐工作+时尚生活”幸福指数高栖的创新人才生活圈东升科技园,并与园区环境、氛围、资源、精彩纷呈的各项活动共享互动,对公司团建和企业文化起到了意想不到的推动和融合作用。业界合作伙伴戏称华宇元典为“小狮子”,那么这只小狮子如何领跑世界成为“狮子王”,我们拭目以待这部法律人工智能领域的国际大片。
离开中关村东升科技园之际已是华灯初上,辉映着每扇亮着的加班加点的有故事的窗。