司法人工智能的合理预期
2019-01-21金鸿浩
金鸿浩
毫无疑问,人工智能、大数据、云计算已成为新一代信息技术的ABC。党中央、国务院先后印发了《促进大数据发展行动纲要》(国发〔2015〕50号)、《“十三五”国家科技创新规划》(国发〔2016〕43号)、《新一代人工智能发展规划》(国发〔2017〕35号),明确提出“创新驱动发展”战略。
笔者认为,首先,应当准确全面理解中央文件的精神。国务院《新一代人工智能发展规划》是一个中期规划,强调“发展人工智能是一项事关全局的复杂系统工程”,不是一蹴而就的。规划提出“三步走”战略,即到2020年人工智能总体技术和应用与世界先进水平同步,到2025年人工智能基础理论实现重大突破,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
《最高人民检察院关于深化智慧检务建设的意见》为一个中期规划,强调“积极开展检察科技创新,探索人工智能、大数据、云计算、物联网等新兴技术与检察科技应用的有机融合”。《规划》将智慧检务建设也分为三个阶段:2017年年底,完善智慧检务基础理论和顶层规划,完成电子检务工程建设,夯实智慧检务的工作基础;2018年至2020年底,充分运用新一代信息技术,实现检察系统设施联通、网络畅通、平台贯通、数据融通,推进检察工作由信息化向智能化跃升,研发智慧检务的重点应用;2021年至2025年底,全面实现智慧检务的发展目标,以机器换人力,以智能增效能,打造新型检察工作方式和管理方式。
审判工作、检察工作的司法智能化建设是大势所趋,是“政法智能化”战略的重要组成部分,任何忽视科技、忽略创新、按部就班的做法需要严肃批评;但在实践中,同时也要防止“司法智能化”的“虚火”,防止“为了创新而创新”“揠苗助长”,防止“八仙过海”“重复建设”。
司法人工智能当前处于什么阶段?我个人认为应该至少从技术成熟度、业务成熟度和队伍成熟度三个层面进行剖析。
方兴未艾:技术成熟度的思考
科学家共识是目前以及将来较长一个阶段,人工智能技术仍长期处于弱人工智能阶段。
在司法场景中,具体人工智能技术应用的成熟度上,普遍已具备较为完善的模型和功能,但与成熟应用的预期目标仍存在一定差距。比如智能语音技术,在实验室互联网环境中,语音识别精确度超过95%;但是在司法办案场景,如讯问室内网环境中,语音识别精确度受到网络因素、环境因素制约,精确度会大幅下降;再加上方言因素的影响,部分试点院公诉人和嫌疑人端的识别率相差超过20%。
再如自然语言理解,在通用规范语言上识别准确率较高,但是在需要上下文语义背景下理解词汇等方面仍存在不少“短板”。比如“王某供述,偷了甲的苹果”,机器识别很容易理解为作为水果的苹果,而承办人根据上下文则很容易理解为iPhone苹果手机。对同一事物的不同表述也会影响机器识别,比如“妻子”,在各地的表述有“夫人”“拙荆”“爱人”“堂客”“贱内”“太太”“老婆”“婆媳”“孩他妈”“家里的”“老伴儿”等,承办人比较容易理解,但是机器却很难准确识别。
审慎探索:业务成熟度的思考
在应用现代科技方面,司法业务应当是积极的还是相对保守的?学界业界有不同的观点。但有一点是相对一致的,就是在对技术应用准确度方面,司法行业的要求更高。比如一项智能技术准确率80%就可以作为实验室原型产品,90%—95%就可以作为通用商业产品,但是作为保护社会公正的最后一道防线——司法领域,即便97%或98%的准确率也无法直接适用司法业务,承办人仍然需要再次对全案进行核验,因为哪怕1%的司法瑕疵也是无法接受的。试想每年百万件刑事案件,1%误差率就会产生一万件以上瑕疵案件,将严重影响司法公正。如果这些瑕疵正好是影响案件定性的关键证据认定,则可能构成冤假错案。更进一步的就涉及司法追责问题,如果因为机器辅助认定而导致的冤假错案,谁是责任方?技术公司、检察官还是操作智能系统的书记员承担责任?
再有就是怎么看待“技术黑盒”问题。“算法”是智能系统的核心知识产权,技术公司不会将算法公开或完全公布给司法单位。况且有一些智能系统是基于神经网络、机器学习逐步产生的计算模型,无监督学习模型在不断学习数据过程中还在自我修订,技术公司也無法精准全面表述该类模型算法。比如基于深度学习的智能辅助量刑工具就存在这一问题。假设当被告人律师在庭上质疑检察官的量刑建议时,检察官该如何清晰解释系统的量刑规则?如果无法解释机器算法是否会影响量刑建议的权威性和准确性?
此外,值得一提的是业务标准规则。软件工程实际上就是把业务需求转化为技术需求,最后通过编码实现的过程。既往公检法司、各地对刑事办案业务规则理解存在不一致情况。近年来,为推进政法协同和智能辅助办案,各地政法委组织协调公检法司单位,统一了部分常见案件的业务标准,这是近年来的一大进步。例如,上海市政法机关在2017年6月完成故意杀人罪、故意伤害罪、抢劫罪、盗窃罪、诈骗罪、非法吸收公众存款罪、集资诈骗罪等7个罪名证据标准指引制定工作,2018年3月完成了内幕交易罪、贪污罪、受贿罪等13个罪名证据标准指引制定工作。2017年11月,江苏省检察院制定了“交通肇事罪”标准指引,内置了交通肇事罪办案程序、证据、事实等规则650条,比对点1100个;2018年4月全省上线“危险驾驶罪”标准指引,包括办案程序、证据、事实等规则1133条,比对点1933个。浙江、云南等其他省份也在积极推进罪名证据标准指引的制定工作。
力学笃行:队伍成熟度的思考
司法队伍是否已经具备智能化条件下办案的准备,也是一个顶层设计和实践推广中应当考量的重要因素。具体可以分为三类人员:
第一类是领导干部对智能化是否引起重视,是否全面科学理解。习近平总书记明确指出“各级领导干部要努力学习科技前沿知识,把握人工智能发展规律和特点,加强统筹协调,加大政策支持,形成工作合力”。目前,各级党校、行政学院开设的相关课程需要及时更新。中央政法单位、各省级政法机关也可以参照当前信息化培训形式对领导干部进行轮训。
第二类是司法业务对智能辅助应用的操作进行学习。目前法官、检察官正处于新老更迭期,部分中年干警对于信息化技术尚存在排斥和不适应,部分青年干警对智能化技术的预期过高,都会影响智能化建设应用和试点推广。应该看到智能化应用和所有的信息化产品一样,是一个在应用中不断完善的过程,初期产品不可能完全成熟,个别时候个别系统个别功能甚至反而会影响工作效率。同时也要引导业务人员全流程参与智能化产品的需求分析、总体设计、测试验收、升级完善,防止出现最高人民检察院检察长张军指出的“技术拖着业务走”问题。
第三类是司法科技人员的知识更新和技术学习。近年来信息化技术突飞猛进,迭代加速,Hadoop技术、神经网络技术等迅猛发展,对司法科技工作者提出了更高要求。司法科技人员特别是基层地区、边远地区“本领恐慌”问题已经有所显现。特别是司法改革、内设机构改革背景下如何引进、培育、壮大司法科技队伍也是一个亟待解决的全新课题。
可喜的是,当前一批知名高等学校已经开始培养创新型、复合型的“互联网+”法治人才。例如北京大学法律人工智能研究中心、清华大学智能法治研究院、中国人民大学未来法治研究院、武汉大学网络空间治理研究院、吉林大学司法应用研究中心、中国政法大学法治信息管理学院、西南政法大学人工智能法学院、华东政法大学“互联网+法律”大数据平台等,有的从理工科本科生中选择优秀人才进行法律硕士培养,有的通过开设辅修课程等方式加强法学生科技教育,未来复合型人才将成为司法智能化建设和应用的中坚力量。
综上所述,笔者认为,出于技术成熟度、业务成熟度、队伍成熟度的考量,当前司法智能化仍然属于初期萌芽阶段,应当调整合理预期,有效集中精力,统筹资源,打好基础。在一定范围通过试点建设、联合实验室研发等方式积极稳妥推进智能辅助办案系统,不断应用法律智慧、政治智慧、科技智慧,最终形成可见效、可复制、可推广的智慧司法“中国方案”。