深度学习在智慧司法中的应用研究
2018-11-26徐雪珂
徐雪珂
摘要:为解决智慧司法建设过程中手写汉字识别、语音识别、司法聊天机器人、司法文书语义分析等复杂问题,提出将深度学习与智慧司法相结合,即运用深度学习模型来攻克智慧司法建设过程中的技术难题。主要对深度学习的发展及定义做了简要分析,总结了几种典型的深度学习模型,介绍了基于深度学习的手写汉字识别、语音识别、司法聊天机器人、司法文书语义分析在智慧司法建设中的应用。
关键词:深度学习;智慧司法;司法信息化;互联网+;神经网络
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)22-0176-03
1 前言
随着人工智能与机器学习的发展,各个领域均掀起信息化改革的浪潮,司法信息化是当前司法改革最重要举措之一,而智慧司法是司法信息化改革的核心部分。随着全国各地智慧司法的建设,手写汉字识别、语音识别、司法聊天机器人、司法文书语义分析等典型的技术问题逐渐浮现出来,且成为智慧司法建设进程中亟待解决的问题。
深度学习作为当今机器学习领域乃至计算机和互联网领域最为炙手可热的研究方向之一,自面世以来其预测的准确度就在很多方面大大超越了以前的机器学习算法,在图像处理、自然语言、音频识别等方面展现出了惊人的优势。尤其是近几年来卷积神经网络(CNN)、循环神经网络(RNN)、对抗神经网络(GAN)的出现更使得深度学习算法一路高歌猛进,得到了学术界和工业界的广泛关注。
通过深度学习和海量数据的结合将会在不同领域取得令人瞩目的成绩。本文立足于司法角度,介绍了如何运用深度学习模型解决智慧司法建设过程中典型的技术难题,从而推动司法信息化的发展。
2 深度学习的发展及定义
2.1 深度学习的发展
深度学习作为机器学习的一个分支,早在1943年W.Pitts等人就已经提出了最早的神经网络模型,并用数学方式对其进行建模。但是直到1980年之前,神经网络都没有很大发展,只能进行浅层的线性二分类,甚至无法计算异或操作。1980年,深度学习的创始人G.Hinton提出了多层感知器模型,使用多维度的隐含层来作为传统的单层感知器的替代品,从而有了一定的突破。
但机器学习在几十年的发展中,仍有很多问题未能解决。其中包括:BP算法随着神经网络层次的加深,参数优化效果无法传递到前层,从而导致容易出现局部最优解或过拟合问题[1],以及计算机尚未发展成熟,所以直到21世纪初,出现过几次神经网络热潮都很快因为其物理局限性而被迫进入冰封期。而同时代机器学习又出现了很多有效的其他算法,例如决策树、贝叶斯网络、支持向量机等很多衍生算法。可以说,以前的深度学习被给予厚望,但是只停留在人们的概念之中,直到2006年Geoffrey Hinton在著名的科学杂志上发表文章,提出了一种新的神经网络,也就是我们现最热门的“深度学习”的雏形。
笔者在对dblp数据库中对deep learning关键字进行检索后发现,深度学习相关论文在1998年到2009年间逐年小幅度增长,在10篇周围浮动,尚属于一个研究的小众领域。从2010年到2017年深度学习相关论文开始呈现几何级数增长,到2017年各类期刊杂志上的论文数量已经增长至3008篇,足以见得深度学习在研究界的火热程度。
2.2 深度学习的定义
深度学习因为涉及例如信息识别等很多相关领域,所以很难从广义上界定。相关的定义很多,这里我们采用一个比较权威的定义:
机器学习是专门研究计算机如何实现或模仿人类的学习行为,获得新技能和新知识,并且识别现有的知识,从而利用经验使自身性能不断改善提升的一门科学。[2]深度学习是机器学习的子领域,是试图通过一系列多层的非线性的变换对数据进行抽象的算法。[3]
如图1所示,图中的每一个节点被称作一个神经元,通常我们也将它称为一个感知器,每一个感知器都有一个或多个输入和输出以及其自身的权重。图中最左边我们称作输入层,输入后面的一排感知器我们称作第一层感知器,后面的也以此类推,总体称作隐藏层,最后输出的单元被称为输出层。第一层感知器每一个感知器都接受了输入的值并输出了四个结果,隐藏层第二层感知器接受了来自上一层的所有结果并将其作为自己的输入值,通過权重做出自己的输出,通过这种方式,使得每后一层都能做出比前一层更加复杂和抽象的决策,直到最后一层输出结果。
传统的机器学习算法在很大程度上依赖的是人为的建模和特征提取的函数,通过人赋予的函数来保证计算数据和预测的精确度。与传统机器学习方法不同的是, 深度学习试图自动完成数据表示和特征提取工作; 并且深度学习更强调, 通过学习过程提取出不同水平、不同维度的有效表示, 以便提高不同抽象层次上对数据的解释能力。[4]深度学习中的深度是用于将所有参数切割到不同参数空间,通过一系列的前向和反向传播函数,从前一层或后一层获取数据,逐层对其参数进行修改。而其存在的意义在于自动学习相关数据之间的内部关系,主要的方法是寻找数据的“特征”,简单地来说,就是能够在处理数据的同时,通过改变自己内部参数的方式获得更好的数据处理能力。
3几种典型的深度学习模型
深度神经模型随着研究的不断深入也产生了很多不同的模型,最近在传统机器学习需要解决问题的多项领域取得了显著成效。卷积神经网络(CNN)、生成对抗网络(GAN)和递归神经网络(RNN)特别是长期短期记忆网络(LSTM)被广泛运用,这些只需要有限的领域知识就可以达到相当的性能,并且易于同时适用于特定的应用程序。
3.1卷积神经网络(CNN)
卷积神经网络因为其有能力捕捉空间或时间结构的局部相关性,在计算机视觉和NLP任务中取得了出色的表现。最近出现的一些新技术,如 Inception module[5]、Batchnorm[6]、以及残差网[7]也使得性能更好。
3.2递归神经网络(RNN)
递归神经网络具有处理任意长度序列和捕获长期依赖性的能力,其后的LSTMs[8]是为了更好的记忆和记忆访问而设计的,它也可以避免标准递归神经网络中出现梯度爆炸或消失的问题,再后的BLSTM考虑了传统LSTM忽略的未来的上下文信息,其在手写识别、序列标注和机器翻译中展现了很好的性能。
3.3生成对抗网络(GAN)
生成对抗网络(GAN)[9]是用于学习如何生成图像的生成模型,其由一个发生器G和一个鉴别器D组成,根据博弈论进行训练。G将输入噪声向量映射到输出图像,而D预测输入图像是否是由G生成的样本,二者平衡后即可输出以假乱真的图像数据。目前,生成对抗网络是深度学习研究者最热的研究主题。
4 深度学习在智慧司法中的应用
4.1 基于深度学习的手写文书识别
随着司法体系信息化与智慧化的建设,传统的pdf、jpg、png等照片形式的文书存储格式已经不再满足当下文书存储的需要,而是要求以word文档格式进行电子版的文书存储。目前市面上的OCR转换器对手写汉字的识别率非常低,不能解决手写汉字由图片向word转换的需求。现阶段司法机构对手写文书的处理一般采用工作人员手工录入或直接将此类文书封存,不加以使用。但手写文书数量较大且种类繁多,若均采用手工录入,不仅耗费人力物力工作量大,而且出现的错误和遗漏无法进行检校;但是若不使用该类文书会造成大量关键信息的缺失,从而影响智慧司法系统的准确度。将深度学习中的文字识别技术运用于手写文书的识别,可以很好地解决此问题。
近年來,rcnn等一系列特征提取算法的出现以及近期的热点算法attention可以快捷方便地将文字识别率增加至96%以上。大部分法律文书具有固定格式框架,因此可对固定格式部分着重进行样本训练,如果将深度学习技术结合OCR技术用于法律文书的识别,将基于深度学习的手写汉字识别技术用于司法这一特定领域,只需少量的工作人员对识别后的文书进行校对即可完成对相关任务的处理,节省了工作时间,极大地降低了工作量,提高手写文书识别的准确率。
4.2 基于深度学习的语音识别
智慧司法建设中语音识别技术普遍用于语音与文字的同步转换、语音类文书关键信息提取、语音输入等方面,是衡量司法建设智能度的一大标准。在传统的法庭中,法庭上出现的每一句话都需要书记员记录下来,出现错漏等种种问题在所难免。如果在法院进行庭审时,现场收录庭审语音,并采用语音识别技术直接将庭审语音转换为电子版庭审笔录,即可省去书记员手动记录庭审笔录以及转换为电子档案的工作,还降低了出现错漏的情况。另外,在智能量刑系统中,可直接导入语音类文书进行量刑,省去了语音类文书转换的这一过程,使得量刑系统更加便捷。
目前,以科大讯飞为首的科技公司已经运用深度学习框架DFCNN将语音识别率增加到了98%,可识别方言达到23种,甚至超过了人类识别的正确度,但是国内少有将语音识别技术运用在智慧司法建设中,仅有的也只是采用很原始的算法对未经标注的语音数据进行处理,存在着识别率低、时间长等一系列问题。所以如何将目前深度学习领域现有的成果与现实场景相结合将是未来人工智能研究者很重要的发展方向。
4.3 基于深度学习的司法聊天机器人
因为传统观念的影响,在大众的心目中,法律咨询和司法进度查询一直是一个羞于启齿和困难的问题。法院因为人员问题也不能开设很多便民窗口给大众提供便捷的司法资讯服务。深度学习中自然语言方向的聊天机器人可以帮助法律部门解决这个问题。
聊天机器人是属于智慧司法建设的人工智能建设部分,其主要包括APP端、微信端、司法服务点三种形式,其主要功能为与司法相关事宜的咨询。例如,上诉流程、所需材料、法律法条咨询、量刑咨询等。类似于淘宝智能客服,使用者只需在系统中输入需要咨询的问题,系统便会自动反馈查询结果,如果咨询问题搜索不到或者过于复杂,即可接入人工服务,这样就可以随时随地进行司法咨询,极大程度的减轻了司法工作者的工作量。另一方面,有利于深化公民司法教育,通过聊天机器人获取想要了解的法律相关的内容,同时,法院方面也可以根据统计数据了解哪一方面是老百姓最需要、最紧急的要求,在方便群众的同时,提升法院的信息化水平。
4.4 基于深度学习的司法文书语义分析
司法文书语义分析是智慧司法建设过程中最常用的技术之一。在传统的量刑模式中,法官要通过读取大量卷宗,手工的完成上述工作,不仅浪费大量时间,同时还会出现很多疏漏,不够公正透明。
在智能量刑系统中,我们可以将案件起诉书、庭审笔录等相关文书进行量化,使用word2vec模型进行词嵌入,通过一系列的深度学习算法进行关键信息提取、语义分析、自动摘要等,提取出被告人及其犯罪情节,系统再根据提取出的信息与法律法规进行匹配,为量刑系统提供相关的理论依据。这样一来,每一条量刑都是通过对以前量刑结果的大量分析得出的,不仅可以减轻法官的负担和心理压力,为他们提供完备的量刑依据,同时还可以保障司法透明化,降低贪腐和暗箱操作的可能性。
5总结
深度学习与智慧司法建设的结合有着长久而深远的意义,更是进一步建设司法信息化的必经之路。各种深度学习算法的出现及其在其他领域展现出的重要作用为司法中出现的各种技术难题的解决提出了新理念、新思路、新方法,使司法向着智能化迈进了一大步。深度学习正处于不断研究发展的阶段,除上文提到的技术外,司法领域仍有很多方面可使用深度学习研究成果来节省人力物力、提升工作效率。因此,如何将深度学习成果落到实处,使其在智慧司法建设进程中发挥更大的作用是智慧司法研究者未来研究的一种重要的方向。
参考文献:
[1] 马世龙,乌尼日其其格,李小平. 大数据与深度学习综述[J]. 智能系统学报,2016,11(06):728-742.
[2] 姚丽. 基于深度学习特征提取的高校投入产出绩效评价研究[D].华南理工大学,2017.
[3] Dong Yu, Li Deng:Deep Learning and Its Applications to Signal and Information Processing [Exploratory DSP]. IEEE Signal Process. 2011, 28(1): 145-154.
[4] 奚雪峰,周国栋. 面向自然语言处理的深度学习研究[J]. 自动化学报,2016,42(10):1445-1465.
[5] Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna:Rethinking the Inception Architecture for Computer Vision, 2016: 2818-2826
[6] Sergey Ioffe, Christian Szegedy:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, 2015: 448-456
[7] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun:Deep Residual Learning for Image Recognition. CVPR 2016: 770-778
[8] Sepp Hochreiter, Jürgen Schmidhuber:Long Short-Term Memory. Neural Computation,1997, 9(8): 1735-1780.
[9] Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron C. Courville, Yoshua Bengio: Generative Adversarial Nets, 2014: 2672-2680
【通聯编辑:光文玲】