APP下载

人工智能时代的人身同一认定研究

2022-04-20超,

关键词:人身步态人脸

张 超, 吕 凯

(1.上海交通大学 马克思主义学院,上海 200240;2.天津大学 法学院,天津 300072)

物联网引发了新的科技革命,智能时代即将到来。深化司法体制综合配套改革,要善于运用互联网技术和信息化手段开展工作。大数据和人工智能技术在司法系统的应用切合了发展需要,但新兴技术的应用又需要理论的回应。大数据的相关探讨已经开始由“应用/技术导向”朝着“理论导向”转型[]。由于法律领域的特殊性,大数据在法律领域内不同细分场景中的应用表现出不同形态,其中大数据在刑事诉讼司法证明同一认定理论中的应用就是其中重要的场景。

随着司法实践的发展,同一认定理论从物证鉴定基础理论到侦查学基础理论,发展到现如今对整个司法证明活动都具有指导意义。智能时代人身同一认定技术有了质的飞越,例如基于“人脸”的人身同一认定、基于人体步态的认定、基于网络“文本”特征的认定、基于网络行为规律的认定等。新技术为人身同一认定以及司法证明注入了新的活力。

相比于传统的人身同一认定技术,智能时代的人身同一认定带有数据化、智能化的特征理论研究方面,需对新技术与人身同一认定理论的融合做出理论创新;实践发展中,存在将法律大数据视为上述技术在人身同一认定领域的平移应用的问题,技术与法律领域的融合生硬,具体表现为智能时代人身同一认定的模式总结不足。本文试图梳理两种人身同一认定的模式,充实新兴技术应用于人身同一认定的理论。

一、智能时代人身同一认定概述

同一认定是指依据客体特征判断两次或多次出现的客体是否同一客体的认识活动[2]。而人身同一认定,意为依据某些与人身不可分割的特征来判断人身是否同一的认识活动[3]。

1.智能时代人身同一认定的发展路径

人身同一认定的判断基础是与人身不可分离的特征,包括人的相貌、指纹、脚印、笔迹、DNA遗传基因等。人身同一认定的发展路径首先受研究对象即人身特征本身的内在制约,主要依据人身特征是否新产生以及产生的空间来作划分;其次,外在的技术逻辑的支配下,智能时代的人身同一认定的发展路径应依循技术发展的轨迹,而智能时代的生物技术和网络技术是最为典型的新兴技术。因此智能时代人身同一认定可分为基于人体生物特征识别数据的人身同一认定和基于网络行为数据的人身同一认定。前者是利用物理空间中人的形象特征的身份识别,后者是利用虚拟空间中人所留痕迹的人身同一认定(1)分成这两类是基于智能时代新兴技术应用于人身同一认定最为典型的两种形态,对此不应狭义理解,只要是有助于人身同一认定的其他科学技术,也可以与上述的两种分类成平行并列的逻辑关系。。

第一种是对在物理空间中业已存在的人身特征运用新兴技术进行身份识别。生物特征识别技术是其中一个范例,生物特征识别技术目的在于获取“生物特征识别数据”。2018年5月25日在欧盟各国生效的《一般数据保护法案》(General Data Protection Regulation, GDPR)第4(14)条明确了“生物特征识别数据”的定义,即通过对自然人的物理、生物或行为特征进行的特定技术处理而得到的个人数据。这类数据生成了特定自然人的唯一标识。人脸识别属于技术比较成熟,应用广泛的典型代表;步态识别属于技术尚未成熟,但应用前景广泛的典型代表[4]。二者意为结合智能视频监控以及人脸和步态识别系统,运用人脸识别和步态识别的软件算法,实现自动的身份识别。人脸识别属于依据人体的形象特征进行的同一认定,以人体的反映形象特征为依据,是物质上的反映形象,而步态识别属于依据人的生理活动习惯特征进行的同一认定,它是一种行为特征,表现为人行走时协调的、周期的姿态,是人们思想意识等各种内部控制,由身体肌肉、骨骼等协调配合执行的动作过程[5]。随着生物特征识别技术的应用,原来不易识别的特征可转化为可识别的人身特征。例如,2007年英国警方通过对数百个嫌疑人的步态分析,其中一位嫌疑人的步态和案发现场的一位胖子的步态吻合度在96%以上,可以确定二者是同一人,最终案件被破获[6]。

第二种发展路径是基于互联网技术发展在虚拟空间出现的新人身特征进行人身同一认定。网络信息技术的应用不仅使用户在使用过程中产生“网络行为数据”(主要包括用户个人在线行为活动的数据,如用户的浏览记录、交易记录、检索记录等,反映了数据文件和系统运行的特征),而且可根据cookie等互联网跟踪记录程序收集的上述网络行为数据进行身份识别[7]。例如在某刷单骗保案中,嫌疑人通过虚假购物并退货的方式骗取运费险赔付费,通过对“IP地址”、 “收货地址”和“小额支付”的交易记录的分析,最终“挖掘”出骗保金额1150余万元[8]。

2.智能时代人身同一认定的价值

从刑事司法角度看,基于生物特征识别和网络行为的数据进行人身同一认定用于打击犯罪,涉及两个方面的功效与价值:一是促进犯罪预测与预防;二是对已经存在的犯罪,从减少打击犯罪的盲区和提升打击精准度达到遏制犯罪的目的。两个功效体现的是智能时代人身同一认定有助于司法效率的提升与智能化。

第一,促进犯罪预防。各种全球性风险对人类命运共同体的生存发展提出挑战,有必要扩大犯罪预防的空间范围和提升预防的效果。进入智能时代,犯罪预防已经从以往的特殊预防转向现下的一般性预防,向前预测的范围也大大超前。预测是大数据最核心的价值之一。大数据预测思维体现为对“案”的预测和对“人”的预测。对“案”的预测是指预测某地区在未来一阶段内发生某种犯罪的概率。对“人”的预测是指对高危犯罪分子进行的预测[9]。前者应当是犯罪的宏观预测,后者为犯罪的微观预测。高科技手段可能在立案之前就得到应用,或者办案机关得到重大犯罪即将发生的情报消息,立案之前即采用高科技手段来收集证据和获得犯罪以及犯罪人信息[10]。智能时代的人身同一认定是建立在大样本基础之上,生物识别信息和网络行为数据对个人隐私的干涉也较以往的各类数据和信息有更深的影响,原因在于可追溯到特定人,进行特殊预防的效果极佳。同时算法的灵活性可以进行较为精确的一般性预防。

第二,减少打击犯罪的盲区与提升打击精度。一是公共区域和网络虚拟空间犯罪盲区的减少。公安部门的“天眼系统”的构建使得大街小巷遍布智能摄像头,使得打击违法犯罪活动能够延伸至以往的监控盲区。例如 2015 年重庆市渝中区“民心天网”工程共安装 10687 个监控摄像头,实现辖区监控视频全覆盖。入室盗窃或者诈骗等危害公民财产案件常常发生在监控盲区,造成破案的困难,以往受限于技术条件的限制,犯罪打击面常常有所空白之处,但是基于人体的面部、步态特征的人身同一认定使得发生在监控盲区或者死角的犯罪逃脱打击的现象正逐渐消失。互联网每天的信息量呈现爆炸式堆积,基于海量的网络行为数据的人身同一认定是网络空间进行同一认定的关键环节。基于海量的网络行为数据有助于涉众型犯罪案件的侦破。在涉众型案件中往往存在犯罪组织,犯罪组织内部存在精细分工,不同涉案人员扮演着不同角色,需要将不同涉案人员的身份和相应的犯罪事实相对应,此时根据上传到银行系统的资金流数据或者其他网络平台的交流信息等可以揭示犯罪人身份。2015 年,公安部会同国家税务总局、人民银行用 8 个月时间查处了一起虚开增值税专用发票案件。办案人员收集到 10 多亿资金流水,利用模型分析虚开公司资金流向,清楚地将涉案公司分为开票公司、收票公司、中转公司三层,根据资金流向区分出会员单位、二级单位等,绘制出资金流的闭环关系。公司层级和会员关系,就揭示出涉案单位和人员的具体角色[11]。二是打击精准度提升。伴随着犯罪打击面的扩大化的是犯罪打击精准度的提升。人脸识别技术和步态技术可以帮助警方在海量图像信息中精确甄别、迅速检索, 实现了快速高效锁定嫌疑人。2016 年 11 月,上海市公安局通过大数据对比分析, 通过视频监控进行人脸识别,能够精确锁定犯罪嫌疑人的住所,上海市当月刑事案件同比下降 21.1%(2)新闻晨报.11月以来两抢盗窃诈骗案同比下降[EB/OL].http://sh.people.com.cn/n2/2016/1225/c134768-29510101.html,2020-05-08.。

第三,提升司法效率与智能化水平。不论是基于生物识别信息还是基于网络行为数据进行人身同一认定,都离不开算法。算法意味着用系统的方法解决问题,要求在有限时间内获得输出结果, 这就减少了横向的每一个同一认定或种类认定所需要耗费的时间,使得同一认定链条上每一个节点都能够经得起合理推敲,即每一个阶段都能够达到同一认定所需要的特征组合的特定性、稳定性和反映性,司法效率因此能够得以提升。比如银行发生的案件,往往要从长达几十天的监控录像中寻找可疑人员,造成人力的巨大浪费。而人脸识别智能监控通过存储检索以及内容匹配等智能化手段, 让监控真正智能化,从而大大提高案件侦破的效率[9]。针对社会危害性较小的犯罪,能够及时运用算法分析输入结果,在有限个步骤之后终止运算,得出分析结果,辅助办案人员得出结果。让办案的精力能够更多投于重大财产类和人身类犯罪,有助于合理分配司法资源,使司法办案智能化。例如 2020年重庆市渝中区某派出所通过“民心天网”系统调取视频录像仅耗费了2个小时即破获了一起连环扒窃案。

二、智能时代人身同一认定的模式

智能时代人身同一认定的模式可分为三步:扩大数据来源,构建身份识别模型,在具体应用中进行特征匹配。第一步,智能时代人身同一认定扩大受审查客体的特征反映体的范围,即在受审查客体的数据来源方面呈现数据规模海量性的特征,受审查客体及其特征反映体可以精确地被分析和使用。具体表现为利用生物特征和网络行为数据进行人身同一认定时,需要建立相应的数据库,整合归纳所提取到的人脸、步态数据和网络行为数据;第二步,根据生物特征和网络行为数据自身的特点进行身份识别模型构建;第三步,结合法律专家的经验知识进行特征匹配。

1.基于生物特征识别数据的人身同一认定

(1) 人脸和步态数据库的建立 生物特征识别数据所涉范围极广,建立指纹、DNA遗传基因纹数据库,并以此为依据进行人身同一认定在十几年前已经在公安系统中广泛应用,并成为侦破案件的利器(3)截至2011年底,全国指纹系统捺印指纹库容量已超过9000万份,并以每年20%的速度增长,年侦破案件达11万起。同时全国“打拐”DNA数据库于2009年4月30日建成,至2009年5月底前,全国公安机关已有的236个DNA实验室将全部联网运行,实现技术资源和数据资源共享。要求一线公安机关对群众报告儿童失踪、被拐卖的,都必须立即立案,组织查找和侦查调查工作,同时做好采血工作。。相比较于传统生物特征识别数据库的建立,人脸和步态数据库的建立具有非接触性和全天候采集两个新特点。

第一,人脸和步态数据采集具有非接触性的特点,弱化了人的配合程度。利用远程监控摄像机对人脸和步态数据进行采集,避免了和人的直接接触,不需要人的主动配合,只要被采集信息的人出现在智能视频监控所及的范围即可。采集过程自然,促进了采集效率的提升。人脸采集只需要监控摄像头抓取到一张符合条件的人脸面相,步态采集也仅需要人的步态序列,即步态识别的输入是一段行走的连续视频图像序列。美国“9.11”事件以后,国际社会反恐形势异常严峻,加强机场、火车站和汽车站等重点场所的安全监测,利用人脸和步态数据的快速采集,能够提升公共场所的安保能力。

第二,人脸和步态数据采集具有全天候采集的特点。一个监控摄像头便可以清晰记录下某个区域每天24小时所经过的人群,实现时时采集人脸和步态等生物特征识别数据的目的。

(2) 人脸和步态特征数据的提取与匹配识别 一是人脸图像和步态特征提取。首先,先检验被寻找客体的人脸或步态特征,后检验受审查客体的人脸或步态特征。因为被寻找客体具有不可选择性,先了解被寻找客体的人脸或步态特征能够使得有目标和有选择地考察受审查客体人脸或步态特征,避免检验的盲目性和检验时间与人力物力的浪费。这实际上是侦查活动由果溯因的回溯性思维的体现,即通过已经发生过的事实存留下的人脸或步态数据,寻找符合条件的受审查客体的特征反映体,进而还原出事实真相。其次,受审查客体范围大。人脸识别和步态识别中,特征提取涉及到的数据往往达到“TB”甚至是“PB”的海量级别,数据海量性导致其无法被适用于传统的人工分析[12],突破了人工分析所能够承受的极限。

二是人脸图像和步态匹配与识别。将提取的人脸图像和步态的特征数据与数据库中存储的特征模板进行搜索匹配,按照先一般后细节的比较顺序。如果在比较一般特征时发现了本质的差异,即可得出输出否定的同一认定结果。例如,被寻找客体是圆脸,而受审查客体是方脸,一般情况下即可做出否定的同一认定结果,因为脸型由圆变方的变化是极小事件。如果比较某个一般特征时未发现本质的差异或者根据被寻找客体和受审查客体的差异不能够直接得出否定的同一认定结果时,对每一个特征符合点进行价值评判,在此基础上评断这些符合点的总和是否构成特定性。评判该特征复合点的价值,以该特征的出现率为特征。一般来说,一个特征的出现率越高,其价值越低;而出现率越低,则价值越高。

通过算法对其事先设置得分或者得出一个受审查客体与数据中已有的人脸和步态数据相似的概率,并设定一个阈值(相似度),如果将阈值设置为A,人脸图像和步态匹配与识别后有存在输出结果和不存在符合条件的输出结果两种情况。第一,存在一个或多个相似度大于A的输出结果;第二,所有受审查客体与被寻找客体的相似度都低于A,没有输出结果。

图1 人脸图像与步态匹配与识别流程

第一种情况,即便以相似概率判断人身是否同一不能达到100%的精确度,但是仍然具有较高的相似度(4)全国人脸识别算法测试FRVT2006的最好成绩是正确识别率为99%、FRVT2010的最好成绩是正确识别率为99.7%。,通过挑选出概率大于某一阈值的所有输出结果,缩小犯罪侦查时的搜寻范围,再借助专家的经验知识,结合事件同一认定中的案件事实要素进行综合判断,以具体的事件要素分析具体的人身同一认定,使得可以得出确定的人身同一认定判断。

第二种情况,在没有输出结果的情况下需要以降低阈值的方式扩大侦查范围,降低阈值后得到的输出结果为人身同一认定提供数据支持和线索,而后通过专家鉴定进行身份确认,实现声像线索到证据的转换[13]。

2.基于网络行为数据的人身同一认定

(1) 网络行为数据的共享性 第一,网络行为数据的共享性体现在数据来源渠道广泛。传统的指纹、DNA遗传基因数据库和新兴的人脸和步态数据库的建立往往采取侦查机关主导,技术部门参与的形式建成,最终数据库的归属于国家,数据采集由公安部门进行,得到的数据也不对外公布,进行严格保密。在大数据时代,一些大型网络平台依托其庞大的网络生态体系和业务链,掌握着海量公民个人数据,可能隐藏着犯罪线索和痕迹[9]。网络平台不论大小,都存有用户的网络行为数据,使得这些数据具有分散性、权属部门多,同时又依靠网络拓扑空间紧密联系等特点。在侦查活动中,这些平台的数据共同构成了网络行为的数据库。

第二,网络行为数据的共享性体现在网络服务商有配合侦查机关取证的信息披露义务。一是对其已经控制的静态数据进行披露,二是通过固定或者追踪动态数据进行披露[14]。网络服务商基于营业目的或者提供服务需要会留存用户的网络行为数据(5)《电子商务法》第18条规定电子商务经营者在不提供针对消费者个人特征的选项时可以根据消费者商品或者服务的搜索结果进行消费者的大数据画像。,挖掘网络行为数据的商业价值,然而这种以商业利益为导向的数据留存具有任意性和短期性等特征,难以达到侦查案件的要求,所以基于法律规定或指令的强制留存应运而生。

(2) 网络数据的行为建模 行为建模的依据是个案中具体违法犯罪行为所遗留的特征信息,基于这种特征信息的大数据计算结果就能够从一定程度反映具体行为与相应数据(行为后果、行为情节)之间的因果性[8]。网络行为数据是用户在网络虚拟空间活动留下的痕迹,在基于网络行为数据进行人身同一认定时,围绕网络空间的违法犯罪行为进行信息搜集,并能够还原出特定人在网络空间从事了某种违法犯罪活动的整个流程,这就是网络行为数据的行为建模。

图2 基于网络行为数据的横向同一认定

基于行为人在网络空间留下的信息进行人身同一认定必然要对网络行为数据的种类进行分类,以便为信息搜集阶段指明方向。网络犯罪公约委员会将网络犯罪侦查过程中所需的特征信息概括成三种类型,即注册人信息(subscriber information)、交互信息(traffic data)以及内容信息(content data)(6)注册人信息是指单位或个人在获取网络服务时向服务商提交的,或者在使用服务过程中显示的与个人身份信息相关的信息;交互信息是指基于计算机系统进行交流产生的,任何用以表明该交流的起始位置、路径、时间、日期、体量、时长或类型的数据;内容信息是指某项沟通交流行为所传递的实质内容。。通过对这三类信息的质量与数量进行分析,注册人信息表明用户的个人信息,交互信息表明用户设备的运行轨迹,内容信息表明一具体事件的内容。这三项同一认定或衔接或并列,保障在逆向回溯过程中每个横向的静态阶段都能达到同一认定的条件。

以上三类信息综合起来就是特定用户在特定设备上干了特定的事,留下了特定的网络行为数据,环环相扣共同构成了案件侦破工作中的同一认定链条,呈纵向递进式动态发展形态,这一链条的终点就是人事同一认定[15]。纵向同一认定是建立在三类信息横向的同一认定的坚实可靠的基础上,勾勒出数据人模型,进行数据画像,犯罪嫌疑人会成为大数据下的“透明人”[16]。

三、智能时代人身同一认定的风险

1.人身同一认定的准确度存有缺陷

(1)统计概率的非理性 运用生物特征识别技术,以概率来判断人身是否同一将会面临合理性与科学性的质疑。统计数据或数量上的可能性只是针对某类事物的一般描述,不能成为认定个人的具体事实。如果审判者仅仅依据统计数据,宣布某人的罪行成立,就违背了罪责自负原则。在证明过程中,统计数据不能单独成为确定案情真实的依据,必须与具体的案件证据相配合[9]。即便将阈值设置为98%或者99%,仍有2%或者1%的概率出错,而司法活动关系公民的人身和财产权利,容错率极低,也与让公民在每一个司法案件中感受到公平正义的价值追求背道而驰;同时,阈值低于设置标准的受审查客体也不能排除它可能就是被寻找客体的情况,人脸特征和步态特征的提取因为光线、外形、装饰等外界因素和人的情绪、整容、刻意训练等自身主动改变都会发生或大或小的变化,从而导致识别的准确率降低。出现上述两种情况的原因在于统计概率反映的是相关关系,即人脸数据和步态数据两类数据进行人身同一认定存在统计上的可能性,而司法证明强调的具体的因果关系。故仅凭借算法得出的统计概率判断人身是否同一不符合司法证明的理性标准。

即便是在统计概率可大显身手的犯罪预防阶段,识别错误也难以避免。美国的“可疑活动报告系统”(The Suspicious Activity Reporting, SAR)尽管识别了16万多名犯罪嫌疑人,但警方最终只对其中的103人展开了刑事调查,这其中仅有5人被逮捕,而且无人被判处有罪[10]。

(2)特征价值权重概念缺失 结合司法证明领域的特殊性需求,结合法律专家经验知识,使得生物特征识别技术在人身同一认定中能够从相关关系转化为因果关系。然而,这种转化存在缺失特征价值权重概念而相关关系较弱,造成转化为因果关系时说理性不强,进而导致运用生物特征识别技术进行人身同一认定时准确度存有缺陷。特征价值权重,意为人脸或步态中的不同特征在进行人身同一认定时所发挥的作用大小,在算法中通过赋分或者计算相似概率时进行体现。特征价值权重概念缺失的表现是各种人脸或步态识别技术对于同一性特征所赋权重不一,导致输出结果存在差异,也与司法证明强调同一性标准相矛盾。同一输入材料得到不同的输出结果,削弱了相关关系。问题的症结本质上在于特征分类、特征价值的评估原则和评估方法等人身同一认定领域的概念、定义、原理、理论与活动的知识未在法律大数据开发过程中正确体现。

2.算法风险

基于生物特征和网络行为数据的人身识别,需要通过算法对两类海量数据进行建模分析,然而算法的不透明性增加了人们对于机器算法准确性的疑虑,不仅如此,算法的固有缺陷、人为歧视以及算法的恶意性导致了人们对其的不信任。

(1)算法的不透明性 算法是一种黑箱运作机制,犹如一个未知的“黑箱”,用户并不清楚算法的目标和意图,也无从获悉算法设计者、实际控制者以及机器生成内容的责任归属等信息,更谈不上对其进行评判和监督。

基于生物特征和网络行为数据的人身同一认定结论在法庭质证阶段,质证方因为商业秘密保护或者国家安全等原因无法直接接触到这些数据。加之专业技术的限制,无法对开示过的算法进行质证。公民担忧用于人身同一认定的算法将性别、种族等差异也考虑在内,不透明性加剧了这种疑虑。在State v. Loomis一案中,一位名叫卢米斯(Eric Loomis)的犯罪嫌疑人被COMPS(Correctional Offender Management Profiling for Alternative Sanctions)算法判定为“累犯风险较高”。而该算法所依据的是罪犯的各项生理特征和社会背景,其中便包括了性别[17]。

(2)算法的固有缺陷与人为歧视 算法的固有缺陷是由于机器深度学习时导致了难以预测的消极后果。在识别算法训练阶段,输入的人脸和步态数据各类样本数量多,算法的匹配识别也就更接近真实情况;反之,如果某类数量少,此类误差也就更大。识别算法的准确度与输入算法的人脸和步态数量和多元性成正比。MIT对于微软、Facebook、IBM等公司人脸识别系统的研究表明,系统在检测肤色较深的女性时,出错率要比检测肤色较浅的男性高出35%[18]。算法的固有缺陷导致了结论的偏见。

正因为算法的不透明性导致的信息不对称和不公开,使得一些歧视性的算法在应用时让人无法得知。算法歧视是人工智能自动化决策中,由数据分析导致的对特定群体的、系统的、可重复的、不公正对待[19]。当设计者人为地将对被识别者的性别、种族、职业、收入等方面的歧视延伸到算法时,这种隐藏于的歧视很难被发现,进而导致人身同一认定的歧视[20]。

(3)算法的恶意性 在人身同一认定领域,既可以产生有助于身份识别的算法,同时也存在利用技术缺陷的恶意性算法。对公民的生物特征和网络行为数据不分场合地加以应用,可能造成某种违法犯罪的目的。“深度伪造”(Deepfakes)技术开源两年后,黑产链已经步入成熟期,不仅提供色情片换脸和恶意欺诈视频制作的教学与定制服务,还积极“攻坚”金融类刷脸程序[21]。2017年,一位名叫“deepfakes”的外国网友就利用AI技术,将DC超级英雄电影《神奇女侠》扮演者盖尔·加朵、《哈利波特》主演“赫敏”的艾玛·沃森等明星的脸,“移花接木”到了色情片女主角身上,一度掀起轩然大波(7)周舟,方正.你“ZAO”换脸吗?新华社https://baijiahao.baidu.com/s?id=1644006114156968372&wfr=spider&for=pc,2019-09-07.。

3.个人信息侵犯

(1)被采集者的知情同意权无法确保 人脸识别技术和人体步态技术采集公民的脸部和步态特征时具有隔空捕捉信息的非接触性特点;同时,通过网络爬虫技术和Cookie技术获取用户的网络行为数据,也弱化了用户的配合程度。正因为如此,两类数据的获取都可轻易绕开信息被采集者的知情同意权,后续对于采集得到的数据进行使用、加工、流转和删除也脱离了信息被采集者的控制。

(2)信息采集泛化 人脸和步态数据以及网络行为数据的采集呈现泛化的趋势。商场、地铁站、火车站、机场、小区门禁等广泛使用人脸识别技术和人体步态技术,甚至为了规范游客使用厕纸,北京天坛公园使用“人脸识别厕纸机”,识别人脸后,自动出纸[22]。可见,人脸和步态数据的采集已经超过了合理限度。当前密布在城市社区、街道各个角落的摄像头形成了一张大网,除了记录各种犯罪行为和犯罪现象,也不可避免将公民在公共场所的行为置于24小时监控之下。为了精准打击犯罪,对公共场所进行全天候的监控在情理之中,并且公民有必要让渡在公共区域自己的行为信息供司法证明之用,但是其让渡或者被干涉的信息边界非常模糊,造成了个人信息不必要的泄露。

在网络空间网络行为数据的采集隐藏在技术的外衣下更具有隐秘性,导致了网络行为数据采集也呈现了过度的现象。例如可以实现网站对登录ID、使用偏好、习惯收集的Flash Cookie技术的储存位置对于普通人而言更难发现[15]。

(3)信息泄露后果严重 生物识别信息和网络行为的数据库中都包含着海量的个人信息,导致一旦泄露便会发生难以预测的后果。这些数据的流转可能被用于监视等违法犯罪活动。不仅如此,当数据大到一定程度,部分企业为了识别通过率而伪造误读率,黑客通过篡改数据库中的人脸模板而使得算法在正常运作下输出错误信息等,进而会危害国家安全、经济安全、信息安全和人身安全[21]。

四、智能时代人身同一认定的风险应对

1.提升人身同一认定的准确度

在人脸图像与步态匹配与识别中,先通过算法运算得出输出结果,再经过专家的经验知识即可得出肯定或否定的人身同一认定。从上述人身同一认定的两个步骤出发,可从重视法律专家的经验知识、引入特征价值权重概念以及融合应用多种生物特征识别技术三方面提升人身同一认定的准确度。

(1)重视法律专家的经验知识 智能时代,过度的迷信大数据技术,轻视法律专家的经验知识的主导作用,是法律在技术应用的司法特定领域话语权缺失的结果,不仅造成了人身同一认定结果的理性缺失和说理性不足的后果,而且也失去了校正和补足技术输出结果的机会。人工智能技术从海量数据提炼出的知识并不会取代人类理性,而是更应与事实认定者的主观理性和经验产生互补。计算智能更多的是与人类理性相互支持,而不是取代与被取代的零和关系[23]。重视法律专家的经验知识,将自动识别中人体检测和特征提取阶段引起的信息丢失的缺陷再由法律专家予以校正与补足,不但能最大限度地保存检材原有特征,还能根据不同的条件进行相应调整[7]。使得技术由法律专家主导,充分发挥人脸识别技术和步态技术对人身同一认定的辅助作用。

(2)引入特征价值权重概念 为得到更加精确的人身同一认定技术上的输出结果,需将抽象的特征符合点的价值量化为具体的数量,可以通过引入特征权重价值概念,结合法律专家和技术人才的共同努力来实现这一目的。

特征可以分为稀有形态特征和常见形态特征、稳定特征与不稳定特征、细节形态特征与轮廓形态特征、整体形态特征和局部形态特征、组合形态特征和个体形态特征等几种类型。一般地,几种分类前者的特征价值权重要高于后者[11]。一方面,在赋权时可以给前者设置一个基础值,其大小可根据这一类特征单独或者结合其它特征进行身份识别的作用大小进行设定。实践层面应当以法律专家为主导,对不同特征的权重大小进行排序,初步设定,然后通过算法检验准确度。不断进行修正,使得基础值的设置具有更高的科学性。

另一方面,根据特征的可辨认程度设置百分比形式的可识别度。某一类特征在具体案情中会因为时间流逝、受到破坏污染等因素导致可识别性下降,此时就需要对特征的可辨认程度进行修正。例如,某一特征的基础特征价值权重为x,但是可识别度只有80%,那么该特征的价值权重为x·80%。

(3)融合应用多种生物特征识别技术 人在识别他人时,会综合他人的多种生物特征进行判断;同理,在人身同一认定时,可综合人的多种生物特征,融合应用多种生物特征识别技术。不仅应用本文已经提及过的人脸识别和步态识别等新兴技术,传统的指纹、虹膜识别技术也应包含在内。当某一种识别技术的阈值过低时可以参照其他识别技术进行补强,如此便具有特征变化适应性强,安全性和可靠性高等优点。

2.算法规制

(1)增强算法可解释性 算法的不透明性并不必然导致所得的输出结果不准确,也不必然导致其证明力的降低或丧失。例如,人们不会因为不了解技术原理而否认各种基于GPS、基站、IP地址的轨迹分析报告的证据价值。即便公开算法的源代码,冗长的代码检测也不现实[11]。问题的根源并不浮于算法不透明的表面,实际上算法不透明造成的是算法的可解释性差。大多为技术外行的司法人员因为技术壁垒无法对专业技术作出有力的法律解释,故需要加强算法可解释性。大数据分析是一种基于全量数据的解释方法[25],然而大数据分析在司法特定领域必须转化为法律解释。可从法庭质证阶段的算法开示使得算法可解释性增强。

首先,要向法庭说明在进行人身同一认定时所选取对比的初始范围,在一定范围内进行人身同一认定,这是运用排除法确定犯罪嫌疑人的第一步。其次,要进一步通过直接排除法和间接排除法来缩小范围,在这个过程中必然要涉及到对横向小的同一认定或者种类认定进行双方的质证,对于其中涉及到算法的原理部分,控辩双方可以借助专家辅助人的经验知识。《最高人民法院关于适用<中华人民共和国刑事诉讼法>的解释》第一百条第一款规定:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。”这为对于人身同一认定时的算法检验途径指明了方向。

(2)综合应用技术审查和伦理审查 针对算法的固有缺陷和人为歧视无法从法律视角进行发现、分析和解读的问题,需要在算法设计完成的产品检测阶段对算法是否具有固有缺陷进行技术审查,对是否存在人为歧视进行伦理审查。技术审查应从算法操作的全过程即数据输入阶段、数据分析阶段和数据输出阶段三方面设置技术标准。第一,在数据输入阶段,不仅应当保证采集的人脸、步态数据和网络行为数据质量,而且需要注意从各类人群采集得到的人脸和步态数据量上的均衡;同时采集网络行为数据时,注册人信息、交互信息和内容信息也要保持量上的均衡。第二,在数据分析阶段,在特定测试环境中检验人身同一认定算法的运行效果。此项工作可以由具有专门资质的第三方机构完成。在当前实践中的一种技术方案是,由法庭组织司法鉴定机构或行业组织的专业人员进行黑箱测试。在测试时,把软件程序看作一个不能打开的黑盒子,在完全不考虑其内部结构和内部特性的情况下,在软件程序接口进行测试[18]31。保证识别算法的中立性与准确性,避免分类时遗漏重要的相关变量。第三数据输出阶段,根据技术发展水平,尽可能在输出结果的同时,同步输出各项自变量及其特征价值权重,乃至对人身同一认定的算法做出解释,以便算法使用者更好地判断该算法的风险[24]。

在伦理审查方面,人身同一认定的算法的设计者和拥有者应当向有资质的法律专家和技术专家组成的小组解释说明可能出现的伦理风险及其应对策略,并做好相应地备案。

(3)规制恶意算法 恶意算法是人为地利用机器算法的深度学习来对算法的准确度进行强烈干扰,增大了公民对深度学习算法的不可预测性的恐惧与担忧,扰乱了现有的技术秩序。规制恶意算法首先是如何准确识别恶意算法。从算法的对象——数据来看,数据的输入必然存在源头,对源头进行准确识别是探讨识别恶意算法的有效路径。算法针对大量数据,小量的干扰并不会对算法准确度造成很大的偏差,设置预警系统可应对大量无效数据的入侵。例如,针对某一或多个用户连续、多次、重复地进行上传不良数据的行为,可以采取将这些用户在一定时间内拉入数据输入的“黑名单”的限制措施。在技术层面,算法设计者可以通过不断地提前演练来提升算法的抗干扰性和准确度;在法律层面,需要完善现有的法律法规对恶意算法进行规制。现阶段针对人脸识别、步态识别和网络行为数据的应用风险的法律规制体系尚不够完善。以人脸识别为例,仅仅发布了围绕刑事侦查、证件管理和公共安全防护等公安业务展开的《公共安全人脸识别应用图像技术要求》[18]。

第一,通过现存的有关公民个人信息安全和网络空间安全的法律进行规制。恶意算法本身属于技术问题,在主观恶性不大的情况下运用技术审查部门责令限期改正即可达到预防和规制的目的。如果主观恶性过大和消极后果严重,造成了公民个人信息的恶意散播和利用,强烈威胁网络空间安全,那么可利用刑法的有关公民个人信息安全和计算机安全犯罪条文加以规制。

第二,建立相应的算法法规,对相关算法的设计者和拥有者进行责任捆绑。同时应考虑到鼓励技术创新,当算法出现了恶意性并造成严重后果时,算法的设计者和拥有者就要承担民事责任或刑事责任,但可以通过以下两种途径免除:①算法的设计者和拥有者举证已经做到相应的技术规范审查,并采取及时的措施消除恶意算法带来的负面影响;②技术的发展产生的不可预知的风险或不可预知的标准,可以法律、技术、伦理等领域的专家进行风险评估与紧急方案的制定。

3.加强个人信息和数据的安全保护

(1)保障被采集者的知情权 采集信息之前,需征得被采集知情同意,可作为人脸、步态数据和网络行为数据采集的先行原则。要告知被采集者采集信息和数据的范围、使用方式和使用目的。在进行数据流转时仍要被采集者的知情同意。

现下在各大网站或手机的APP在个人信息采集之前通过隐私条款征得用户同意,然而人脸和步态数据的采集任意性却太大。人脸和步态数据的采集具有非接触性的特点,所以征得被采集者的知情同意在操作上存在难题,可采取事后删除和“隐私政策”的方式来保障被采集者的知情权。国家机关处于安全防控的需要采集人脸和步态数据时,公民有配合国家机关进行安全防控的义务,故在公共区域采取明显通知告示或者语音广播的形式即可达到告知的目的。然而,对于企业、小区物管搜集人脸和步态数据时需要通过明示告知的形式,如果被采集者拒绝被采集人脸和步态数据,应当及时删除。还有一种可行策略是信息与软件进行分离,即信息的采集与信息的应用实行严格分离,当生物特征与网络行为数据被采集者收集储存在载体以后,对后续的应用时间与方式需要经得政府专业管理部门的审查与同意。

除此之外,需要加强对信息采集企业、机构、组织的资质的常态化审查。一方面,政府部门应定期对信息采集的程序是否合规进行审查;另一方面,信息采集的企业、机构、组织要定期向政府部门进行信息采集的备案,从数据来源、数据量大小、安全性评估、危险结果预测与应对方案等方面进行备案。

(2)信息采集的比例原则 国家对于公民权利的任何限制措施都应当遵循比例原则。针对信息采集泛化的乱象,在信息采集时同样适用这一原则。比例原则是指公权力在依法限制公民基本权利时,用于衡量合法限制措施的必要性和充分性的一组规则[25]。这一原则的核心是要以最小程度地侵害公民权利,采取合理手段达到正当目的。针对人脸、步态数据和网络行为数据的不同类型,可侵害程度会有显著差异。如前所述,网络行为数据可分为三种类型,但仍有必要进一步细化,赋予每种细分小类不同的信息价值权重,信息价值权重越高,那么采集时的程序也应更加严格。

(3)规范信息的使用流程 针对人体生物特征识别数据,可以借助欧盟的经验,严格限定人体生物特征识别数据的使用范围,除法律规定的例外情况之外禁止出售。从生物特征识别信息的存储和销毁等方面进行程序规制,其中应该特别规定生物识别信息的销毁时间,不仅是因为生物识别信息更迭较快,更是因为如果任由科研机构和政府机关长期持有公民的生物识别信息,就像一个随时可能发生爆炸的“火药库”,要及时清理以达到消除隐患的目的。例如,美国伊利诺伊州颁布的《生物信息隐私法案》规定,当企业收集数据的目的已达到或距信息主体与企业最后一次联络已满3年时(以先发生者为准),应当销毁生物特征识别数据[26]。

四、结 语

当前,大数据与人工智能技术的应用方兴未艾。新兴技术的应用是生产力急剧发展的产物,将新兴技术用于社会治理终极目的还是为了人类更和谐稳定美好的生活。人身同一认定的需要新兴技术,法律人的作用在于清晰界定新技术条件下人身同一认定的模式,以法律人特有的专业知识敏锐地挖掘出其中的风险,并且直面安全保障和个人信息保护法益的冲突,使看似矛盾的法益能够相互融合。二者并非非此即彼的利益衡量问题,而是如何共生共存的利益协调问题[27]。本文基于上述背景,研究了新兴技术应用于人身同一认定所引发的法律问题。研究认为,新兴技术应用于人身同一认定可能引发精准度的缺陷,算法风险以及个人信息被侵犯等三类风险。文章提出了相应的风险应对办法:一是要重视法律专家的经验知识、引入特征价值权重概念、融合应用多种生物特征识别技术等方面提升人身同一认定的准确度;二是要增强算法的可解释性、结合应用技术审查和伦理审查以及规制恶意算法;三是要保障被采集者的知情权、遵循信息采集的比例原则、规范信息的使用流程等方面加强个人信息和数据安全保护。

智能技术应用下的人身同一认定突出了人的主体地位,人是技术发展的边界。在“人身”“人与技术”的表述中已隐含了人类中心主义的前提,人与技术等对象物的互相作用使得“人”的主体性更加突出。而这也是技术发展的人文“止”境,即智能技术的发展的界限和评估者都是人类。同时,法律与技术的融合呈现出新的趋势,如何使得技术更好融合于法律领域,真正能体现“具体法律问题具体分析”将值得继续探索。

猜你喜欢

人身步态人脸
基于步态参数分析的老年跌倒人群步态特征研究
特别策划《步态分析研究综述》
有特点的人脸
玻璃窗上的人脸
雄黄酒
步态识人
余数
“领家系”可爱脸VS“高冷系”美人脸
余数
一起跳