警务大数据分析中的伦理风险及其控制*
2019-12-15张舒冰马希鹏王泽婷
张舒冰 马希鹏 王泽婷
江苏警官学院,江苏 南京 210012
2019年回顾,大数据已然在这个信息爆炸的时代以数字形式为许多行业注入了新的活力,这些行业亦开始了哈佛大学社会学教授加里·金所谓的“量化进程”。公安作为国家与社会安全保卫的重要行业,经过多年的积累掌握着海量信息,在这股大数据的浪潮中建设“智慧公安”的行动已经在全国范围内展开。
一、警务大数据分析中的伦理风险内涵及其表现形态
关于伦理风险的产生,有学者称“技术伦理风险主要缘于对技术理性的盲目扩张,致使技术主体过分把科学技术社会化,从而与价值理性产生了严重断裂。”[1]张彦教授将“伦理风险”定义为“道德选择的不确定性引起的可能的危害或损失。[2]在其《价值排序与伦理风险》一书中提出了一种以“伦理风险”为研究进路的方式,“伦理风险”范畴改变了传统的线形的思维模式,为摸索大数据发展之漏洞提供另一维度的思路。[3]由此启发,笔者以为,伦理风险更多的是在讨论操纵和搬运大数据背后的“人为”因素注入技术理性而产生的不良反应。对于警务大数据的运用过程中,伦理风险主要有以下三种表现形态:
(一)数据警务对个人信息权的冲击
从最新《民法总则》增设的对个人信息保护内容来看,出于更好地保护我国公民的隐私权,从立法层面在私法体系中肯定个人信息权。[4]公安机关强制或无形采集信息本身存在人权与公共利益的交换与妥协,但警务人员泄露信息的问题已经不再新鲜,甚至一度成为私人利器。这种数据—人的控制模式造成了数据警务理性的缺失,在笔者与户籍民警的采访交流中,据透露行业内确有因私诸如搜索个人开房记录,调查家庭背景等等现象。
(二)数据警务真实性存疑可能性
互联网海量信息数据中存在不少数据难辨真伪,影响各行业判断与决策,警务数据也并不乐观。警务大数据的收集、处理过程中,同样存在人为的失范问题引发风险之流。从主观故意的角度看,部分警务人员出于私交或利益驱使非法修改或者伪造数据录入或传播;从非主观故意的角度看,亦存在由于数据管理不当、数据源本身的固化认识等造成数据错误的可能性。通过走访与交流,笔者就了解到生活中,存在着如:警务平台的信息与户籍信息不同影响办证、警方重点管控人员信息登记错误误录入前科记录影响个人社会评价等情况。
(三)数据警务实现的困境
警务数据差异问题。国内学者对大数据技术的伦理风险普遍考虑到“数据鸿沟”——国与国之间数据霸权,同样在警务大数据的建设中也存在数据“鸿沟”问题。但笔者认为这更倾向于一种数据差异,虽然同样是竞争带来的风险,一个是客观使然,另一个则是人为主观的结果。大数据技术研发以及后期数据的整合需要资金与技术的投入,我国国内各地区发展参差不齐。由此带来一个问题即是智慧警务的建设往往形成“分块运动”,以省为单位或者例如京津冀带动周边省份协同发展之类的模式,无法形成全国统一联网的形式将数据物尽其用,而仍然呈现“数据孤岛”的状况。此外,公安机关内部各部门分立,各自掌握不同的信息都可以形成一种“数据孤岛”,这一伦理风险出于个人或集体的利益对抗而不利于数据的统一调度和整合。
二、警务大数据伦理风险产生的原因
关于警务大数据伦理风险产生的原因,笔者认为可以从主体发端、技术原因和制度背景三方面展开讨论:
(一)主体角度:主体的复杂性
笔者以为伦理风险之所以存在最大的因素即是存在“人”这一不确定因素,警务大数据从采集、处理到存储、运用的过程中一共有四方主体可能参与其中:警方、数据公司、服务平台、个人。在前我们不断讨论到警方内部与外部的难题导致风险的出现,但是往往容易忽略相对的数据源:与警方合作的数据公司、服务平台以及个人各个环节都可能出现差错与人为导向。鲍晓燕认为“从目前警务实践来看,由于法律依据的缺失以及行业壁垒等客观因素的限制,我们对来自社会其他行业、领域的社会信息资源占有量并不乐观,还远不足以构成对社会面的全面覆盖。”[5]正如张彦教授所述“伦理更多的是从行为者整体的角度来指称”,各个平台、企业本身就是“行为者整体”,其内部有着自己的“感性”决策,最终影响着数据获取的速度、数据的质量与数据的保护。
(二)客观技术原因:“信息人”偏见
“信息人”这一概念直接将人在虚拟时空中的“信息至上”特征表达出,然而数据是人为记录的,存在真实性的问题,也就是说,“信息人”的身份识别度低,容易产生判断失误。根据“信息”判别使得一个人的品格由数据固化,而且数据推算“人”这一不确定因素到底会存在误差。高质量的数据分析需要高质量(准确、均匀)的数据。笔者与警务人员的采访交流了解到,实务中依靠大数据抓捕确实存在“抓错人”的情况,而后不了了之。这是技术本身固有的缺陷对数据推算带来失真,影响了办案效率,同时也给个别无辜的百姓带来不便,对公安机关形象之塑造亦有潜在负面影响。
(三)制度背景:制度制约的不足
我国的警务大数据建设起步较晚,发展在各地区也参差不齐,难免在进取过程中存在不少问题,但是法律的滞后性使得乱象丛生规约不足。笔者通过对公安机关内部进行问卷调查了解到关于警务数据的采集、存储、管理和使用方面在其内部还没有形成一套完善和统一的伦理准则,所以各部门往往根据自身的标准,多重标准的情况难免会产生冲突,引发伦理问题。
三、警务大数据运用过程中控制伦理风险的原则及其对策的研究
从预测和补偿的角度来说“风险概念是指因决策的局限性造成的不确定性,原则上是可以预测和控制的。”[6]针对警务大数据的伦理风险,笔者认为可以从伦理原则和具体措施两方面讨论:
(一)伦理原则
1.无害原则。弗兰克那认为,伦理是指一个社会的道德规范系统赋予人们在动机或行为上的是非善恶的判断标准。无害原则,则是道德化的体现。在数据的使用发端要求数据使用者带着以人为本,致用于民的目的,善意地使用个人信息,这是一种无形的道德规约,期待公安机关内部可以建立一套完善、统一的伦理道德准则。[7]
2.权责统一原则。公安机关内部现实行权限分级制度体现“权责统一”,不同级别享有不同的数据接触权限,但是实务中地方基层公安在繁重的工作压力下,权限分级往往流于形式:需求不同,但手上的权限不匹配导致为求便利公开分享权限(一人密钥公开共享),实为隐患。建议应当根据不同的需要进行权限等级的调整,实现真正的权限对应。
3.透明公开原则。笔者任务该原则有两方面益处:一方面尊重个人信息权,另一方面有利于勘误,当事人及时纠正错误数据,保证未来的精准决断。警方以及合作的数据公司所使用的预测算法应该以公开透明的方式接受公众的监督,通过了解他们的价值取向和关注点及时作出调整获得认可,促进数据警务的规范运用。
(二)具体措施
对于警务大数据伦理风险的控制只是停留在伦理原则层面的探讨往往是不够的也容易流于形式,正在做到预测和补偿风险,还是应该施以具体措施进行规制:
1.行业自律。针对主体的复杂性,正如我们所知,越来越多的科技品牌如华为、腾讯、阿里巴巴等行业与警方进行合作,与这些行业联合已是大势所趋,所以将主体简化,减少数据接触方不现实。因此,笔者认为,例如警企合作应该学习美国践行的“行业自律”的办法,在公安与企业内部形成自我约束力,通过行业联盟内部制定严格的信息保护伦理标准,与利益挂钩驱动行业自律——制定信息保护认证,达到标准的企业准入大数据应用门槛,并实现数据使用的隔离性、保密性和可追踪性,让数据在安全可控范围内使用。
2.技术驱动。伦理风险的产生,与技术原因有着密不可分的关系。我国警务数据建设发展较晚,这方面的尖端人才培养投入需要大量资金和技术支持。技术方面,着重培养技术人员,可以通过增加警察院校的网安专业专门培养方向或者引进技术人才纳入编制。资金方面,笔者认为正如警企合作解决科技的同时,可以带入投资方运营解决资金问题,通过社会的力量最后收益于社会。与此同时,警惕“唯数据主义”,应当将传统的办案方式与高尖端技术结合互补,减少办案差错,树立高质量办案的公安形象。
3.制度填白。只有由国家和政府部门为大数据技术的发展提供政策保证和法律监督,才能够保证我国在大数据隐私伦理监管方面处于领先位置。[8]国家立法部门应当制定与大数据采集、存储、处理、运用一系列法律法规以应对当前的大数据法律空白来规制不当行为对个人信息的侵犯并给予公民相当的监督权限协调警务数据健康的建立。[9]
四、结语
2017年1月,在美国加州阿西洛马召开的“阿西洛马会议”上,专家们联合签署了“阿西洛马人工智能原则”,23条原则其中就包括“道德标准和价值观念”此类伦理问题。可见,在大数据盛行发展的时代,世界关注到了伦理风险的存在。在警务建设中,伦理风险的可认识性和可控性,保持大数据发展取得动态平衡,更好地促进警务的信息化建设。