公共卫生事件中数据技术的伦理考量*
2021-12-05曾海燕张今杰
曾海燕,张今杰
(1.湖南女子学院 马克思主义学院,湖南 长沙 410004;2.湘潭大学 碧泉书院,湖南 湘潭 411105)
20世纪70年代,“流行病学转变”理论让“旧的公共卫生”转向以促进和保护公众健康为主旨的“新的公共卫生”发展[1]705。2020年爆发的新型冠状病毒肺炎疫情作为重大公共卫生事件,给世界各国应急处理体系提出了严峻的挑战和考验。在此次疫情应对和处置当中,大数据、人工智能等数据技术的支撑作用凸显,为“新的公共卫生”发展提供了重要手段,其在病例监测、病毒传播路径追踪、防疫动态发布、公民调查等方面展示出独特的资源属性和技术价值,引起了人们对公共卫生事件中数据技术收集、存储、分析及共享数据的关注和重视。然而,任何技术都是一把“双刃剑”,数据技术促进了“新的公共卫生”发展,但也带来了沉重的伦理问题。
一、数据技术的伦理属性
人类在经历了哥白尼革命、生物学革命、意识革命之后,开始了第四次以图灵为代表的信息革命。[2]131数据科学,是信息革命的最新阶段。[3]1它推动着大数据、云计算、区块链、物联网和“智慧+”等新兴数据技术的蓬勃发展,并对人和人类社会的影响日益深化。数据技术的伦理属性也随着数据技术的不断发展而发生深刻变化。
1.数据技术的自由性
“自由是对必然的认识和对客观世界的改造”[4]306。马克思认为,自由有两个不可或缺的条件,一是对自然必然性的超越,另一个是行为主体的意志自主,但凡具备这两个条件,便可以说是真正获得自由。从这个标准来看,数据技术具有自由性。
首先,数据技术(如物联网、人工智能)在借助大量在线存储库(如云端),使得数据成为物质世界、精神世界之外的一种独立存在的客观存在[5]41,能够为公共卫生服务管理提供搜集工具、分析工具、管理工具、挖掘工具和预测工具及一整套方法[6]52,其运行法则和规律独立于物质世界和精神世界。
其次,人作为数据技术的实践主体,具有高度的自觉能动性。数据主义认为,数据是数据科学时代的重要资源和权利代表,数据技术的发展以相关的电子健康记录、可穿戴医疗设备、智能手机APP等衍生出来的电子健康记录数据、行为数据、组学数据、图像数据等数据的流动性和可获取性为目标,其开发、使用和管理不是实践主体生存的必需,可以不受其他力量的限制,大批量、高速度、复杂性的存储、访问、共享和分析数据的优势和特点得到突显,为突发公共卫生危机提前做好基础设施、组织、管理、战略等准备,改善预防和抗击方法,以及为智能化决策提供可能[7]10,在一般情况下能够体现实践主体的个人意志。
因此,自由性成为数据技术最根本的属性,也是数据技术的实践主体进行技术开发和创新的基础。任何对于数据技术伦理上的改造都不能违背其自由性的本质,否则提供的数据便不是数据,因此不能从根本上改变数据技术对实践主体及社会的负面影响。
2.数据技术的社会性
技术具有工具的客观属性,“是一定的时空形状、仪器和程序的客体化”[8]432。但无论如何,技术总是完成人类目的的一种手段[9]26,受到各种社会文化条件的制约和影响,在社会伦理道德已然存在的情况下,其遵循和影响的技术也必然具有一定的社会性。在马克思主义伦理学中就明确表达,道德是一种行为规范总和,以调节社会人群之间关系,这种关系也包括联系人群关系的技术。数据技术所带来的数据伦理,则是调节“数据技术-人-社会”三者之间关系的行为规范的总和。
首先,数据技术是算法选择和人为设计的协同结果。海德格尔认为,技术所导致的危害,并非技术本身,而是隐藏在技术中的那种决定人与存在者的关系的力量。也就是说,应用数据技术造成的后果,关键取决于数据技术在收集、分析、及共享数据过程中人的意图。在突发公共卫生事件中,数据安全、数据失真、数据隐私、数据鸿沟等数据伦理问题广泛存在,造成数据资源浪费的同时,也给社会诚信带来严重冲击。在这个过程中,随着人的主观性不断放大,以及人们对数据及其技术敬畏之心的缺失,使得数据技术处于单纯的客体地位,工具理性受到压制。
其次,数据技术是社会伦理道德的重要“铸就”者。数据时代,人与技术、机器、数据等的相互嵌入式发展模式,使得数据技术开始重构人与人之间的道德关系。[10]37这种道德关系不是纯粹主观的,而是在数据技术的客观属性与人们的道德需要之间的关系中产生的[11]86。面对突如其来的重大公共卫生事件,除了应对问题,更需要伦理反思。在应对公共卫生事件中,数据技术的“真”为化解公共卫生事件提供着客观物质支持,而伦理道德的“善”则为防范公共卫生事件爆发提供着价值的目的性。两者的统一,才是公共卫生事件在动态管理过程中实现的真正统一。
二、公共卫生事件中数据伦理问题
与技术要解决“能不能”的求“真”问题不同,伦理考量则要解决“该不该”的伦理价值问题。从辩证法的角度来看,数据技术势如破竹地改变着我们的世界,创造和重塑社会价值、经济价值、文化价值和生态价值,同时技术客体自身的缺陷及应用后果也增加了“负面效应”。公共卫生事件中的数据伦理便是其中无法挣脱的一环。
1.数据技术的滥用
数据安全导致数据隐私的隐形伤害。公共卫生事件中传染病与其他大多数疾病不同,诊断速度和开始适当治疗的时间会直接影响传染病防控的效果。然而,在疫情数据传播过程中,非规范操作将类似确诊或疑似患者的电子诊疗记录等高敏感性数据库的建置、串接和目的外使用,导致数据的意外“丢失”或故意泄露[12],可能造成病人、被隔离者或医护人员的姓名、肖像或其他足以识别其身份特征的数据公诸于世,这必然伤害公民个人隐私权利,甚至公民个人尊严害。特别是处在隔离状态中的患者,当其信息被泄露后,他们除了面临传染性疾病的威胁、陌生隔离环境带来的孤独感之外,还极易被当成感染源受到排挤、贴标签、污名化等负面事情关联影响,而出现恐惧、焦虑、抑郁等负向情绪。
数据失真将导致数据权益的显性伤害。数据分析对象是庞大的数据集,在公共卫生领域,通过数据分析,发现疾病与患者生命中某些迄今未曾预料到的特征数据之间的关联可以有效帮助疾病诊断,使得数据分析成为对患者进行诊治工作的组成部分,甚至可能减轻特定的诊疗风险。但若提供者为保护自身隐私或达到某种目的,提供虚假数据,甚至盗用他人信息进行虚假加工,或分析者刻意选择和无意遗漏某些数据源,就可能会带来数据结果的不确定性问题。例如,在公共卫生事件中,部分患者隐蔽性的特征(如潜伏期、无症状患者等)使数据分析者对数据因子产生客观忽视,导致特殊群体的代表性不能被正确对待,这就有可能使该群体受到伤害。同时,公共卫生事件中取得数据授权的程序可能非常昂贵或非常耗时,数据提供者的授权没有被正确考量或者被忽略,必然带来伤害的加深。若要完全实现数据提供者的知情同意,达到安全使用的目标,必然会增加获取数据及分析使用上的困难,使数据技术的应用碰到尴尬的难题。
2.数据所有权归属不清
首先,“隐藏”协议与数据二次利用,将威胁数据提供者的自主权。按照数据自主原则,提供用于公共卫生突发事件研究的数据的每个人都应拥有对其数据的权利,应自愿决定参与并共享其数据。然而,公共卫生干预措施的效果取决于速度,“监视”成为公共卫生的“眼睛”[13]838,这种“非正式的道德监管模式”[14]101为快速做出预判、制定有效可行的措施提供依据。比如,从SARS(2003年)和H1N1流感(2009年)大流行的经验来看,有效的传染病监控数据所带来的公共利益,对国家和国际卫生安全具有重要意义。在数据技术应用的过程中,若出于对隐私和数据安全的担忧,将很大一部分人排除在数据采集的范围之外,或需要个人同意才能访问已识别的数据,则潜在的公共利益将会受损。同时,数据采集隐含于各种服务产品中,为有效避开数据提供者价值理性判断,产品大多采用较长篇幅和较小字体形式将数据授权书“隐藏”起来。例如,Google和Yahoo使用搜索引擎提供公共卫生服务时,就涉及有关用户隐私和知情的问题。同时,数据挖掘与应用中数据的“二次利用”也不可避免。这种创新用途通常是未征得数据提供者同意和许可的,即使数据被保护性模糊化、匿名化,但人的自主性仍将对数据自主权构成威胁。对于公众来说,这种以公共利益为名驾凌于个人权益之上的现象,限制了个人自主权,尤其是隐私权和自由权。
其次,疫情监测与预警系统不完善,将造成数据使用者的“二次伤害”。传染性疫情爆发时公众在面对高传染性、治疗不确定性甚至死亡威胁的时候,往往会害怕被感染、被隔离,担心被标签化。加之,媒体在沟通与新闻采访过程中充满不确定因素,特别是新媒体语境下,在线记者异动率高、采访议题多样化,以及短时间内防疫知识欠缺等现实短板,极易导致受众出现焦虑、罪恶、对人失去信任感等心理问题。此时疫情相关信息的及时、透明发布显得尤为重要。然而,由于某些主管部门公共卫生知识缺乏,疫情认识不足,加上疫情监测与预警机制不完善,必然导致疫情监测的缓报、瞒报、漏报等情况发生,从而贻误疫情防控的最佳时机,使得公众在相关数据接收和利用上造成“二次伤害”。如英国政府在上世纪80年代疯牛病疫情初期,因过度保护本国牛肉产业而一度延迟数据的真实报道,就造成疫情的大规模扩散,而招致了国际社会的严重谴责。
3.数字鸿沟
数据主义认为,信息自由就是最高的善[15]348,而数据鸿沟是信息自由的绊脚石。随着信息技术及电子设备的不断发展,控制、生成或购买大型数据库访问权的主体和作为数据库中单个数据符号的具体个体,逐渐衍化成“信息富有者”和“信息贫困者”两个群体,他们之间必然会形成不平等、不公正的“数字鸿沟”。邱仁宗等学者认为,数字鸿沟是一种“技术鸿沟”,由于先进技术的成果不能为人公平分享[16]36,就会导致不同主体间的数据不平等,呈现出“富者越富,穷者越穷”的态势。从现实的情况来看,数据鸿沟不仅存在,甚至还呈现不断扩大的趋势,从而带来社会的进一步分化与撕裂[17]35-36。尽管数据访问对于不同群体来说可能是公平的,但是对数据鸿沟中脆弱一方的不公正待遇,一定会造成主体权利的差异性。同时,当公共卫生事件发生时,被监视或检测的数据主体所产生的数据越多、所聚集起来形成的数据库越大时,那些有权访问数据的主体所获得的权力也就越大。这种数据技术垄断所造成的危机将造就一个庞大的“无用阶级”[18]115。处于无权状态的数据主体,他们难以知晓谁将持有他们的哪些数据用于什么目的。这种不公平待遇可能不会伤害所有人,但会阻碍部分有需要的人获取某些资源。在这个过程中,数据鸿沟需要处理有关正义和公平的问题,尤其是针对那些最脆弱的“无用阶级”。例如,大数据技术在抓取公共卫生事件关联数据时,系统会突出数据主体(例如,确诊患者、密切接触者等)的职业、经济、性别、爱好等要素,这些要素数据的推送虽不是数据主体个人所决定和控制的,但却会招致对数据主体的不公正性问题,和获取数据资源的不平等性问题。
三、公共卫生事件中数据伦理问题的本质
公共卫生事件中数据技术所引发的伦理问题是毋庸置疑的,其问题的本质是多个矛盾体冲突的结果。概括起来,主要包括以下几个方面。
1.技术工具理性与价值理性的冲突
数据主义认为任何现象或实体的价值就在于对数据处理的贡献,而人文主义却认为所有的体验发生在我们的心中,我们要从自己的内心去找寻一切事物的意义[15]335-351。事实上,人本主义的“听从内心想法”与数据主义的“数据算法结果”的关系,就是数据技术的“真”与“共同善”的关系,这成为数据技术工具理性与价值理性在本体论意义上的根本分歧所在。
对于数据技术,人们需要处理好“公共的”与“存在于公共空间的”之间的关系。[19]90工具理性强调技术的“真”,试图通过一切可获得的手段和方式,实现技术客体功效的最大化。也就是说,数据技术的发展应该是自主的,应该是在互联网、大数据、云计算、人工智能等新兴技术环境下产生的“存在于公共空间的”技术客体,其诞生就是为了提供更加便捷、高效的数据收集、存储、分析和共享的工具和方法。然而,在现实情境中,技术决策最重要的影响因素不是伦理道德,而是具有重要“公共的”取向的价值理性。特别是,在突发的公共安全事件中,数据技术的应用者在受到经济利益诱导或外界强加干扰等因素影响时,常常会出现数据技术滥用问题。这不仅会造成对数据资源的浪费,还将给社会道德伦理带来困扰。同时,社会矛盾、传播媒介、监管制度和网民行为等与突发事件社会舆情风险直接相关的复杂因素,[20]22将进一步激化社会伦理道德的失范。如在疫情爆发期间,未经证实的谣言经由网络快速传播蔓延,可能严重影响疫情防控,造成强烈的社会恐慌。2003年SARS疫情中,少数公众受到非真实信息的误导产生非理性抢购、囤积药物物资等行为,就是例证。在这个案例中,谣言就是基于“存在于公共空间的”“利”,而不是基于“公共的”“共同善”,从而使数据技术陷于工具理性与价值理性的悖论难题中。
2.技术创新进步与伦理观念滞后的冲突
技术进步以强大的动能迫使传统伦理观念“自不量力”,挣扎退守。技术,自始至终都有一个度,即技术内在的创新和超越的冲动,不是无限地、无目的地扩张,而是处于适度扩张的节奏中。这种“节奏”是传统伦理观念的制约所带来的。从工业化的“小数据时代”走向当前的“大数据时代”,人们沉浸在旧有的伦理道德体系中,难以接受旧有伦理道德体系的改变。[21]104通常情况下,一项技术的应用后果在很长时间内是很难确定的,在伦理观念未发生大的改变的空档期,旧的道德实践和伦理建设在人们精神文化及心理、情感中的影响不能小觑,技术的发展依然受制于传统伦理观念。由此,新的伦理风险便悄然酝酿升级。
新的伦理观念构建不会一蹴而就。尽管数据技术发展必然会突破旧有传统伦理观念的栅栏,但是新的伦理观念要成为主导人们正确认知数据技术的观念体系,却不会那么迅速,它必然需要人们采取主动、积极的态度去重构新的伦理道德体系,用新视野、新手段、新理论去分析和把握数据时代的问题,并在与旧伦理观念的博弈中逐渐萌芽、发展、巩固,最终使人们遵循这样新的伦理观念去适应数据技术时代的发展。
3.技术双用性与技术异化的冲突
数据技术从功用性上讲具有双刃性,在带来巨大利益的同时,也必然会带来各种风险。数据技术在应用和管理的过程中,除了是一个“技术-人-社会”不断交互的过程,更是一个人类利用技术追求价值的过程。价值追求有好有坏,坏的则产生技术的异化。数据技术异化是人们在创造和使用数据技术的过程中,实践主体与数据客体发生易位,使得人类逐渐被数据技术支配、束缚和规定[22]51-53。具体来说,导致数据技术异化的原因主要来自三个方面。
一是技术客体的资本主义应用所形成的利益冲突。芬伯格曾指出,技术的资本主义应用需回答“特定技术不良应用追求的目的是什么”[23]45-46的问题。事实上,技术的资本主义就是要实现高效率和高增值,创造更多更大的价值。[24]42在公共卫生事件中,随着数据技术在危机事件处理和预防方面的突出表现,受到科学技术专家、政府、企业的高度重视,同时技术的经济功能进一步凸显,巨大的经济价值造成利益集团或个人的价值冲突,如数据所有权归属问题。在各种利益的驱使下,价值转化为资本的过程,各种难以预估的伦理风险随之而来,严重影响数据技术的良性发展。
二是社会需求异化带来的负向技术价值实现。社会需求体现了人们的价值取向,人作为社会需求的主体,若改变预期的社会需求,而对数据技术进行滥用,将突破对数据及其技术的敬畏。这种预期社会需求的改变,映射了人类社会的价值的某种偏向,使得数据技术需求的合理性、人性化考量不能与社会主流价值耦合。若一味追求这种社会需求异化,则必然造成对真实价值的客观忽视,引来伦理冲突。
三是技术客体创造的不确定性带来的技术异化的不确定性。从技术本身来看,数据技术是一个网络化的存在,若网络上某一技术子系统出现错误,则整个技术系统的结构和功能将遭到破坏,甚至是毁灭性的。若数据本位使“以人为本”让位于“以数据为本”,将权力和责任转交给数据技术,相关从业人员的道德责任意识也将被消解。[25]87例如,数据技术的发展对公共卫生事件的智能决策成为可能,使之能够快速反应,并达到预防、防控公共卫生事件的作用,但是若数据技术本身存在缺陷,则可能导致对突发事件研判的不完全性和错误性。过去,谷歌公司就曾推出一款名叫“谷歌流感趋势”(Google Flu Trends, GFT)的产品,由于方法学的不确定性带来技术缺陷,从而产生了大量误判的预测结果。然而,这种方法学的不确定性技术在某种意义来说一刚开始是不可预测的,具有很大的不确定性,很难判断它会产生正向积极的结果,还是负向消极的结果。现代数据技术就是在不断创造和消除这种不确定性的过程中循环上升发展的,必然伴随着数据技术异化现象的出现。
四、公共卫生事件中数据伦理的治理路径
公共卫生事件中数据伦理问题治理是现代社会“新的公共卫生”发展的重要议题。因此,除了要对数据伦理问题本质进行探讨和剖析,还需要调动更广泛的社会力量,采取更果断的治理举措,进一步放大数据技术在公共卫生事件中的正效应,极力削减负效应,确保数据技术更好地为新的公共卫生服务。
1.强化制度约束和伦理规范
一是在法律和制度层面,要加强数据技术立法,由政府部门牵头,组织专家、学者、技术代表、企业、社会公众等进行跨学科、跨领域的信息规范和秩序的研究和顶层设计,明确技术开发主体的法律责任,强化数据科技领域的知识产权保护制度。同时,细化公共卫生事件中个人数据保护、数据安全的细则,成立政府监管机构,对公共卫生中数据采集范围、方式予以责任和权利进行界定,加强数据共享和使用的问责机制,强化数据监测预警与应急处置制度体系建设,防范并打击数据滥用行为。二是在伦理道德层面,要加强数据管理者的伦理培训,强化数据管理者的自律和规范,强化技术提供者的责任意识,强化数据科技创新主体对主流数据伦理价值的认同,增强技术主体的道德责任感,提升信息传播者的伦理观念。同时,鼓励全社会践行“共同善”的理念,提高公众保护个人数据隐私的意识和能力,形成数据伦理风险和技术边界的共识,共同遵守数据伦理道德规范和法律法规。
2.推进风险沟通机制建设
一是搭建全国统一的数据收集发布平台,建立标准规范、渠道畅通的数据收集载体,规范数据公示披露机制,科学、理性对受众进行指引,增强数据的透明性和公开性,加强数据技术安全的监管,缩小数据鸿沟,提高政府智能决策。二是建立通畅稳定的数据流通渠道。由各级政府主管部门牵头,以志愿者为主体,建立覆盖全国的统一的公共卫生数据监测和预警网络,互相通报公共卫生事件的监测、预警数据,构建多部门并行联动、自下而上的监测机制,及多主体可直报触发预警机制。三是发挥社会基层组织的基础作用。强化运用新媒体技术,加强社区、志愿者等社会力量的宣传教育作用,切实解决公众对数据伦理的“疑点”“痛点”问题;鼓励开通公益服务热线,实时了解社会舆情,及时解答公众疑虑,疏导公众不良情绪和反馈,整合信息快速上报反馈,帮助公共卫生部门科学决策。
3.深化技术应用的负责任创新
一是对数据来源和收集进行负责任创新。规范数据采集流程,在采集数据之前应告知采集对象,采取必要的数据加密存储和传输;科学评估数据来源和收集中潜在危害与收益,按照“最少够用”、“目的明确”原则限定采集内容;促进学术界和公众对数据来源、收集环节可能存在的伦理问题进行充分辩论;提升公众对数据安全、数据隐私权的认知力,从而推动风险评估和决策的多元主体协商,有效解决数据来源质量不高、数据收集成本昂贵、数据隐私风险高等问题。二是对数据分析和管理进行负责任创新。指派数据专管人员,实行数据查看权限管理,数据分析和管理人员应当认真考虑数据这把双刃剑,并承担适当责任,审慎数据伦理风险的平衡,强化数据分析的价值敏感设计,以负责任的态度开展数据分析和管理工作,运用数据伦理知识对应用数据科技所产生的数据伦理进行科学评判,做出科学的数据伦理决策。三是对数据使用和共享进行负责任创新。数据技术本身及其产生的数据被视为“公共的”中立工具,其风险主要源于它们的使用方式和使用者。因此,根据“最小必要原则”进行数据技术应用,应不得随意传输数据电子文档,确保数据不被与公共卫生事件相关的个人、组织获取;明确数据披露机构,避免个人数据泄露及污名化风险,进行必要的脱敏、匿名化处理。