生态环境数据治理及其伦理规范
2020-12-09彭理强
彭理强
(湖南师范大学 公共管理学院,湖南 长沙 410081)
生态环境治理是生态文明建设的重要内容。“生态文明建设不是自发的个人行为,而是有计划、有步骤实施的社会实践活动,因此必须纳入到整个社会的管理体制之中”[1]。网络化、数据化成为现代化生态环境治理发展的新模式。我国生态环境监测网络建设的目标是到2020年“初步建成陆海统筹、天地一体、上下协同、信息共享的生态环境监测网络”[2];生态环境大数据建设和应用的目标是到2021年实现生态环境综合决策科学化、监管精准化、公共服务便民化[3]。国家政策的出台促进了环境监测数据共享建设,推动了生态环境大数据的建设和应用,强化了政府生态环境现代化治理能力。为了监测环境,大数据平台采集了全国的大气、水、土壤、生态、核与辐射等多种环境要素及各种污染源数据;为了整合数据资源,大数据平台通过政府数据统一共享交换平台接入国家人口基础信息库、法人单位资源库、自然资源和空间地理基础库等国家其他基础数据资源;为了实现数据互联互通,形成环境信息资源中心,大数据平台拓展吸纳相关部委、行业协会、大型国企和互联网关联数据[3]。用大数据技术推进生态环境治理,使政府大数据平台获得了越来越多的各种类型的数据,而如何对待和使用这些海量数据是不可回避的问题。张宁等认为,数据治理的研究主要集中在“框架模型的设计”“价值的探讨”和“不同领域的应用”等[4]。因此数据治理涉及信息技术、管理、伦理等多个学科领域,具有多学科交叉性和行业特殊性。虽然大数据技术引发的伦理问题也受到国内外学者的普遍关注,但对生态环境领域的伦理规范研究未成体系。“大数据信息价值开发面临的核心问题是信息共享的伦理促进和约束机制”[5]。因此,生态环境大数据的开发和使用过程中需要平衡信息共享的收益和风险,加强对生态环境数据治理的伦理规范研究,而伦理规范具有促进和约束两个方面的机制。
一、生态环境数据治理的重要性
数据治理概念源自信息技术领域的信息技术治理。传统的数据治理的观点是构建一套数据治理的技术框架体系,比如比较有代表性的信息技术机构DAMA(The Data Management Association,国际数据管理协会)把数据治理定义为对数据资产管理行使权力和控制的活动集合(包括计划、监督和执行)[6],DGI(The Data Governance Institute,国际数据治理研究所)将数据治理定义为针对信息相关过程的决策权和职责体系,这些过程遵循“在什么时间和情况下、用什么方式、由谁、对哪些数据、采取哪些行动”的方法来执行[7]。随着信息技术的发展,数字化设备累计了海量的异构数据,大数据、云计算、人工智能的应用使数据的潜在和隐含价值凸显,数据开始被视为组织的重要战略资源,因此数据治理把数据作为资产管理的对象。比如Bhansali认为数据治理是对数据持续监控和评价的过程,以便更好地管控数据风险[8],包冬梅等认为“数据治理是对机构的数据资产管理行使权力和控制的活动集合”[9]。国内较早研究大数据伦理问题的是邱仁宗教授,其团队探讨了与信息技术及大数据技术有关的数字身份、隐私、可及、安全和安保、数字鸿沟等伦理问题,提出了大数据的伦理治理原则的建议[10]。因此,全面的、辨证的数据治理伦理观认为,数据治理是指治理主体最大限度开发数据价值,管控相关的风险,实现整个社会价值最大化的战略目标的系列活动。数据治理的伦理规范为数据治理提供了基本的原则和目标,是技术和管理等数据治理手段必须遵循的价值标准。数据治理的伦理观与技术、管理观相比,更加注重数据对于社会和人的价值,而非仅组织内部的经济价值。生态环境是人类赖以生存的载体,因此生态环境数据治理具有维持人类存续的最高价值,该价值显示数据治理在生态环境保护方面无比重要。在伦理价值之外,生态环境数据治理也具备技术和管理等工具价值。
(一)生态环境数据治理是科学决策的基础
决策需要信息,范登·霍文等提出应该将“信息”①范登·霍文的信息概念是广义上的信息,可以通过不同的信息载体获取,比如书籍、资料库、计算机等。纳入罗尔斯的“基本必需品”的理论范畴,才能使自主的个体合理规划生活,做出理性选择[11]。理性的决策是在有限的信息中作出权衡,而科学决策的基础是需要大量的信息。生态环境数据治理的目标就是需要在大数据间发现隐含价值、挖掘潜在价值,为科学决策提供依据。
计算机的普及、互联网的发展为人类获取最广泛的信息提供可能。互联网时代信息是以数字化的形式被生产、传输、储存的,数字化的具体形式,如文本、音频、图片、视频、文件等资料被统称为数据。这些数据蕴含的价值成为我们科学决策的依据,这些数据价值的开发就是我们数据治理的目标。“数字设备的大规模应用和大数据的采集使得数据生成和分析的新方法得以利用,从而为新的方式提出和回答问题提供可能”[12]。如此多样的数据超越了人类认知的极限,但随着数据科学的发展和计算机可视化技术的提高,我们可以利用云计算、机器学习算法等大数据技术分析和研究这些数据,以至于我们不再热衷于追求小数据模型的精确度,“大数据的简单算法比小数据的复杂算法更有效”[13]。通过对生态环境数据与工商、税务、银行等机构数据进行相关性分析,就能够找出看似毫无关联的数据之间的规律,找到环境保护和经济发展的平衡点。
大数据技术具有数据规模庞大、数据来源多样、数据传输快和数据价值高四个特点,简称4V 特点。大数据的4V 特点表明要达到可靠决策,就需要更多的数据量、更多维的数据类型、更快的接入速度。因此数据治理在开发信息价值的同时汇聚更多的数据,为大数据价值开发提供更多的资源,成为促进环境管理和科学决策的新动力。源源不断的数据流动可以显著提高环境形势分析能力,在生态环境科学决策等方面发挥越来越重要的作用。例如大数据应用在加强环境监管时,发现某重点监视的排污企业的产能和排放严重偏离相关标准,大数据平台能够准确预警到环境监测的异常,提示现场环境执法检查人员排查潜在的污染物排放源。大数据应用在加强生态环境评测和监管的公共服务方面,可以对互联网上的生态舆情进行监控,一旦发现环境方面的舆情,立即启动联动机制开展线下检查执法和环境质量的评测。
(二)生态环境数据治理是国家治理现代化的重要内容
公共政策关乎公共利益,按照功利主义的观点,符合最大多数人的利益才是善的政策,能否用最少的社会成本满足最大的社会群体的福利是对一个政府执政能力和公共治理能力的重大考验。环保部门的公共管理能力集中体现在生态环境数据治理能力上,数据治理是生态文明建设的重要保障,是国家治理现代化的重要内容。
首先,环保部门间信息自由的传递降低了沟通成本,节省了公共管理支出。环境监管是生态环境部门履行环境监管职责的基本职能,是落实环境保护政策的重要保障,是维护公众利益的重要措施。生态环境数据治理首先解决的是环境保护部门内部数据的同步和共享问题,我国存在省、市、区不同层级的环境监管和执法部门,数据的同步和共享可以加强不同层级部门间的组织和协调,提高执法的时效性和精准性。
其次,生态环境数据治理可以最大限度地获取公众的利益诉求,使公众参与事关公共利益的民主决策。生态问责作为生态文明制度的重要内容,但实际的运行中存在着考察的对象比较单一、公众参与生态问责力度不强、过度强调事后追责、事前事中问责亟需强化等实际问题[14]。在互联网的支撑下,普通民众、市场主体可以通过新媒体发出自己的声音,表达各自的利益诉求。政府对公共治理也持开放态度,开放生态数据保障公民的环境知情权。政府部门可以通过政府政务平台向社会搜集民意和诉求,公众的诉求数据经政务平台共享到具体环境决策部门,形成生态环境决策和反馈的闭环,使公众能够影响并参与到生态环境公共治理的民主决策中,在关键事项的审批和监管上政府要接受群众监督。随着我国经济转型和产业结构的调整,农村环境群体性事件出现频发的态势[15]。通过生态环境数据治理可以为农村环境群体性事件协同治理提供新的途径,构建主体间良好的合作机制,大力发挥媒体与社会组织的参与功能。
二、生态环境数据治理的伦理促进机制
传统生态环境治理最突出的问题是职能分散,不同层级部门掌握的信息没有共享,没有形成长效的沟通协调机制。这样就对跨生态系统、跨地理位置的违法案件,不能形成全面有效的预防和监管,有时甚至出现监管的真空地带;另外一方面,类似医院只认可本医院的化验检查结果的行为,环境监管部门一般也只认可本部门收集的证据材料和作出的处罚决定,有时甚至出现一个企业的同一个违法行为被几个环境监管部门同时调查询问的局面。出现如此现象首先是与不同环境监管机构职能的划分不明有关,但是暴露出来的深层次问题是生态环境监管部门缺乏必要的联动机制,部门间信息共享机制不畅。数据治理的目标之一就是提倡数据共享,主张数据价值开发的最大化。
(一)不同公共环境治理部门数据的自由流动
数据作为一种资源具有不同于传统资源的特征。数据资源不会因为被使用而消耗,也不会因为被转让而失去价值,相反会因为资源的分享使价值得到提升。数据资源的价值开发就在于数据的共享。信息时代,数据不分享无价值,越分享越有价值。“共享伦理是信息共享伦理促进机制的核心内容”[5]。构建信息时代的共享伦理要尊重数据价值的发掘路径,提倡共享和奉献精神,加快数据的流动。为了更有效地传输数据,挖掘生态环境数据的潜在价值,需要政府部门、科研机构、互联网企业等机构加快制定相关方案、完善数据共享的标准化研究,推进生态环境行业的数据互联互通。通过统一编码、统一格式的大数据平台将原本分散储存在不同部门、不同行业的数据融为一体,然后进行集中管理、整合共享,打破各部门数据条块分割格局。不同环境治理部门间的数据自由流动可以保障数据价值的最大使用。
(二)公共环境治理部门与互联网数据的开放共享
“互联网+”就是互联网与传统行业的融合,使产品的生产、销售、使用等生命周期网络化。通过采用信息通信技术和互联网平台,可以提高产品升级换代的速度,也可以提升产品的数字化水平,加速信息产业与经济产业的融合。数据价值要开发就需要最大量的数据,数据越多可开发价值越多。推进“互联网+”与生态环境行业的融合,需要提倡开放的伦理精神,让更多的生态终端相互连接,让生态环境行业产生最多的数据。万物互联是信息时代开放伦理精神的终极目标。推进“互联网+”与生态环境行业的深度融合,需要国家宏观政策的统一规划,需要发挥市场在资源优化配置中的主导作用,需要企业和民众的充分参与。“美国有非常成功的环境污染防治的经验,主要体现在,通过市场化的方式,通过数据的开放和共享,调动市场力量,鼓励民众广泛参与”[16]。保持开放的伦理精神,有利于市场的充分介入,有利于技术的创新,有利于接入更多的生态终端。
(三)发挥算法工程师的主观能动性
社会发展使社会出现不同的分工,当一个特定领域变得特别复杂,社会对运用这项技能的专业人才又特别需要时就会催生一种新的职业。信息价值的开发是一项对相关专业技能要求很高的工作,从事这项工作的人需具备计算机科学、数学和统计学等领域方面的知识。小数据时代数据集都是标准集和严格的关联结构,采用关系型结构数据库来存储,数据的分析需要严格的匹配表间的关联字段,这种分析只是把数据间的隐含价值开发出来,数据呈现的结果也有严格的因果关系。换句话说,无论多么复杂,经过完整的计算机科学学习的工程师都可以按照编码的规则找出、得出数据分析的结果,并能解释其原因。在计算机科学领域算法是指解决问题的具体策略,可以通过一组计算机代码来描述并能被计算机有步骤的执行。大数据的信息价值开发采用的是类似人类学习的机器学习的算法,通过分析数据间的相关关系来挖掘数据里的潜在价值。该算法已经完全抛弃了严格的因果关系,此算法的结果是人类无法理解的。因此数据价值的确定性和透明性需要专业的人才才能认识清楚,算法的可靠性和风险同样需要有专业人士来掌控。迈尔-舍恩伯格认为,大数据催生一门新的职业,例如“算法工程师”,它的主要职责是大数据分析和预测的评估,保障信息价值分析的可靠和保密。大数据的算法是信息价值开发的关键技术,它与一般的计算机算法的区别是运算基于数据的特征,因此表现明显的数据价值维度的偏好,需要在练习的过程中不断地强化提高认知的能力,算法存在学“好”学“坏”的风险。
因此,在生态环境数据治理的过程中,“算法师”等信息价值开发的工程师的作用是十分关键的,类似医院需要一名经验丰富的临床医生来诊断病人的疑难杂症,为病人的治疗保驾护航一样。因此,专业人才对数据隐含价值的评估流程是不可或缺的,可以帮助说明算法的可靠性和适用情形。大数据信息价值开发起决定作用的是人的决策,算法可以辅助人的认知决策,但不能代替人类决策,要保障人的决策优先算法的决策。因此需要发挥算法工程师的主观能动性,时刻关注数据的变化和算法的价值偏离,而不是盲目信赖算法的决策。
三、生态环境数据治理的伦理约束机制
数据共享是大数据价值开发的前提,大数据价值开发一方面要求生态环境部门开放数据共享,实现数据自由流动;另外一方面大数据平台采集的信息可能涉及经营企业的机密信息和个人的隐私数据,完全开放共享将引发舆论和法律风险。“对所有利益攸关者的最大挑战是如何确立数据可信的流动”[10]。数据“可信的流动”需要发挥信息共享的伦理约束机制。企业、社会公众、科研院所等可以充分参与到生态环境数据治理的风险和收益方面的讨论,获悉不同利益主体的诉求。数据治理的目标之一是管控相关的风险,主张有规范的数据共享。
(一)让数据价值开发主体承担更多责任,保护个人(企业)数据的各项权利
隐私是个人的生活免受他人的打扰。部分学者甚至认为隐私权是人的基本权利或基本权利的表达。隐私权与个人自由权密切相关。个体一旦丧失隐私权就不能自由的行动,成为边沁“环形监狱”里面的犯人。企业机密数据是指企业市场核心竞争力的文件、资料等数据。大数据时代,个人隐私权的丧失和企业机密数据的泄露变得很容易。传统的数据保护模式是个人(企业)决定和知情同意,但是在生态环境保护领域难以奏效。例如为实现数据互联互通,生态环境大数据平台接入了国家人口基础信息库、法人单位资源库等数据库,采取这些数据前以合适的方式告知个人(企业)是不切实际的。另外一方面,从单个渠道源采集的小数据的信息价值有限,但是通过大数据挖掘技术使不同数据源的数据交叉、融合后可以发现大量的隐含和潜在信息。大数据技术挖掘数据价值的同时,虽然对个人隐私的自主权提出挑战,但是政府基于“善”的目的的行为不是对个人权利的侵犯。同时政府应该只能基于生态环境治理为目的的公共利益出发采集和使用个人和公司的数据,与此目的无关的数据不采集,最小化采集个人数据和企业数据;另外要保留他们删除侵害自己权益的数据的权利;如果通过市场化形式使数据产生效益,他们也应该有获得收益的权利,受到侵害获得赔偿的权利。总之,生态环境数据保护的主要模式不再是传统的个人(企业)决定和知情同意,而是由数据价值开发主体承担起责任,以实现公共利益价值最大化为出发点和目标,保护企业和个人数据的各项权利。
(二)谨慎采集和使用国家地理信息等机密数据,保护信息安全和国家安全
国务院办公厅印发的《生态环境监测网络建设方案》要求“各级环境保护部门以及国土资源、住房城乡建设、交通运输、水利、农业、卫生、林业、气象、海洋等部门和单位获取的环境质量、污染源、生态状况监测数据要实现有效集成、互联共享。”生态环境大数据平台采集和交换的数据非常广泛,部分涉及到国家安全的信息;另外一方面在信息化时代,无人机、卫星定位、遥感技术快速发展并广泛用于生态环境的监测领域。这些设备的测绘技术和空间技术使地理位置信息数字化后呈现高精度、易采集、易传输等特点。生态环境大数据平台在使用这些高技术设备前,要评估生态环境治理的受益与风险,谨慎对待国家地理信息等敏感数据。数字设备在采集、存储和使用地理信息不得危害国家安全和公共利益。
(三)培育个体生态责任意识,构建合作共治网络
“生态责任意识指对生态环境负有保护的责任,人是自然的存在物,人对自然规律的遵循就是履行自己作为自然界的一个能动存在应该负有的义务”[17]。生态责任意识有消极的生态责任意识和积极的生态责任意识之分。消极的生态责任意识是指自我(个体或社会组织)能够意识到自己对生态保护的责任和义务,并能促使自我践行生态保护的实际行动;积极的生态责任意识是指不仅自我(个体或社会组织)能够践行生态保护的实际行动,自觉抵制各种破坏生态环境的行为,并且遇到他者破坏我们的环境会自觉加入到抵制、阻止破坏活动中来。需要指出的是,生态责任意识的消极和积极之分体现了生态责任意识的不同认知标准,一个人可以针对同样的生态后果持不同的道德标准。比如,我会很介意家门口饭店排放的油烟污染并积极投诉要求饭店关闭(尽管饭店已经增加了长长的排烟管道,油烟不会直接飘到房间),但是可能对远在太平洋的一艘巨型油轮石油泄漏事件漠不关心。在关乎人类命运的生存问题上,人类可能面临的最大挑战就是全球生态责任意识。在前信息时代,由于信息的闭塞,个体或单个组织具有生态责任意识也不能组织有效力量阻止破坏活动;在互联网时代,生态责任意识对生态环境的保护的力量开始凸显。例如,随着微博、微信朋友圈等新媒体使用群体的增加,任何一件影响公共利益的事情都会通过社交媒体的无限扩散迅速发酵成为舆情事件,公众的参与讨论有助于事件在舆论的监督下公平公正的化解。我国可以借鉴国外的成功模式,运用大数据思维,推进治理架构的开放包容,构建合作共治网络,赋予企业、个人生态环境治理的主体责任。合作共治是指政府、企业和个人充分参与的多元合作治理新模式,用于整合大数据资源,助力政府决策科学化。
(四)警惕唯数据主义,正确认识信息价值开发的预测功能
大数据向我们展示了强大的预测分析能力。环境大数据开放共享后不同的环保部门都可以对数据的价值进行开发,从而会在环评、监测、环境应急、监察执法等重要业务领域发挥积极作用。环保大数据进一步向公众开放后,不同的市场主体将会对环保数据进行商业化开发。大数据的预测给我们带来价值的同时,也会给我们带来威胁。“它们(大数据算法)将不确定性和不透明性引入计算过程,进而将其延伸到社会生活领域,无形地增加了伦理风险”[18]。例如政府决定采用环保部门的大数据淘汰一批产量过剩、污染大的企业。环保部门大数据算法显示企业环保质量与环保处罚等数据相关,因此曾经受到环保处罚的企业面临被政府淘汰的风险。需要指出的是,环保质量算法模型决策的依据是环保的历史数据,产生的相关性结论是基于具有不良环保记录的企业的群体特征,是对群体企业相关性结论的概率统计。但是群体中的某个企业在一次环保处罚后,或升级了环保设备,或改革了环保管理机制,已经成为环保的先进企业,基于历史数据的环保质量算法模型是不公正的,因此也是缺乏可信度的。
历史数据只能用来理解现在和预测未来的风险,如果用来决定某个具体的个体的未来就会犯唯数据正义的错误。数据正义主张数据自由流动和算法至上,各种事情的决策只需要“聆听算法的意见”[19]。数据正义是数据哲学的一种表达,数据正义会导致人的自主权的全面丧失。康德认为人的自由意志是最大的善,人可以自己为自己“立法”。人具有自由意志,自由市场主体的企业在人的决策经营下具有市场自主性,环保数据的信息价值开发需要警惕唯数据正义,尊重市场主体的自主权,保护公平自由竞争,正确认识信息价值开发的预测功能。迈尔-舍恩伯格等提出的“公开原则、公正原则、可反驳原则”[13]可以作为我们生态环境信息价值开发预测分析的治理原则。
总之,数据治理具有技术、管理、伦理三个价值维度。生态环境数据治理的伦理价值是以人为本,实现社会价值的最大化。在生态环境数据治理的技术和管理事务中,我们需要发挥伦理规范的价值引导作用,使数据技术体系的建构、数据资产管理的增值符合人类绝大多数人的利益,而不能成为少数人谋利的工具。大数据应用的伦理挑战在于平衡数据的收益和风险,在生态环境数据的规制方面,我国应该充分研究和借鉴欧洲国家的法律保护模式和美国的行业自律模式,建立起符合我国国情的法律的、伦理的、技术的、市场的多种数据治理模式。生态环境数据治理的伦理观认为,人类需要妥善处理人与数据的关系问题,数据的开放共享和规范共享同等重要。最大限度地提高生态环境数据的价值,同时管控潜在的风险,提高生态环境治理能力,是实现“美丽中国”国家战略的有效途径。