APP下载

科学数据伦理治理: 政策框架与路径

2025-01-04刘先瑞司莉

现代情报 2025年1期
关键词:政策分析数据治理英国

摘 要: [目的/ 意义] 完善科学数据伦理治理有助于规范科学数据收集、共享和使用, 发挥数据作为科研的关键资源与要素的功能, 优化科学数据管理服务。[方法/ 过程] 本研究基于扎根理论分析英国科学数据伦理政策, 总结其政策框架与内容, 并通过矩阵编码与社会网络分析方法揭示治理特征, 提出我国优化科学数据伦理治理的建议。[结果/ 结论] 研究发现, 伦理政策框架包括治理环境、主体与策略3 层面。伦理治理环境内容分为适用领域、适用主体、概念定义、问题分析与现有政策; 伦理治理主体内容涉及治理主体界定与促进主体协作; 伦理治理策略内容涵盖治理指导与各阶段治理措施。其治理特征有3 维度: 注重定义概念, 明确分配主体权责与促进协作, 全面厘定治理策略与加强伦理风险防控。据此提出4 条治理路径: 形成治理体系, 规范治理理论, 明确各方权责与协作方式, 细化各阶段治理措施。

关键词: 科学数据; 数据伦理; 数据治理; 政策分析; 英国

DOI:10.3969 / j.issn.1008-0821.2025.01.008

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821 (2025) 01-0112-12

随着数据密集型研究范式发展, 数据成为科研的关键资源与要素。推进科学数据伦理治理有助于规范科学数据的存储、再利用和价值开发[1] 。伦理包括“规制和道理”, 是对道德现象的哲学思考。伦理学常用于探讨道德责任义务, 评估道德价值与准则[2] 。数据伦理是伦理学的新分支, 其内容涉及研究和评估与数据、算法及相应的实践有关的伦理风险与道德问题, 以制定行为或伦理准则等解决方案[3] 。数据伦理亦指数据道德, 其规制范畴涉及数据安全风险、数据隐私泄露、数据所有权侵犯等问题[4] 。数据伦理治理被认为是不同主体为应对数据采集、利用、存储等过程中带来的伦理失范, 解决其中的数字鸿沟、数据滥用、数字身份、隐私泄露等问题,运用不同的政策、技术工具进行管理、规范并挖掘其价值的行为, 治理过程中需多方协调达成一致[5-6] 。科学数据伦理隶属于数据伦理, 旨在评估科研活动中的数据收集、共享和使用可能对人和社会产生不利影响的行为[7] 。同时, 科学数据伦理还涉及科技伦理内容。科技伦理是开展科学研究、技术开发等科技活动需遵循的价值理念和行动规范, 遵循增进人类福祉, 尊重生命权利、坚持公平公正、合理控制风险及保持公开透明的原则[8] 。参照以上概念,本研究认为科学数据伦理治理是多主体在分析治理环境基础上, 在收集、管理、使用与共享科学数据过程中运用政策规章、技术工具等规制伦理失范行为, 保障各主体免受数据技术侵害, 享有数据权利。科学数据伦理治理需制定数据伦理价值观念和行为规范, 确保各主体落实数据伦理责任, 享有数据权利, 从而维护科技伦理和科学道德。其中数据责任指尊重他人数据权利、保障数据安全合规、数据技术服务于人等。数据权利包括研究者的数据产权、控制权和受益权, 以及参与者的数据隐私权、数据控制权、自主权与受益权等。

国际组织及各国高度重视数据伦理治理, 发布系列相关政策文件。联合国发布《通用生物伦理与人权宣言》(Universal Declaration on Bioethics andHuman Rights 2005)、《关于COVID-19 的声明: 全球视野下的伦理声明》(Statement on COVID -19:Ethical Considerations from a Global Perspective 2022)等, 强调保障个人自主权, 确保隐私数据安全和合规使用。美国总务署(GSA)发布《数据伦理框架草案》(Draft of the Data Ethics Framework 2022), 强调在收集、管理或使用数据时保护公民自由、最大限度降低个人和社会的数据使用风险。英国中央数字和数据办公室更新《数据伦理框架》(Data Eth⁃ics Framework 2020), 规定奉行透明、问责、公平3 大数据伦理原则。德国成立数据伦理委员会, 强调尊重参与者权利、面向公共利益使用和分析数据等治理原则[9] 。我国也陆续发布《科学数据安全分类分级指南》《科学数据安全审计指南》《关于加强科技伦理治理的意见》等, 推动科学数据伦理治理, 指出治理体制机制不健全、制度不完善、领域发展不均衡等问题。

当前政策主要针对多类型数据提出了整体伦理指导, 多为纲领性和原则性规制, 并未基于科学数据伦理具体问题提出可操作规则或指南。不同于政府数据、企业数据及个人数据等类型, 科学数据伦理治理在数据特征、治理主体、治理过程及伦理内涵维度存在差异。数据特征上, 科学数据属于知识资产, 价值密度更高[10] , 绝大部分资助机构与出版机构规定研究项目数据公开共享[11] , 还因学科差异、获取与存储方式不同形成不同种类与结构。因此, 其伦理治理更注重平衡科学价值与数据权属。治理主体上, 科学数据伦理治理的核心主体为科研资助机构、科研院所等, 其伦理治理应注重主体角色划分与权责确定, 其关键治理对策也不同。治理过程中, 科学数据的收集、分析与开放具有非盈利性质, 治理中相对缺乏强制约束。这使其更需要完善的道德伦理规制, 加强对科学数据伦理的讨论与监管[12] , 根据科研项目需求细化伦理准则, 提升可执行度。伦理内涵上, 科学数据伦理较少关涉企业规章、行政条例, 需更多融入科研管理、科技伦理、数据伦理概念相关联内容。

本研究旨在探究科学数据伦理治理政策框架,分析其中涉及的内容主题与要素, 基于各主体治理重点归纳治理特征。本文以英国为例, 选取其政府、科研机构等多主体的科学数据伦理相关制度条例、政策文件、框架指南等多类型资料, 归纳政策框架,分析不同主体的政策重点, 揭示其治理特征并提出针对我国的治理路径。

1 相关研究

1. 1 数据伦理治理

研究聚焦数据伦理治理问题与对策两方面。一是探寻数据伦理治理存在的问题[13] , 基于领域数据治理实践揭示数据伦理问题与风险, 如指出政府数据伦理治理涉及数据收集、处理和应用3 个环节,需解决数据隐私与鸿沟等问题, 保障数据正义[14] 。认为智慧图书馆数据伦理风险包括损害读者隐私、降低读者信赖度、数据错误处理与滥用、算法歧视等[15] 。此外, 还关注其中的个人数据泄露[16] 、敏感数据安全[17-18] 等数据隐私、数据所有权分配[19] 、数据鸿沟[20] 等问题。二是针对伦理问题提出解决对策。如加强科研伦理审查的组织与能力保障[21] ,保障科学数据共享合规[22] 与科研中的个人数据隐私[23] , 加强人类学研究伦理规范与审查机制建设[24]及科研数据诚信与质量维护[25] 等。

1. 2 数据伦理政策

研究集中关注政策制定需求与具体内容。政策需求方面, 研究提出制定通用数据伦理规则和政策的重要性, 应对数据偏见、数据鸿沟、数据访问不公平等伦理困境[26] 。也有研究通过分析政策发展,提出政策制定应聚焦数据隐私保护和数据使用合规性等主题[27] 。政策内容方面, 研究揭示了医疗政策中的伦理范畴, 包括关系伦理、患者权利、医生权责等[28] , 强调了保障数据隐私、知情同意[29] , 建议制定数据自主权的保护指南[30] 。其中对科学数据伦理政策相关研究的关注则极为有限, 仅有研究分析数据管理政策中的伦理主题、治理规则[31] 与伦理权益[32] 。

总体来看, 现有研究从多视角探索科学数据伦理治理的问题及解决方案, 但仍存在不足。首先,对科学数据伦理治理面临的问题分析尚不全面, 多关注数据隐私, 对数据质量、数据偏见等伦理问题的分类和剖析有限。其次, 主要基于单主体或学科探讨治理实践与建议, 缺乏对多领域政策或多主体协作的详细分析, 较难形成完整的治理政策体系。最后, 科学数据伦理政策研究较为匮乏, 现有数据伦理研究的政策分析的粒度和深度有限。

2 研究设计与实施

扎根理论(Grounded Theory)被越来越多用于政策分析中, 能使研究者更准确地筛选分析样本, 探索理论概念[33] 。鉴于科学数据伦理治理的概念有待剖析, 以及研究样本的非结构化特征, 本研究采用此方法。研究分两阶段, 首先选取样本, 随后基于扎根理论开展定性文本分析, 参照程序化扎根理论研究过程[34] , 通过开放编码、主轴编码与选择编码三步进行文本分析, 归纳英国科学数据伦理政策的框架与内容, 随后基于编码结果使用社会网络分析法, 构建共现矩阵, 实现治理网络可视化, 揭示各主体政策的治理规划与重点, 明晰治理特征。

2. 1 样本选取

本研究选取英国作为研究对象, 有两方面原因,一是英国数据治理意识起源早且重视科学数据伦理。英国数据制度发展历程悠久, 完善程度较高。其数据法案可追溯到1984 年的《数据保护法》(Data Pro⁃tection Act), 且长期以来英国沿袭和发展着严密的欧盟数据保护政策体系[35] 。英国皇家学会(The Roy⁃al Society)调查报告也显示, 英国的科学数据制度相对完善且尤其重视科学数据伦理治理[36] 。二是英国作为英美法系典型代表, 以单行法律、法规和判例法为主, 加之数字经济水平较高[37] , 积淀了较丰富的执法经验与案例, 可供我国吸取其教训,参考其经验, 融通大陆法系与英美法系各自优势,进一步完善数据法治体系。

本文以英国科学数据治理的利益相关者颁布的政策、文件、指南等资料作为分析文本。利益相关者包括政府、科研机构、资助机构、出版机构、图书馆、数据库及第三方机构。在确定主体代表时,综合机构影响力、受认可度、可访问性、政策相关性等选择指标, 筛选出英国的政府主管部门、主要资助机构、QS 排名前五的高校及科研机构、全球排名50 强的出版机构、图书馆及第三方机构主要包括独立监察机构、数据公司与其他社会组织等。为保证查全率, 获取样本时, 在机构的官方网站检索标题或内容中检索含有“科学数据and 伦理”“数据and 伦理” “数据and 科研伦理” “数据or 科技伦理” 的内容, 相应英文词包括“Scientific Data、Research Data、Data、Ethics、Research Data、Tech⁃nology Ethics”, 再逐条进行筛选, 优先选取科学数据伦理专门政策, 若无专门政策则挑选内容中含有科学数据伦理的政策。最终获取来自35 个代表机构的78 份政策文本(截止时间为2023 年2 月24 日)。样本分布于2003—2023 年间, 统计最新修订时间可知, 68%的政策文件颁布于2018—2023 年间,30%的政策文件颁布于2018 年以前, 2%的政策文件未标注发布时间。各主体政策占比依次为政府(3%)、科研机构(24%)、资助机构(28%)、出版机构(6%)、图书馆(21%)、数据库(3%)及第三方机构(15%)。分析过程中按照政策颁布主体的英文首字母与数字确立各个政策的编号(如第一份政府发布的政策编号为G01), 浏览政策全文并从中筛选出科学数据伦理治理内容进行编码分析。

2. 2 开放编码: 识别政策概念与范畴

由两位科学数据与数据治理领域专家进行编码,通过试编码, 比较一致性, 并在编码过程中进行持续讨论和对比以提升编码可信度和质量。在开放编码阶段根据原文内容进行编码, 提取初始概念, 并进行初步范畴化。将78 份政策文本导入Nvivo12,逐条进行编码, 如表1 所示, 尽量用原文概念及词语标识内容。最初得到392 个初始概念, 选取出现频次为3 及以上的概念共206 个, 结合原文内容将初始概念归纳为11 个范畴, 如表2 所示。

2. 3 主轴编码: 归纳分析政策主范畴

在主轴编码阶段深入探析范畴与概念间关联,对比分析范畴、概念与原文, 提取主范畴。最终剔除部分单一概念, 分析初始概念与范畴间的逻辑关系来形成主范畴, 得到4 个主范畴, 19 个范畴和205 个初始概念, 如表3 所示。

2.4 选择编码: 形成治理政策框架

在选择编码阶段选取核心范畴与概念, 构建治理“故事线”, 厘清治理政策体系。基于主范畴挖掘核心范畴, 将所有范畴与概念串联构建出英国科学数据伦理治理政策框架, 如图1 所示。参考条件(环境或情境)、行动(研究对象及反应)和结果(行动的后果)的思路[39] , 其中参考条件指向科学数据伦理环境, 包括伦理治理理论内涵和其面临的情境,行动指向治理参与主体及其协作行为, 结果指向科学数据伦理治理措施。核心范畴遵循“环境—主体—数据” 的逻辑, 围绕科学数据伦理的治理环境、主体与策略展开。

2. 5 理论饱和度验证

两位编码员在编码过程中持续讨论与分析概念、范畴与主范畴, 比较其内容, 分析关联性。最后进行饱和度检验, 对预先随机抽出的未编码的8 份政策(文本编号为T07、F09、F20、R7、R18、L12、G02、D02)实施开放编码、主轴编码和选择编码,进行饱和度检验, 未发现新概念与范畴, 可以判定本政策框架具有较高理论饱和度。

2. 6 矩阵编码与社会网络分析

将编码内容转化为案例, 基于不同主体进行案例分类, 利用Nvivo12 的查询功能分析不同类型主体案例在治理环境、治理主体及治理策略三方面的编码参考点, 建立节点矩阵。随后将矩阵数据导入到Ucinet、Netdraw 中绘制治理网络结构图, 实现政策治理网络可视化。

3 英国科学数据伦理政策框架其政策框架

体现着英国科学数据伦理治理理念和实践, 分为治理环境、治理主体与治理策略3 个维度, 如图1 所示。其中: ①数据伦理治理环境意味着治理现状与情境, 包括对政策适用领域与主体的说明, 对数据伦理相关概念的定义、对现有政策的引用及对伦理问题的分析。②数据伦理治理主体包括治理主管机构、分管部门、协助机构及促进协作。③数据伦理治理策略分为治理指导与各阶段治理措施。治理指导主要包括数据伦理治理目标、原则、参考资源及常见问题。各阶段治理措施覆盖科学数据生命周期各阶段, 即准备与计划阶段、收集与获取阶段、合作与分析阶段、管理与保存阶段、数据共享与发布阶段及重用与引用阶段。

3. 1 治理环境

科学数据伦理治理环境是政策制定与执行的背景与情境, 包括适用领域与主体、概念定义、现有政策与问题分析5 方面内容。

1) 适用领域。说明面向的学科或专业领域, 介绍学科属性、数据特性及研究需求。如“为网络研究学者提供参考” (R16); “对于网络研究, 学者通常需要避免……等数据伦理问题” (R17); “探讨使用地理空间数据进行研究、分析和统计时的伦理考虑” (G02)。同时, 这些政策后续内容也具备领域特征, 如用于规范网络研究的政策强化了社交媒体规范, 用于规范地理空间研究的政策强调对可识别地址的保密。

2) 适用主体。对其重点面向主体进行针对性说明, 包括面向高校(L13)、科研机构(R02)、资助机构(R14)、出版机构(P01)、公共图书馆(L02)、高校图书馆(L16)以及政府数据部门(G01)等。如在英国政府颁布的数据伦理框架中明确规定了其面向政府和公共部门[40] , 限定了其适用范围和场景,提升其政策针对性和适用性。

3) 概念定义。阐释和定义数据伦理相关概念,明确治理的数据内容、数据主体、关键措施等。出现频次最高的概念依次为科学数据(L13)、科研人员(L08)、伦理(L11)、人类主体(R17)、个人数据(T10)与知情同意(R12)。如在高校科学数据政策中限定科学数据的内涵特征, 涉及的敏感数据范围等[41] , 以便后续进一步说明数据伦理治理措施。

4) 现有政策。援引现有政策、法律条例以说明与支撑数据隐私、知情同意权、数据版权相关规定。如引用《一般数据保护条例》(GDPR)、《英国数据保护法》(L13)以及《知识产权法》(L10)等政策中的数据权利保障相关内容。

5) 问题分析。基于治理情境和现状指出目前存在的数据伦理问题或治理困境, 如数据滥用(T10)、伦理界限模糊(T03)、数据鸿沟(T05)、数据偏见与歧视(G02)、数据交易与流通困难(F07)、多方权益协调困难(T03)、可用技术有限(T05)等。基于此类问题在政策文件中进一步提出解决措施, 如针对数据滥用问题, 主张设置知情同意程序与使用权限, 针对伦理界限模糊问题, 主张宣传推广与教育培训等[42] 。

3. 2 治理主体

治理主体包含对科学数据伦理治理职责分工与协同治理的探索。

1) 治理主体界定。针对不同主体作出指导和安排, 划分主管机构、分管部门与协作机构。主管机构为科研伦理审查委员会(R01, R15)与资助机构(R05, F10)。分管部门为数据伦理工作小组、数据治理工作小组或数据管理工作小组(R11), 细化到科研项目中分管人为课题负责人(T10)。协作机构则为数据中心(F18)、档案馆(R15)、图书馆等其他数据利益相关者(T04)。

2) 促进主体协作。说明主体间协作的推进方式。包括确定合作机构(L16)、各方达成治理共识(L13)、创建交流渠道(T06)、寻求多种合作方式(T04)、分配数据治理权责(T06)、形成共同标准与规则(T06)、共同参与数据伦理培训(R02)等。如帝国理工学院指出在伦理治理中存在学术协作、商业合作、慈善馈赠、采购外包等多类合作关系[43] ,强调推进对各类合作关系以推进伦理协作治理。

3. 3 治理策略

治理策略指围绕科学数据提出的伦理治理指导与具体措施。

1) 伦理治理指导

包括科学数据伦理治理目标、原则、常见问题以及参考资源。①治理目标指治理期望达成的效果, 包括数据伦理风险最小化(R02)、数据价值最大化及服务于公共利益(F15)。②治理原则引导治理行为, 主要集中于透明性原则(T08)、尊重人类主体(R17)、保密性原则(L13)、包容性原则(R11)、公平性原则(R06)、问责制原则(R18)及CARE 原则(T09)。③常见问题指实施治理面临的困难及其解决方法, 主要涉及数据匿名化方式(R17)、知情同意表格(R16)、数据保存期限(R17)、数据伦理审查程序(L05)、评估潜在伦理风险的方式(R17)。④参考资源则多见于政策最后的附录, 内容为参考文献(R05)、技术工具(L14)、实践案例(T03)、知情同意表模板(R13)、伦理风险自查清单(T02)及数据服务(L14)。

2) 各阶段治理措施

内容包括面向科学数据生命周期提出的具体措施, 分为6 个阶段。①准备与计划阶段, 包括提交伦理审查申请(R05)、征求伦理委员会建议(R03)及评估潜在的数据伦理风险(L10)。②数据收集与获取阶段, 常提及签署知情同意书(D02)、尊重数据所有权(R09)、获取数据访问许可(R18)、确定数据权属(R15)。③合作与分析阶段, 规定数据处理合规(T12)、避免数据偏见与歧视(G02)、数据匿名化处理(L14)、保障数据完整性(R11)、优化数据组织(L15)、寻求专家建议(R14)、完善数据保密(L09)。④管理与保存阶段, 强调选择可信的数据存储库(L09)、保障数据存储安全(L15)、确定数据保存期限(L10)、评估数据管理风险(T07)、评估数据保护效果(L16)、尊重数据删除权(R19)、建立数据审查与监护程序(F08)、设置数据授权机制(D02)、保障数据可移植权(T06)、允许更正个人数据错误(T10)、监测数据质量(D02)。⑤数据共享与发布阶段, 提出实现负责任的共享(P06)、保护数据隐私(T06)、落实FAIR 原则(L16)、实现合规的数据开放及获得数据开放许可(L08)。⑥数据重用与引用阶段, 提出规范数据引用(L04)、获得数据使用许可(L08)、合规使用数据(D02)、尊重数据使用撤回权(L15)、保障数据所有权(R15)、标注数据来源(R10)及实施数据使用培训(T02)。

4 英国科学数据伦理治理特征

通过分析英国科学数据伦理治理网络揭示其治理特征, 如图2 所示。方形节点代表治理主体, 三角形节点代表政策内容, 连线上及括号内的数字代表编码参考点数量, 参考点越多表明主体越重视此内容, 如适用领域内容在资助机构政策中具有12个编码参考点, 治理环境分析内容在所有政策中具有528 个编码参考点。

治理主体维度, 科研机构为核心治理主体(参考点为806 个, 占比36%), 其次是第三方机构(参考点为475 个, 占比21%)、资助机构(参考点为339 个, 占比15%)及图书馆(参考点为331 个,占比15%)。治理内容维度, 核心内容为提出各阶段治理措施(参考点为919 个, 占比42%)与分析治理环境(参考点为528 个, 占比24%)。

4. 1 注重定义治理概念与援引相关政策

英国各主体通过定义重要概念与引用相关政策来分析科学数据伦理治理环境。如图2 所示, 科研机构与第三方机构政策中更关注定义重要概念(参考点分别为57 个与40 个, 占比分别为41%与29%)。科研机构与图书馆政策中则更多引用现有政策(参考点分别为116 个与43 个, 占比分别为54%与20%)。

1) 定义概念: 界定治理对象、方式及工具

以科研机构与第三方机构为代表的主体注重在政策中定义科学数据伦理治理相关概念, 说明治理的数据内容、治理方式及治理工具相关术语。数据内容相关概念以“科学数据” “伦理” 及“个人数据” 为主, 用于界定治理的数据类型与伦理属性来阐述相应规定。治理方式相关高频概念为“知情同意” “数据信托” 与“数据匿名化”, 用以论述数据伦理治理涉及的典型措施。治理工具概念体现为“算法模型” “数据存储库” 及“唯一标识符”, 属于治理实施相关的工具、设施、平台等。科研机构政策中尤其重视阐释和界定“科学数据” 概念, 第三方机构则更注重说明“知情同意” 等治理措施相关概念。

2) 援引政策: 阐释治理的目标、原则与策略

以科研机构与图书馆为代表的主体注重在政策内容中引证已有政策法令, 解释说明治理目标、原则及具体策略。治理目标与原则方面, 引用伦理相关经典政策, 如《贝尔蒙报告》等被提及, 阐释“尊重人、公正、自由、自主、有利、平等” 等治理目标及原则, 凸显其指南的合法合规。治理实施策略方面, GDPR 及机构数据权利制度等数据保护相关政策被更多引用, 提出和强调“知情同意” “数据匿名化” 等具体治理措施, 并借此补充政策内容与规定。

4. 2 明确分配治理主体权责与促进协作

各主体的政策之中充分界定了治理主体, 注重分配各机构治理权责, 探寻促进治理协作的方式。在图2 中, 科研机构与资助机构更注重划分治理主体, 分配治理权责(政策参考点均为76 个, 占比为42%)。第三方机构更关注促进治理协作(政策参考点为33 个, 占比为55%)。

1) 明确治理权责

以科研机构与资助机构为代表的主体注重规定主管机构、分管部门及协助机构的权责。重点安排主管机构的职责分工, 尤其强调伦理委员会的主导作用, 并规定其通过制定指南、执行伦理审查来履行治理职责。分管部门多是机构下设的数据伦理工作小组或科学数据管理小组, 负责提供数据伦理审查服务。针对协助机构, 仅提及其作为合作伙伴支持数据伦理规范与监察, 较少对其进行具体权益协调与职责安排。

2) 促进治理协作

第三方机构更关注治理协作, 从跨机构、跨学科与跨部门三方面进行探索。跨机构协作需实现“共同控制与拥有数据” “达成治理共同规则与标准” 与“形成数据治理框架”。跨学科协作强调应“合规地共享数据以推进多学科与多类项目的协作”。跨部门协作强调“促进沟通” “统一各部门数据收集、分析与存档的标准” 等。

4. 3 全面厘定治理策略与加强风险预防

治理策略厘定是英国科学数据伦理政策中的核心内容, 更多见于科研机构、第三方机构及图书馆为代表的主体治理政策中。治理策略主要包括提供治理指导与各阶段治理措施, 其中各阶段治理措施更受重视, 总计参考点为919 个, 占比为42%, 如图2 所示。

1) 提供详实的治理指南

治理指南中包含治理原则和参考资源, 主要由科研机构与第三方机构制定。治理原则以人权法案、GDPR 等为参考, 包括“公平公正” “知情同意” “CARE 原则” 等。参考资源以文献、知情同意书模板、伦理评估量表、数据服务申请等为代表,指导解决常见的数据伦理问题, 辅助负责人评估和考量伦理风险, 实现数据采集、处理、共享与使用合规。

2) 重视预防与规避伦理风险

在科学数据生命周期中, 准备与计划阶段措施最受重视, 参考点为204 个, 科研机构、第三方机构与图书馆政策规定“提交伦理审查表” “评估潜在伦理风险” 及“咨询伦理委员会” 等, 体现其更注重在项目开展前预防与规避数据伦理风险。其次为共享与发布阶段措施, 参考点为181 个, 科研机构、出版机构与数据库的政策强调“负责任地共享数据” “贯彻FAIR 原则” 及“保护数据隐私”等。此外, 管理与保存阶段措施(参考点为152 个)和收集与获取阶段措施(参考点为118 个)受到一定关注。针对管理与保存, 图书馆、出版机构与数据库的政策提出“保障数据安全” “评估管理风险”及“设置授权机制” 等。针对收集与获取, 科研机构政策集中阐释“获取知情同意” 与“确定数据版权归属”。

5 我国科学数据伦理治理路径

经笔者调研, 北大法宝数据库中包含数据治理、数据伦理内容的法律法规、政策规章达2 200余条,可见数据治理与伦理已引起我国重视。我国陆续颁布了科学数据伦理治理相关政策。相关政策内容集中在数据安全、数据权益保障、科技伦理方面。涉及数据安全的法律法规有130 余条, 如《科学数据管理办法》中强调科学数据分级管理与安全可控;《数据安全法》中强调数据存储安全、数据合规使用、实现数据价值等。涉及数据权益保障的中央法规有140 条, 如《科学数据管理办法》中规定规范数据收集、使用、管理实践, 保障各方数据权利;《关于构建数据基础制度更好发挥数据要素作用的意见》中强调个人数据保护。涉及科技伦理的法律法规有40 余条, 如《关于加强科技伦理治理意见》中规定数据分级分类管理、合规高效流通、保障数据权益等; 《新一代人工智能伦理规范》要求公平公正, 保障个人隐私与数据安全; 《科技伦理审查办法(试行)》强调对涉及数据与算法的科技活动应遵守现有数据安全和个人信息保护规定。

总体来看, 我国主要通过数据治理、科学数据管理、科技伦理等相关政策推进科学数据伦理治理,暂未出台专门的数据伦理框架或指导方针。而且目前政策重点在于数据安全、有序管理、数据利用与价值实现等, 伦理规制内容相对有限[44] 。我国治理政策具有以下特征: ①科学数据伦理内容丰富但分散。科学数据管理、数据治理、科技伦理等相关制度政策内容充足, 但科学数据伦理治理相关规定分散于其中。②对科学数据伦理理论内涵的界定尚不明晰。虽有涉及伦理的规章制度, 但尚未细化科学数据伦理理论与内涵。③提出科学数据伦理治理主体, 但其协同方式尚待探寻。④提供纲领性科学数据伦理治理指导, 但未针对科学数据生命周期各阶段细化治理措施与方法。因此, 我国科学数据伦理治理存在专门制度缺失、伦理内涵不明、主体协同不足及具体方法待探寻的突出问题, 可从以下路径推进治理实践。

5. 1 构建伦理治理体系: 形成科学数据伦理治理专门政策

应整合科学数据伦理在数据安全、数据权益、科技伦理、科学数据管理等方面的制度内容, 并出台科学数据伦理专门政策, 形成完善的治理体系。当前我国科学数据伦理内容分散于各类政策中, 不利于进行全面的伦理规制指导和规制。可参考英国各类机构出台的《研究伦理伦理指导》《伦理准则》类指南, 出台专门数据伦理治理框架, 并在其中引用现有法律法规、政策文件, 从而将《数据安全法》《新一代人工智能伦理规范》《科学数据管理办法》等相关制度中的数据安全、数据权益、数据隐私、科技伦理等内容关联整合, 推动形成完善的科学数据伦理治理专门政策。

5. 2 达成伦理治理共识: 统一规范科学数据伦理理论内涵

应推动科学数据伦理治理中的各类型主体在治理理论内涵上达成共识。政府主体应出台纲领性的数据伦理框架或指南以推动各类机构关注和认同数据伦理问题和理论概念, 从而推进科学数据伦理治理实践。目前我国科学数据伦理规定分散于各类制度中, 各类主体对科学数据伦理理论概念尚未形成共识, 不利于规范科学数据治理实践。应出台如英国的《数据伦理框架》类的纲领性的数据伦理指导文件, 从数据伦理层面落实和规范科学数据伦理的内涵与定义, 促使各方在治理中形成共同理解。此外, 在各类主体或机构内部也应出台指导文件, 参照英国各主体在其伦理政策中对重要治理概念的规范, 在机构内科学数据管理政策或项目审查规定中阐明本机构或本学科内的“科学数据” “数据伦理”“个人数据” “敏感数据” “知情同意” 等重要概念内涵和治理规定, 为数据伦理治理提供参考。

5. 3 共治共享科学数据: 明确各责任主体的权责与促进协作

应通过政策法律界定和划分各主体的职责与权利, 并探索实现协同治理。我国当前政策虽界定了高校、科研机构、医疗卫生机构、企业等科技伦理审查管理的责任主体, 但并未对其职责进一步细分,对其协作方式尚待探索, 可参考英国政策中对主管机构、分管部门与协作机构的细化权责划分。我国在《科技伦理审查办法(试行)》《科学数据管理办法》等相关政策中也可将中央科技部、科技伦理审查委员会等作为统筹主体, 完善现有科学数据伦理审查标准, 指导并安排中科院、社科院、高校研究所等各机构的办事处的科学数据伦理审查工作, 科研人员也应自觉根据机构政策规章上报项目伦理审查, 推动形成更完善的科学数据伦理治理协作网络。同时, 各责任主体如高校、科研机构、企业等内部应专设数据伦理小组, 辅助数据伦理审查业务, 推动各类角色在数据伦理治理中各司其职, 共同开展合法合规的科学数据管理实践, 推动实现科学数据的使用合规化和价值最大化。

5. 4 细化伦理治理措施: 尤其注重事前评估与审查风险

应针对科学数据生命周期各阶段厘定可操作的科学数据伦理治理措施, 尤其应将治理重心放在科研项目的准备与计划阶段, 加强事前审查, 防控潜在的科学数据伦理风险。当前我国可参照英国政策细化各生命周期阶段的科学数据治理措施。英国政策中尤其强调“项目开展前提交伦理审查申请” “征求伦理委员会建议” 及“评估潜在的数据伦理风险”。在准备与计划阶段, 我国应充分建立起科研项目的数据伦理审查与监护程序, 在《科技伦理审查办法》《数据伦理框架》等制度中明确伦理审查申请要求, 并通过伦理委员会、数据伦理小组等机构实施事前报备、评估与审核, 事中监测风险以及事后总结经验, 指导各个科研项目团体及个人合规开展科研活动, 及时防控风险。在数据收集与获取、合作与分析、管理与保存、共享与发布、重用与引用阶段也可融入数据分级分类管理、数据访问授权、保障个人隐私、划定数据产权等现有措施加以规范,形成更稳固和完善的科学数据伦理治理流程。

6 结 语

数据密集型科研中的数据伦理问题日渐受到重视, 数据隐私、数据保护、数据安全及算法歧视等问题亟待解决, 对科学数据治理提出更高要求。本文基于扎根理论与社会网络理论分析英国科学数据伦理政策文本, 总结政策框架, 梳理各方在环境分析、主体界定及策略厘定方面的治理重点, 揭示其科学数据伦理治理特征, 提出我国科学数据伦理治理路径。研究发现, 英国科学数据伦理治理注重发挥科研机构、资助机构及图书馆等重要主体的作用,从环境、主体与策略三维度构建治理体系。在治理环境上, 厘清科学研究领域、涉及主体、核心概念、关键问题及相关政策。在治理主体上, 重视安排主管机构、分管部门及协助机构的权利与职责, 促进多主体合作, 并探索协同治理方式。在治理策略上,阐明治理目标原则, 提供治理参考资源与工具, 构建全面系统指导体系, 落实科学数据全生命周期治理措施, 注重在准备与计划阶段预防与规避伦理风险与问题。但同时, 英国对于后续惩戒和救济规定也有所缺失。我国可参考其经验与教训, 推动形成科学数据伦理治理体系, 各方就科学数据伦理治理理论内涵达成共识, 推进划定各方伦理治理权责与协作治理, 细化各阶段科学数据伦理治理措施并完善惩戒和救济措施。本研究从分析深度和粒度上推进了科学数据伦理政策分析研究, 基于此深入剖析数据伦理各类问题, 为多领域主体协同参与数据伦理治理与确定治理重点提供思路。但也存在部分政策无法访问或未将所有机构政策纳入分析的局限性,未来可全面获取所有机构的数据文本, 从政策计算的量化角度进行全局分析, 进一步深化政策分析的覆盖度与深度。

参考文献

[1] Clark K, Duckham M, Guillemin M, et al. Advancing the Ethi⁃

cal Use of Digital Data in Human Research: Challenges and Strate⁃

gies to Promote Ethical Practice [J]. Ethics and Information Tech⁃

nology, 2019, 21: 59-73.

[2] 胡良霖, 朱艳华, 李坤, 等. 科学数据伦理关键问题研究[J].

中国科技资源导刊, 2022, 54 (1): 11-20.

[3] Florid L, Taddeo M. What is Data Ethics? [J]. Philosophical Trans⁃

actions of the Royal Society a-Mathematical Physical and Engineering

Sciences, 2016, 374 (2083): 1-5.

[4] 牛奔, 耿爽, 王红. 数据科学导论[ M]. 北京: 中国经济出

版社, 2022: 213-216.

[5] 陈一. 欧盟大数据伦理治理实践及对我国的启示[J]. 图书情

报工作, 2020, 64 (3): 130-138.

[6] 李卓卓, 张楚辉. 数据伦理框架: 国际对话与中国化的构建路

径[J]. 情报学报, 2024, 43 (2): 154-166.

[7] ODI. COVID - 19 Identifying and Managing Ethical Data Issues

[R]. London: Open Data Institute, 2020.

[8] 中共中央办公厅. 国务院办公厅印发《关于加强科技伦理治

理的意见》[EB / OL]. https: / / www.gov.cn/ zhengce/2022-03/

20/ content_5680105.htm, 2024-01-29.

[9] Data Ethics Commission. The opinions of the Data Ethics Commis⁃

sion 2020 [ EB/ OL]. https: / / www. bmj. de/ SharedDocs/ Down⁃

loads/ DE/ Themen/ Fokusthemen/ Gutachten_DEK_EN_lang.pdf?_

blob=publicationFile&v=3, 2023-08-01.

[10] Gariga-Portola M. Open Data? Yes, But in a Sustainable Way

[J]. Professional de la Information,, 2011, 20 (3): 298-303.

[11] 顾立平, 李海博, 陆彩女. 开放科学的标准规范研究[J/ OL].

中国图书馆学报: 1-28 [2023-10-12]. http:/ / kns.cnki.net/ kc⁃

ms/ detail/11.2746.g2.20230330.1250.002.html.

[12] 顾立平. 科研模式变革中的数据管理服务: 实现开放获取、

开放数据、开放科学的途径[J]. 中国图书馆学报, 2018, 44

(6): 43-58.

[13] 陈一. 网络研究中的数据伦理问题研究进展[ J]. 信息资源

管理学报, 2019, 9 (2): 58-65.

[14] 林曦, 郭苏建. 算法不正义与大数据伦理[ J]. 社会科学,

2020, (8): 3-22.

[15] 刘颖. 智慧图书馆中的数据伦理风险识别及利益协调策略研

究[J]. 新世纪图书馆, 2021, (12): 11-15, 27.

[16] Martin K D, Murphy P E. The Role of Data Privacy in Marketing

[J]. Journal of the Academy of Marketing Science, 2017, 45 (2):

135-155.

[17] 宋晶晶. 由信息伦理向数据伦理转型: 溯源、驱动与路径

[J]. 图书馆学研究, 2020, (3): 35-39, 60.

[18] 苏令银. 大数据伦理: 研究现状、未来议题与政策建议[J]. 新

疆师范大学学报(哲学社会科学版), 2020, 41 (3): 100-110.

[19] Mittelstadt B D, Floridi L. The Ethics of Big Data: Current and

Foreseeable Issues in Biomedical Contexts [J]. Science and Engi⁃

neering Ethics, 2016, 22 (2): 303-341.

[20] 温亮明, 张丽丽, 黎建辉. 大数据时代科学数据共享伦理问

题研究[J]. 情报资料工作, 2019, 40 (2): 38-44.

[21] 李建军, 王添. 科研机构伦理审查机制设置的历史动因及现实

运行中的问题[J]. 自然辩证法研究, 2022, 38 (3): 51-57.

[22] Peter P, Igor B, Henrike F J, et al. Data Management in Anthro⁃

pology: The Next Phase in Ethics Governance? [J]. Social Anthro⁃

pology, 2018, 26 (3): 391-413.

[23] 刘金亚, 顾立平, 张潇月, 等. 开放科研数据环境下科研人员

的数据伦理框架研究[ J]. 情报理论与实践, 2021, 44 (2):

83-89.

[24] Lamas E, Barh A, Brown D, et al. Ethical, Legal and Social

Issues Related to the Health Data-warehouses: Re-using Health

Data in the Research and Public Health Research [ J]. Studies in

Health Technology and Informatics, 2015, 210: 719-723.

[25] Smedley R M, Coulson N S. A Practical Guide to Analyzing Online

Support Forums [ J]. Qualitative Research in Psychology, 2021,

18 (1): 76-103.

[26] Chen W, Haase A Q. Big Data Ethics and Politics: Toward New

Understandings [ J]. Social Science Computer Review, 2020, 38

(1): 3-9.

[27] Spithoff S, Stokdale J, Rowe R, et al. The Commercialization of

Patient Data in Canada: Ethics, Privacy and Policy [ J]. CMAJ,

2022, 194 (3): 95-97.

[28] Saheb T, Carpenter D. Mapping Research Strands of Ethics of Artifi⁃

cial Intelligence in Healthcare: A Bibliometric and Content Analysis

[J]. Computers in Biology and Medicine, 2021, 135 (3): 1-19.

[29] Masui T. Lecture No 5 Impact of Human Genome Research:

“Policy and Ethics”—Its Meaning in Data Sharing [ J]. Japanese

Journal of Clinical Oncology, 2021, 51 (1): 21-23.

[30] Stewart E, Lyons E. When the Classroom Becomes Datafied: A

Baseline for Building Data Ethics Policy and Data Literacies Across

Higher Education [ J]. Italian Journal of Educational Technology,

2021, 29 (2): 54-68.

[31] 刘金亚, 谌悦, 章成志, 等. 数据伦理政策的量化研究: 基

于天文领域的数据管理办法[J]. 信息资源管理学报, 2021, 11

(6): 63-75.

[32] 王英. 国外社会科学数据档案馆政策要素及其主体责任[ J].

档案学研究, 2022, (2): 110-119.

[33] Charmaz K, Thornberg R. The Pursuit of Quality in Grounded

Theory [J]. Qualitative Research in Psychology, 2021, 18 (3):

305-327.

[34] Strauss A, Corbin J. Basics of Qualitative Research: Grounded

Theory Procedures and Techniques [M]. Thousand Oaks: Sage Pub⁃

lications, 1990.

[35] 张涛, 崔文波, 刘硕, 等. 英国国家数据安全治理: 制度、机

构及启示[J]. 信息资源管理学报, 2022, 12 (6): 44-57.

[36] The Royal Society. The UK Data Governance Landscape [ EB/

OL]. https: / / royalsociety. org/ -/ media/ policy/ projects/ data - gov⁃

ernance/ uk-data-governance-explainer.pdf, 2024-02-09.

[37] 中国信息通信研究院. 全球数字治理白皮书(2022) [EB/ OL].

http:/ / www.caict.ac.cn/ kxyj/ qwfb/ bps/202301/ t20230110_413920.

htm, 2024-02-22.

[38] JISC. Research Data Management Toolkit [ EB/ OL]. https: / /

www.jisc.ac.uk/ guides/ rdm-toolkit, 2024-02-23.

[39] 凯西·卡麦兹. 建构扎根理论[M]. 重庆: 重庆大学出版社,

2009: 77-78.

[40] UK Central Digital and Data Office. Data Ethics Framework [EB/

OL]. https: / / www. gov. uk/ government/ publications/ data - ethics -

framework, 2024-02-27.

[41] The University of Edinburgh. Research Ethics and Data Protection

Briefing Note [ EB/ OL]. https: / / www.ed.ac.uk/ files/ atoms/ files/

briefingnote_-_data_protection-research_ethics_chss_11_02_16.pdf,

2024-02-23.

[42] The University of Edinburgh. Research Ethics and Integrity [EB/

OL]. https: / / www.ed.ac.uk/ arts-humanities-soc-sci/ researchke/

res-ethics-policies/ ethics, 2024-02-27.

[43] Imperial College London. An Ethics Code [ EB/ OL]. https: / /

www.imperial.ac.uk/ media/ imperial-college/ research-and-innova⁃

tion/ public/ research-integrity/ Ethics-Code.pdf, 2024-02-27.

[44] 肖红军, 阳镇. 数字科技伦理监管的理论框架、国际经验与

中国借鉴[J]. 东北财经大学学报, 2023, (5): 47-61.

(责任编辑: 杨丰侨)

猜你喜欢

政策分析数据治理英国
英国的环保
欧盟同意英国“脱欧”再次延期申请
英国圣诞节
基于本体的企业运营数据治理
云端数据治理初探
关于研究生淘汰制实施成效的政策反思
随迁子女异地高考政策研究
在纠结中前行的网约车改革
基于广州流动儿童的城乡居民基本医疗保险政策探究
大数据治理模型与治理成熟度评估研究