APP下载

负责任的社会科学数据治理的内涵、特征与层次

2025-01-04王英卢国强

现代情报 2025年1期
关键词:数据治理

摘 要: [目的/ 意义] “十四五” 国家哲学社会科学发展规划的背景下, 负责任的数据治理成为促进社会科学数据开放共享、推进社会科学研究与创新的重要驱动力, 亟须探索负责任的社会科学数据治理的基础理论。[方法/ 过程] 运用主题分析法, 探寻负责任的数据治理的概念要素及维度, 按照国际标准ISO704:2009 的概念关系, 结合社会科学数据的特性, 阐释负责任的社会科学数据治理的内涵及其与相关概念的关系、特征、层次与内容, 旨在构建一个较为全面且系统的概念体系。[结果/ 结论] 负责任的社会科学数据治理是多元主体在现有的数据治理环境之下, 运用相应的治理机制和手段, 将负责任的研究与创新的理念和原则融入社会科学数据全生命周期, 以确保所有涉及社会科学数据的流程和成果的责任性的过程, 具有责任性、反思性、前瞻性、开放性和工具性特征, 可划分为战略层、数据层和活动层。

关键词: 社会科学数据; 负责任的数据治理; 数据治理

DOI:10.3969 / j.issn.1008-0821.2025.01.009

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821 (2025) 01-0124-11

近年来, 社会科学领域频繁出现成果可复制性低、数据质量可信度低、受试者和地点未匿名、研究参与者受到伤害、数据处理不透明、伪造篡改实验数据等问题研究行为和科研不端行为, 比如, 哈佛大学研究Facebook 的社会学家未能对受试者姓名进行匿名, 澳大利亚实验心理学家复制斯坦利·米尔格拉姆的研究给参与者带来长期痛苦, 美国历史学家和荷兰社会心理学家参与捏造和伪造数据, 北京大学的人类学家因剽窃而受到谴责等[1] 。有一种观点认为, 科研诚信问题在社会科学领域甚至可能比在自然科学领域更为普遍[2] 。随着数据密集型研究范式的普及, 数据问题已然成为社会科学领域科研诚信问题的重要表征。这不仅影响数据重用, 还可能引发科学交流危机。已有研究显示, 当前社会科学数据很少被重用[3] , 主要是因为重用者对社会科学数据的信任度不高[4] 。社会科学数据与基于现场或实验室的其他科学数据不同, 涉及人类的直接或间接互动, 引发了关于共享和重用这些数据的伦理问题, 特别是关于定性数据。由于人类参与社会科学研究, 因此存档和共享数据需要确保保密性和匿名性。此外, 在社会科学中, 具有特殊权重的数据质量担忧[5] 以及在数据存储前通常缺乏数据验证、质量检查和伦理审查[4] 的做法, 更进一步加剧了对社会科学数据的不信任。而信任的建立来自全数据生命周期, 而非某一阶段。因此, 引入“负责任的社会科学数据治理” 的概念, 将“负责任的研究与创新” (以下简称RRI)原则融入社会科学数据治理结构和流程, 旨在确保社会科学数据从生成到开放共享等全流程都负责任, 以取得公众的信任。

需要澄清的是, 引入“负责任的社会科学数据治理” 并不意味着其他数据治理都是不负责任的。在复杂的情况下, 例如涉及数据用户和利益相关者、数据类型和数量, 以及数据处理和分析技术等多个维度的情况下, 任何个人或单一学科都难以完全理解与数据治理相关选择的潜在含义和后果, 因此,强调负责任的数据治理是非常必要的[6] 。相较于(自然)科学数据治理, 社会科学数据治理更具复杂性,主要表现为: 社会科学数据的生成源于对社会现象的研究, 数据复杂敏感; 社会科学数据获取主观性强, 数据质量难以保障; 社会科学数据权属关系模糊, 难以确定责任主体; 社会科学数据治理主体多元, 期望与素养不平衡。由此带来的伦理、法律和社会等方面的影响愈加复杂多样, 强调“负责任的社会科学数据治理” 就变得尤为重要。现有社会科学数据的研究主要涉及跨学科性[7] 和其他特征[8] 以及数据管理平台[9-10] 等, 然而, 关于负责任的社会科学数据治理的理论研究不多, 迫切需要探索其内涵、特征及理论范畴, 以形成具有普适性的基础理论研究成果, 适应社会实践的发展需求。因此, 本文将分析负责任的社会科学数据治理的概念要素及其关联, 明确其内涵, 阐述与相关概念的关系, 夯实负责任的社会科学数据治理研究的基础概念, 并进一步阐释负责任的社会科学数据治理的特征、层次与内容, 明晰其基本理论范畴。

1 负责任的社会科学数据治理的概念解析

“负责任的数据治理” 强调管理和使用数据的合法、公平、透明、安全和隐私保护。负责任的社会科学数据治理就是将这一理念应用于社会科学领域的产物。目前对“负责任的数据治理” 以及社会科学数据治理的研究并不多见。因此, 为了促使人们正确理解负责任的社会科学数据治理, 本文首先提取“负责任的数据治理” 的概念要素; 其次, 运用主题分析法归纳其概念维度并梳理它们之间的关联; 最后, 将这些概念维度及其关联迁移到社会科学领域, 阐释“负责任的社会科学数据治理” 的概念内涵, 并对其与相关概念之间的关系进行辨析,旨在构建一个更全面系统的“负责任的社会科学数据治理” 概念体系。

1. 1 概念要素抽取

依照概念构建法, 以“负责任的数据治理” 为检索词在中国知网和维普数据库进行全文、主题和篇关摘检索, 获得文献15 篇; 以Responsible∗ Da⁃ta Governance 为检索词在Web of Science、Elsevier、Emerald、EBSCO、Wiley、Google Scholar 等数据库及搜索引擎进行标题检索, 获得文献25 篇。经逐一阅读去除重复引用、同一作者重复表述、未进行扩展的概念表述, 筛选并整理出关于“负责任的数据治理” 的概念文本30 个, 检索时间为2024 年1 月29 日。对其编码后提取出中文概念要素59 项、英文概念要素155 项。为探寻“负责任的数据治理”可能的概念维度, 运用Nvivo 软件对概念要素进行词频统计, 运用Finebi 绘制词云图, 如图1 所示,对参考点进行数量统计以获知各概念维度的参考点分布情况, 作为概念构建的基本依据。

参照Braun V 等[11] 的主题分析框架并根据实际需要调整分析步骤, 形成适用于本文的主题分析框架, 如图2 所示。依此步骤, 笔者从文献中挖掘“负责任的数据治理” 的概念要素。根据概念要素的共性, 归纳得出负责任的数据治理的7 个概念维度: 数据治理现状、负责任的数据治理理论、负责任的数据治理愿景、数据治理组织架构、数据治理环境、数据治理域、数据治理流程与活动, 识别并描述这些概念属性, 将其归入解释性类别, 如表1所示。

1. 2 概念要素的关系

概念要素在同一概念框架中相互共生, 并存在着密切的关联。根据国际标准《术语工作: 原则与方法》(ISO704:2009)中概念关系(即整体—部分关系、种属关系、关联关系)的识别方法[12] , 可以将数据治理现状、负责任的数据治理理论、负责任的数据治理愿景、数据治理组织架构、数据治理环境、数据治理域、数据治理流程与活动等“负责任的数据治理” 概念要素的相互作用阐释为: 当前数据治理面临着问责、伦理、知识产权、人权、所有权、隐私、社会和技术等方面的问题与挑战。因此,有必要将RRI 作为指导理论, 将其AREA 框架(即预期、反思、包容和响应[13] )融入数据治理流程和结构中, 旨在创建一个强调数据治理的责任意识、确保数据的负责任使用并追求数据研究与创新的良好数据生态系统。为实现负责任的数据治理这一愿景, 需要设计科学合理的数据治理组织架构, 涵盖数据主体、学者、公众、伦理评审委员会、数据保护当局、数据治理工作组、ICT 专家、法律专家、政府、同行机构、政策制定者等, 并配置数据治理责任, 包括伦理责任、法律责任、社会责任、元责任、分布式或共享式责任等, 以维护数据所有权、数据隐私权、人权、保护个体免受入侵的自由, 以支持并提升负责任的数据治理的实施效果; 同时,需要国家立法机关及相关行业组织制定维护数据责任的法律和标准, 还需要利用数据仓储、门户、平台和档案馆、利益相关者映射工具等技术手段, 共同营造一个有序的数据治理环境。为确保数据的可用性、质量、伦理性和安全性, 需要在整个数据生命周期中开展责任分配、治理主体对话、数据治理政策和原则、数据治理协定、责任影响评估、数据治理结果反馈、合规性检查、数据治理记录、数据信托、专门的研讨会和教育活动等数据治理活动。综上可知, “负责任的数据治理” 本质上是一种系统性、整体性的负责任的数据治理活动。

1. 3 概念内涵解析

按照《术语工作: 原则与方法》概念间的“种属关系” 划分, “负责任的社会科学数据治理” 与“负责任的数据治理” 就属于此类关系。“负责任的社会科学数据” 作为下位类, 继承了“负责任的数据治理” 的全部属性及性质。由此, “负责任的社会科学数据治理” 的内涵可表达为: 为创建一个良好的数据生态系统, 需要以强化数据治理责任意识、确保数据的负责任使用和追求社会科学研究与创新的可持续发展为目标, 在现有的数据治理与数据保护制度、数据标准、数据技术及其基础设施共同营造的数据治理环境中, 多元数据治理主体通过采取责任分配、治理主体对话、数据治理政策和原则、数据治理协定、责任影响评估、数据治理结果反馈、合规性检查、数据治理记录、数据信托、专门的研讨会和教育活动等机制和手段, 将RRI 理念融入社会科学数据的生命周期全过程, 以确保社会科学数据可用性、数据质量、数据伦理、数据诚信、数据安全的活动。简言之, 负责任的社会科学数据治理就是在现有的数据治理环境中, 将RRI的理念与原则融入社会科学数据的整个生命周期,多元主体通过运用适当的治理机制和手段, 确保社会科学数据的流程和结果具有责任性。

负责任的社会科学数据治理可以被视为社会科学数据治理活动的高级阶段, 其是负责任的数据治理与一般的社会科学数据治理耦合的结果, 更加注重多元主体参与并确保社会科学数据治理流程及结果的责任性。其中, 负责任的社会科学数据治理流程, 能够有效解决社会科学数据的敏感性、个人化及其对时间和情境的依赖性等特征可能导致的欠缺责任性问题; 负责任的社会科学数据治理结果, 更关注社会科学数据在推动社会科学研究和学科发展以及促进社会发展和创新中的支持作用。

1. 4 相关概念辨析

按照《术语工作: 原则与方法》概念间的“关联关系” “一般的数据治理” 和“数据协同治理”等概念与“负责任的社会科学数据治理” 在实践中存在密切的主题关联。

1) 与一般的数据治理的关系

数据政治强调“数据的执行力”, 将数据视为“投资对象”, 能够表征和生成新权力关系的力量。数据政治既关注数据主体如何治理数据, 也关注如何承认和主张自己的权利并积极参与数据政治[14] 。数据治理可以被理解为是对数据管理的权力和控制的行使, 旨在指导信息相关过程的决策权和责任系统, 以确保数据质量和遵从性要求, 利用数据创造公共价值[15] 。

负责任的社会科学数据治理和一般的数据治理在将数据视为资产、强调数据的流动和恰当使用上有共通之处。然而, 二者在范围和理论视角上存在明显区别: 负责任的社会科学数据治理专注于社会科学领域, 通过增强社会科学数据的责任性释放其价值。相较之下, 一般数据治理适用于不同领域和组织, 关注解决数据处理方式可能导致的权力不平衡, 保护数据主体权益。此外, 负责任的社会科学数据治理的基础理论是RRI, 更注重参与者的反思性和对未来影响的考虑, 与一般数据治理的基础理论数据政治有所不同。

2) 与数据协同治理的关系

“协同治理” 的概念源于“协同论”, 强调不同系统或主体间的相互影响和合作, 通过内部协同,自发地出现时间、空间和功能上的有序结构[16] 。在学科融合发展态势愈发明显的今天, 协同论被广泛应用于跨地域、跨机构、跨部门的治理活动中以寻找最优治理模式。由此, 协同治理的概念应运而生。它将多个利益相关者聚集在不同公共机构的公共空间中, 推进以共识为导向的决策治理模式[17] 。“数据协同” 是一个相对较新的术语, 强调跨部门(公私)协同举措以应对社会挑战, 旨在将数据和协作结合以创造新的价值, 超越每个参与者的直接目标、能力和逻辑[18] 。数据协同治理可定义为通过一种决策和管理的过程与结构, 人们可以建设性地参与数据驱动的活动, 跨越公共机构、各级政府和/ 或公共、私人和公民领域的边界, 以实现社会目的[19] 。

负责任的社会科学数据治理和数据协同治理都关注多个利益相关者之间的合作和协调, 进行跨部门和跨领域的合作与治理活动, 以实现有效的数据管理。然而, 它们在理论基础和关注点上存在不同:数据协同治理的概念源于协同论, 注重系统和主体之间的相互影响与合作。负责任的社会科学数据治理整合了RRI 的理念与原则, 强调对社会科学数据的负责任管理, 确保数据流程和工作流程按照高标准进行开发和维护。

2 负责任的社会科学数据治理的特征

根据RRI 理论的AREA 框架, 责任性是本质,反思性和前瞻性构成负责任的社会科学数据治理的重要行动框架。因此, 责任性、反思性和前瞻性是其特征之一。从概念要素角度看: ①数据治理组织架构要求多领域的主体参与, 需要保持社会科学数据治理全流程的开放性, 以确保各主体履行相应责任的效力; ②数据治理域要求数据治理的透明性和可追溯性, 这以开放性为基础。因此, 开放性是其特征之一; ③数据治理流程与活动本身可被视为一种工具, 提供了全程管理和保护社会科学数据的方法和手段, 促进负责任的社会科学数据治理愿景的实现。因此, 工具性亦是其特征之一。综上所述,负责任的社会科学数据治理的特征包括责任性、反思性、前瞻性、开放性和工具性。

2. 1 责任性

责任性是指人们对责任和义务的自觉意识与主动承担, 这是负责任的社会科学数据治理的本质特征。在社会科学数据治理过程中, 各利益相关者和数据主体需要考虑个人和社会的需求, 遵守相关法律法规和道德标准, 承担保护数据主体权利与数据客体不受侵犯的责任, 以促进公共利益的实现。正如弗雷德里·克明所指出的, “政府行政实践的核心是责任问题”[20] , 可见, 责任是社会治理的永恒理念, 同样也是社会科学数据治理必须坚守并贯彻的理念。离开了责任, 社会科学数据治理的公信力丧失, 社会科学研究与应用陷入无人问津的状态。总的来说, 缺乏责任的社会科学数据治理将导致严重的混乱和无序[21] 。

责任行为的实现途径就是通过社会化的方式向各种正直的人传授公共管理和服务的价值观[21-22] 。因此, 为了强化社会科学数据治理的责任性, 应该吸纳多个利益相关者并向其传递RRI 的理念和原则。首先, 鼓励利益相关者和数据主体的参与和合作,确保其声音被充分考虑并兼顾不同利益的平衡; 其次, 注重数据治理流程的透明度和问责制, 明确规定数据的收集、使用和共享方式并记录在案, 确保决策过程的可追溯。同时, 责令数据治理参与主体承担责任并接受监督和审查; 最后, 确保数据的收集和分析过程不偏袒任何利益群体, 关注数据使用对公众和社会的影响, 促进数据的可持续使用。

2. 2 反思性

反思性特征的要义在于需要不断地反思社会科学数据的意义、影响、责任问题, 确保数据治理流程及其结果符合社会需求、法律法规和伦理原则。负责任的社会科学数据治理以反思性伦理的应用为重要内容, 要求对一切伦理问题进行仔细审查和批判性评价, 不论是否基于宗教、习惯或传统[23] 。反思性是指思维以其自身为对象而反身思之、反复思之[24] 。反思过程需要考虑情境的敏感性, 而不仅仅采用简单的普遍主义模式。负责任的社会科学数据治理是具体情境下多元主体之间的实践活动, 呈现出复杂的价值诉求和伦理关系[25] 。因此, 需要结合社会科学数据治理所处的情境, 不断地反思其中的“不确定性”。首先, 反思社会科学数据的诚信和可用性, 包括评估和反思数据的来源、采集方法、处理过程和结果的伦理性与合规性, 以确保数据质量; 其次, 反思数据的流动和使用对个人和社会的影响与后果, 包括数据的隐私、安全和公平性,以及数据使用是否可能引发歧视、不公平等负面影响, 进而要采取相应措施; 最后, 反思规制数据治理的伦理规范和法律制度的健全性及其背后的价值观, 以期规范相关主体的研究行为, 唤起他们的伦理反思意识并做出正确的决策。比如, 《社会人文科学的研究伦理指南》[26] 明确了研究人员、研究对象、特殊群体、机构、资助者和合作者等需要承担的研究伦理责任, 对相关主体的反思能力产生显著影响。

2. 3 前瞻性

前瞻性要求社会科学数据治理思考全生命周期的综合目标, 而不限于某个阶段, 并提前将后续阶段的目标纳入考虑范围。负责任的社会科学数据治理需要从被动回应社会科学数据的意义、影响、责任问题转向前瞻性预测, 以全方位加强社会科学数据治理的责任性, 满足社会发展需求。总的来说,前瞻性要求: 第一, 考虑社会科学数据治理未来可能出现的问题、需求和变化, 制定数据治理规划。这涉及对社会、环境、技术、法律、伦理等方面的发展趋势进行分析和预测, 尤其要思考社会科学数据治理对数据隐私和安全、数据伦理和社会发展等方面的潜在影响, 协调并平衡多元主体间的利益关系, 以前瞻性地引导社会科学数据治理走向责任化。第二, 要重视社会科学数据代际运转问题。如果同一社会科学数据在不同的信息生命周期被重新加以运转[27] , 因其所处的应用情境已经变化, 那么它将在新的生命周期中面临新的责任问题。因此, 需要前瞻性地预测社会科学数据的代际运转可能涉及的责任问题。

2. 4 开放性

根据系统论, 开放性是系统与环境之间进行物质、能量和信息交换的过程, 为系统运行提供了能量和发展的动力。当前, 数据已成为一种新的物质资源, 因此, 数据的管理、交换与开放成为维系系统运行的最重要的能量和物质[28] 。社会科学数据治理是公众、科研机构和社会向社会科学数据中心输入数据的过程, 是社会科学数据中心整合加工社会科学数据、输出高质量数据的过程, 也是利益相关者承担公开数据治理的过程及决策信息责任的过程。为了维系社会科学数据治理系统的稳定运行,需要倡导利益相关者的广泛参与和数据治理相关过程信息的开放共享。通过开放性的机制和透明度,促进利益相关者的协商合作和共同决策, 以确保数据治理的公正性、可信度和可持续性, 从而更好地满足社会的需求和期望。这就是负责任的社会科学数据治理的开放性特征, 其要求: 第一, 社会科学数据治理过程向利益相关者开放, 以提高其参与数据治理的效力, 并增强数据治理结果的可信度、可验证性和可复制性。开放共享信息可以确保利益相关者切实掌握彼此的需求和关注点, 促进协商合作和共同决策以共同承担责任, 从而有效改善数据治理效果。第二, 社会科学数据中心不仅应尽快制定数据开放计划, 逐步建立规范化的数据开放模式,还要提高输出数据的质量, 使数据不仅是信息的传递者, 还是知识的创造者, 实现社会科学数据从信息向知识的跃迁, 从而提高社会科学数据利用的效率、效益和效能[28] 。

2. 5 工具性

工具性指的是将负责任的社会科学数据治理作为一种管理技术和手段, 借此提升社会科学数据治理的效能。负责任的社会科学数据治理是价值理性和工具理性的统一。它通过构建责任体系来提高对社会科学数据的信任和认同, 这一点主要是基于“价值理性” 的考量。基于社会科学数据的特征, 社会科学数据治理需要采取一定的措施和手段提高伦理化、法治化和责任性, 这一点主要是基于“工具理性” 的考量。工具性主要体现在: 第一, 为了确保数据的安全性和隐私性, 可以采用相关的工具和技术, 比如, 数据加密和匿名化技术用于确保数据存储和传输中的机密性; 数据访问日志和审计工具用于监控和审查数据的访问与使用, 以确保数据的合规性和可追溯性。第二, 为了确保数据的质量, 可以采用数据质量评估框架, 比如, TDQM、DWQ、TIAM、DQAF 等, 不仅可用于数据质量评估, 还提供了分析和解决数据质量问题的方案[29] 。

3 负责任的社会科学数据治理的层次与内容

负责任的社会科学数据治理采用多主体、多层次的正式与非正式制度安排, 以协商、合作的方式促进社会科学数据的流动和利用。目前, 数据治理的层次划分主要有以下几种方法: ①根据国家标准《信息技术服务治理 第5 部分: 数据治理规范》,数据治理可分为战略层、环境层、对象层和方法层;②Lis D 等[30] 基于逻辑相似性, 将生态系统数据治理划分为交互层、治理层和数据层。其中, 交互层描述数字生态系统中相互作用的基本环境; 治理层通过治理结构提供的控制机制促进生态系统中的数据协作; 数据层描述与数据相关领域, 包括数据所有权和决策权两个维度; ③根据澳大利亚《知识管理指南》标准, 安小米等将数据治理划分为宏观层—规划视角、中观层—构建视角和微观层—实施视角。宏观层要求运用多元主体协同方法论进行数据治理战略的顶层设计, 中观层要求运用生命周期理论构建数据资产管理计划的整体活动过程, 微观层要求使用数字连续性理论解决有关数据管理的具体操作问题[31] 。参考上述数据治理的层次划分,本文以数据治理概念要素为本旨, 将负责任的社会科学数据治理划分为战略层、数据层和活动层, 这3 个层次在内容、功能、要求等方面都存在差异,如图3 所示。

3. 1 战略层及其内容

战略层要求在对数据治理现状调研及相关问题分析的基础上, 进行数据治理战略的顶层设计, 包括治理目标、愿景、技术、法律规章、标准和组织架构, 旨在为社会科学数据治理对象及活动提供指导和支持, 其包含: ①数据治理目标和愿景: 通过创建一个价值导向和目标驱动的框架, 确保社会科学数据治理活动始终处于规范和负责任的状态, 旨在构建一个可持续、透明且可信的数据生态系统;②科学合理的数据治理组织架构: 为了实现数据治理目标和愿景, 需要对社会科学数据治理的组织架构进行科学设计。这包括确定数据治理主体以及明确他们享有的数据权利和应承担的数据责任。其中,数据治理主体不仅包含组织内部的数据治理机构和个人, 还涉及外部的相关参与方, 如数据治理委员会、伦理支持小组、学者、公众、数据主体等; ③数据治理的整体制度和系统化的数据标准: 社会科学数据治理需要法律制度和标准规范的支持, 比如,数据治理法(Data Governance Act)、数字服务法(Digital Services Act)、数据质量标准、数据伦理标准等, 以指导和强化负责任的数据治理活动; ④数据治理基础设施、数据技术和工具: 数据治理需要适当的基础设施和技术工具, 比如, 数据门户、平台和档案馆、利益相关者映射工具等, 提高数据治理效率。

3. 2 数据层及其内容

数据层是数据治理实施的对象, 描述了数据治理实施的相关责任领域, 其包括: ①数据伦理, 指的是与数据、算法和实践相关的伦理问题[32] 。负责任的社会科学数据治理需要确保社会科学数据的安全性、隐私性、公正性和透明度, 同时尊重研究对象的权益和尊严; ②数据可用性定义了数据随时可用的程度或范围, 旨在确保最终用户和应用程序在需要的时间和地点可以获取到数据[33] ; ③数据诚信, 对于从客观分析到负责任地共享数据和已发表研究的代码起关键作用。例如, 新加坡科研诚信声明就特别强调了研究人员要承担包括从“维持清晰、准确的研究记录” 到报告“不负责任的研究行为” 等数据诚信责任。可见, 数据诚信与数据管理密切相关[34] 。因此, 需要在整个数据生命周期采取相应行动规划数据诚信; ④数据安全涵盖了保密性、完整性和可用性3 个基本要求[35] 。负责任的社会科学数据治理需要加强对数据泄露、访问权限管理等问题的防范, 以保护参与者隐私和数据可信度; ⑤数据质量, 考虑到大规模自动生成和记录的数据对社会科学研究至关重要, 更需要在数据生成过程中确保数据质量和纠正潜在的质量问题[36] ; ⑥数据隐私, 通常与数据机密性相同, 但二者存在一些差异。数据隐私要求确保数据的机密性, 同时考虑隐私法规和个人隐私偏好[35] 。数据隐私保护通常涉及个人数据的保护、知情同意、数据最小化、匿名化和去标识化, 以及数据安全保护,因此, 需要系统能够执行数据访问的控制策略, 并考虑数据主体的隐私偏好和法律法规[35] 。

3. 3 活动层及其内容

活动层要求在社会科学数据治理的整个数据生命周期中, 依照数据安全、数据伦理、数据可得性、数据诚信、数据可用性、数据隐私的相关规则开展相应活动, 其包括: ①数据责任分配, 即明确和分配不同社会行动者参与数据治理需要遵守的责任和义务; ②治理主体对话, 要求不同社会行动者通过沟通、协调和合作达成数据治理决策的一致意见;③数据治理记录, 指的是对数据治理实践进行记录,便于追溯数据治理过程和结果; ④数据治理原则和政策, 指的是制定相应的原则和策略以规范和指导整个数据治理过程, 确保履行伦理责任、社会责任和法律责任; ⑤数据治理协定, 是指在组织内部或组织之间达成的约束数据治理遵守相关规则的协定;⑥数据治理结果反馈, 要求对社会科学数据治理涉及的数据伦理、法律和社会责任方面的问题进行反馈, 以便及时调整数据治理活动; ⑦数据治理影响评估, 旨在评估数据治理活动可能带来的风险及影响, 比如, 数据保护影响评估、数据产权风险评估、数据伦理影响评估等, 以便发现、评估、确定优先级并采取必要的行动来减轻合规风险[37] ; ⑧数据合规性检查, 对整个数据治理过程进行系统性、结构化的检查或专项检查(如伦理检查), 以确保其符合适用的法律法规、标准或合规性要求; ⑨数据信托。通过独立的第三方数据信托组织建立和维护数据的可信度, 确保数据的合法、透明、安全和可靠使用, 保护知识产权和声誉。比如, 《欧盟数据治理法案》指出, 数据信托可为支持授权个人维护其在GDPR 下的数据权利提供体制机制[38] ; ⑩敏捷治理。基于社会科学数据治理对情境的依赖性, 灵活地调整数据治理策略, 以应对未知的伦理挑战和风险。

综上所述, 负责任的社会科学数据治理框架由战略层、数据层和活动层构成。战略层提供总体目标和指导原则, 影响并规范数据治理活动; 数据层描述了社会科学数据的各种责任要求; 活动层以数据层为治理对象, 旨在推动战略层中的数据治理目标与愿景的实现, 特别关注数据治理活动的开展。

4 结 语

本文对负责任的社会科学数据治理的含义、特征、层次、内容等基本理论问题进行全面阐释, 形成了负责任的社会科学数据治理的基本概念体系。期望以此为起点, 进一步深入探索负责任的社会科学数据治理的理论框架与方法论, 为构建更加健全、透明的科研环境提供坚实的理论基础和实践指导。通过不懈的努力, 可以推动负责任的社会科学数据治理走向更加成熟和完善的阶段, 为社会科学研究的可持续发展做出更大的贡献。

参考文献

[1] Israel M. Research Ethics and Integrity for Social Scientists: Be⁃

yond Regulatory Compliance [ M]. Second edition. Los Angeles:

SAGE, 2016.

[2] Nortjé N, Visagie R, Wessels J S. Social Science Research Ethics

in Africa [M]. Switzerland: Springer, 2019: 143-156.

[3] Sun G Y, Khoo C S G. Social Science Research Data Curation

[J]. Libellarium: Cˇasopis Za Istraživanja u Podrucˇ ju Informaci⁃

jskih i Srodnih Znanosti, 2017, 9 (2): 59-80.

[4] Yoon A. Data Reuse and Users Trust Judgements: Toward Trusted

Data Curation [D]. Chapel Hill: University of North Carolina at

Chapel Hill, 2015.

[5] Curty R, Yoon A, Jeng W, et al. Untangling Data Sharing and

Reuse in Social Sciences [ C] / / Proceedings of the 79th ASIS&T

Annual Meeting: Creating Knowledge, Enhancing Lives through

Information & Technology. Copenhagen: ACM, 2016: 1-5.

[6] Fothergill B T, Knight W, Stahl B C, et al. Responsible Data

Governance of Neuroscience Big Data [J]. Frontiers in Neuroinfor⁃

matics, 2019, 13: 1-14.

[7] 刘智锋, 王继民. 社会科学数据集的跨学科性研究———以CHARLS

和CGSS 数据集为例[J]. 现代情报, 2023, 43 (9): 165-177.

[8] 陈欣, 詹建军, 叶春森. 基于高校科学数据生命周期的社会科

学数据特征研究[J]. 情报科学, 2021, 39 (2): 86-95.

[9] 王丹丹, 任婧媛, 吴思洁. 社会科学数据管理与服务平台研究———

德国的经验[J]. 现代情报, 2020, 40 (11): 99-106.

[10] 王丹丹, 任婧媛. 国外主要社会科学数据管理平台建设研究

及启示[J]. 图书情报工作, 2023, 67 (3): 131-139.

[11] Braun V, Clarke V. Using Thematic Analysis in Psychology [J].

Qualitative Research in Psychology, 2006, 3 (2): 77-101.

[12] 韦景竹, 王政. 公共文化数据协同治理研究: 内涵、范畴与

理论框架[J]. 图书情报知识, 2022, 39 (6): 67-77, 157.

[13] 粱苗. 负责任创新的理论与实践[M]. 长沙: 湖南大学出版

社, 2019: 40-41.

[14] Micheli M, Ponti M, Craglia M, et al. Emerging Models of Data

Governance in the Age of Datafication [ J]. Big Data & Society,

2020, 7 (2): 1-15.

[15] Janssen M, Brous P, Estevez E, et al. Data Governance: Organ⁃

izing Data for Trustworthy Artificial Intelligence [ J]. Government

Information Quarterly, 2020, 37 (3): 101493.

[16] 佟泽华, 石江瀚, 韩春花, 等. 科研大数据协同治理: 体系构

建与实施路径[J]. 情报理论与实践, 2023, 46 (5): 32-45.

[17] Lima V. Collaborative Governance for Sustainable Development

[J/ OL]. Peace, Justice and Strong Institutions. https: / / www.re⁃

searchgate.net/ profile/ Valesca-Lima/ publication/347790898_Col⁃

laborative_Governance_for_Sustainable_Development/ links/6162c

dd00bf51d481765f1f1/ Collaborative-Governance-for-Sustainable-

Development.pdf, 2021-06-04.

[18] Klievink B, Voort H, Veeneman W. Creating Value Through Data

Collaboratives [J]. Information Polity, 2018, 23 (4): 379-397.

[19] Ruijer E. Designing and Implementing Data Collaboratives: A Gov⁃

ernance Perspective [J]. Government Information Quarterly, 2021,

38 (4): 1-12.

[20] 乔治·弗雷德里克森. 公共行政的精神[M]. 北京: 中国人民

大学出版社, 2003: 151.

[21] 党秀云. 民族地区社会建设与治理研究[ M]. 北京: 国家行

政学院出版社, 2015: 59-60.

[22] 菲利普·J.库珀. 二十一世纪的公共行政: 挑战与改革[ M].

北京: 中国人民大学出版社, 2006: 71.

[23] 基思克拉斯曼, Keithw. Krasemann. 伦理学与生活[ M]. 成

都: 四川人民出版社, 2020: 19.

[24] 阎孟伟. 哲学概论精编版[ M]. 天津: 南开大学出版社,

2020: 23.

[25] 李平, 廖苗. 对负责任创新“ 反思” 维度的再思考[ J]. 自

然辩证法通讯, 2021, 43 (4): 69-75.

[26] Committees N R E. Guidelines for Research Ethics in the Social

Sciences and the Humanities [ EB/ OL]. https: / / www.forskning⁃

setikk.no/ en/ guidelines/ social - sciences - humanities - law - and -

theology/ guidelines-for-research-ethics-in-the-social-scienceshumanities-

law-and-theology/ , 2023-06-18.

[27] 韩峰. 试论全生命周期环境下档案数据治理的连续性[ J].

档案, 2020, (10): 43-46.

[28] 苏玉娟. 政府数据治理的五重系统特性探讨[J]. 理论探索,

2016, (2): 71-75.

[29] 蔡莉, 朱扬勇. 大数据质量[M]. 上海: 上海科学技术出版

社, 2017: 130.

[30] Lis D, Otto B. Towards a Taxonomy of Ecosystem Data Govern⁃

ance [C] / / Proceedings of the Annual Hawaii International Con⁃

ference on System Sciences, Hawaii: Hawaii International Confer⁃

ence on System Sciences, 2021.

[31] 安小米, 许济沧, 王丽丽, 等. 国际标准中的数据治理: 概

念、视角及其标准化协同路径[ J]. 中国图书馆学报, 2021,

47 (5): 59-79.

[32] Floridi L, Taddeo M. What is Data Ethics? [J/ OL]. The Ethical

Impact of Data Science. https:/ / royalsocietypublishing.org/ doi/10.

1098/ rsta.2016.0360.

[33] Rouse M. Data Availability [EB/ OL]. https: / / www.techopedia.

com/ definition/14678/ data-availability, 2023-06-15.

[34] Condon P, Simpson J, Emanuel M. Research Data Integrity: A

Cornerstone of Rigorous and Reproducible Research [J]. IASSIST

Quarterly, 2022, 46 (3): 1-21.

[35] Bertino E. Data Security and Privacy: Concepts, Approaches, and

Research Directions [C] / / Proceedings of the 2016 IEEE 40th Annu⁃

al Computer Software and Applications Conference (COMPSAC), At⁃

lanta, GA, USA, 2016.

[36] Schmitz A, Riebling J R. Data Quality of Digital Process Data

Datenqualität digitaler Prozessdaten: A Generalized Framework and

Simulation [J]. KZfSS Kölner Zeitschrift Für Soziologie Und Sozi⁃

alpsychologie, 2022, 74 (1): 407-430.

[37] Global Marketing Alliace. Data Impact 2019: Data Governance

[EB/ OL]. https:/ / www.the-gma.com/ wp-content/ uploads/2019/

09/ Data-Impact-2019_Data-Governance.pdf, 2023-06-15.

[38] Montgomery J. Data Trusts and the Draft Data Governance Act

[EB/ OL]. https: / / datatrusts. uk/ blogs/ data - trusts - and - the -

draft-data-governance-act, 2023-06-15.

(责任编辑: 杨丰侨)

猜你喜欢

数据治理
云端数据治理定义解析
营配贯通台区线损异常数据治理分析
基于oracle12c+oda数据治理方案探讨
智慧城市建设项目风险挑战与解决经验
基于本体的企业运营数据治理
云端数据治理初探
运用流程化手段提升资产管理水平
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理