科研数据共享中的数据伦理问题研究
2023-01-08郑易平
梁 宇,郑易平
(南京航空航天大学马克思主义学院,江苏 南京 211106)
当前,随着数据密集型科研范式的兴起和大数据技术的持续影响,科研数据呈现井喷式增长,以数据为中心的科研时代已经来临。科研数据的共享和复用是其提升数据科研价值与社会效益的重要条件,有助于消除数据资源垄断,实现科研数据资源的优化配置与重复利用,推动科研数据产生最大化的科学效应。现阶段我国研究人员的科研数据依然匮乏,与如火如荼的大数据时代相悖,数据共享短板是主要障碍之一[1]。科研数据共享之所以进展缓慢,与其在实践过程中遭遇的数据伦理道德困境不无关联。相关研究表明,数据伦理困境削弱了科研人员数据共享的意愿,使他们不敢或不愿意分享自己的数据,对科研数据共享造成严重的负向效应。为了保障科研数据共享活动的顺利展开,就必须首先解决系列数据伦理困境的掣肘难题。解决伦理问题是实现数据共享的前提与基础[2]。本文从数据伦理的视域出发,分析当前我国科研数据共享面临的数据伦理困境,并提出相应建议,以期更好地推动科研数据的开放与共享,满足科研人员的数据需求,提高其科技创新能力。
1 科研数据共享相关研究文献回顾
科研数据是指对科研工作有重要价值的数据以及在科研工作中所产生的所有数字形式的对象,包括研究人员基于科研需求对数据进行处理、优化后,用于支撑学术研究的数据集合。科研数据是科学研究的基础支撑,也是推动研究进展的动力来源[3],而数据共享正是有效开发、利用科研数据的重要途径。目前学术界对科研数据共享行为的研究主要聚焦于以下四个方面:
1.1 科研数据共享路径
Kaye[4]等认为,应从承认个人贡献、了解科学实践的变化、维护公信力、对研究者负有责任和注意监督访问等方面实现科研数据共享。刘晶晶等[5]提出数据知识库、数据期刊和学术期刊的数据说明文件三种科研数据共享途径。程津培[6]认为,要通过科技进步与科技创新和社会发展需求的满足、共享政策与法律的制定和国家科学数据中心和科学数据服务网的构建等措施实现科研数据共享。
1.2 科研数据共享的影响因素
国外学者对科研数据共享影响因素的研究主要涉及制度因素、技术因素、环境因素和个人因素。元数据标准统一性的缺失是科研数据共享行为的阻碍因素之一[7]。科研人员乐于在熟人之间进行数据共享,因为彼此之间能够达成数据交换[8]。科研数据共享行为受到个人背景、外部政策、共享成本、支撑技术和数据质量的影响[9]。科研人员对科研共享的态度、主观规范、感知有用性、感知行为控制、感知风险等是影响科研数据共享意愿的重要因素[10]。
1.3 科研数据共享模式
左建安等[11]提出科研数据共享的四种模式,即国家政策驱动、部门间相互交换、企业发展引领和国际组织参与。李娟等[12]将国内数据共享模式归纳为事业性运行模式和商业化运作模式。严炜炜等[13]在归纳科研协同实践中数据共享行为的基础上,分别从个体粒度、团队粒度和组织粒度探究了多粒度科研协同的数据共享与利用模式。张丽丽等[14]将科研数据开放概括为自上而下、横纵联合和自下而上三种模式。
1.4 国外数据共享实践经验
张晓青等[15]对国际组织、美国、英国、加拿大等发达国家的数据共享政策进行评述,并指出其对我国科研数据开放共享的启示。谢艳秋等[16]通过文献和网站调查研究,对美国、英国、澳大利亚等国的科学数据共享政策建设情况展开研究。司莉等[17-18]对美国、澳大利亚、英国三国的科研数据共享展开调查,并提出对我国科学数据开放共享的借鉴价值,通过对2005年以来国外科学数据管理与共享研究热点的梳理,总结了国外科学数据管理与共享的特点,并提出对我国科学数据管理与共享的建议。
以上研究表明,学术界对科学数据共享行为研究取得了重大进展,研究主题和内容也愈加广泛。然而,许多研究侧重于从宏观层面对研究人员科研数据共享问题的关注,鲜有专门从数据伦理道德的视角对科研数据共享问题展开研究。由此,本文从数据伦理视域出发对科研数据共享困境的研究展开论析,以期实现科研数据合理、安全、有道德的共享。
2 科研数据共享中伦理问题的主要表现
大数据技术的迅猛发展,在给研究人员的科研活动带来便利的同时,也造成严重的社会伦理道德困境,这些伦理危机恰是影响科研数据共享的重要因素。
2.1 科研数据污染影响数据共享
科研数据污染意指由于研究者故意或偶然行为导致原始数据的真实性与完整性受损而被 “污染”,主要表现在三个方面:一是研究人员不规范地引用数据,在引用他人数据上出现断章取义、以偏概全的学术性错误,导致科研数据以讹传讹等;二是研究人员在科研数据活动中产生的失真行为,如对数据的人为修改和虚构;三是在研究活动中掺杂大量无用、反复的数据,对数据做简单堆砌,没有考虑其对研究主题的意义。此外,还包括数据滥用,也就是说科研数据未能得到数据持有者的许可,或者以其不乐见的方式而进行的不当使用。如何在保障人人都可以共享科研数据的同时又能确保数据不被滥用,对科研数据共享的顺利进行至关重要。有学者认为,出于对数据滥用、数据修改或错误解读的担心,科研人员的数据共享意愿会降低[19]。
2.2 科研数据产权不明影响数据共享
科研数据权利归属的明确、权利主体法律关系的确立是共享和重用科研数据的法律基础[20]。然而,由于数据产权的界定困难,尚未在学术界、产业界形成定论,使得科研数据产权不明,极易发生科研数据知识产权纠纷和侵权风险。大数据时代科研数据生产链条包括多个参与者,权利责任需要在各参与者之间进行划分,致使产权界定更为困难。目前学术界对数据权属的认识存有较大争议,有学者认为数据产权应该归于对数据进行加工、处理的企业,还有学者主张数据的初始产权归于个人[21-23]。由于对数据权属没有形成一个统一的行业规范和法律规制,导致数据在开放共享中一旦出现侵权事件、数据隐私泄露等风险时,即面临责任追溯困难的问题。研究人员出于对数据控制权的顾虑,而对数据共享持消极被动态度。研究显示[24],53%的受访者担心在数据共享中会失去控制权,进一步佐证了这一观点。与此同时,它也会对科学数据的合理引用产生影响,如产生数据引用过程中谁标引、谁引用、谁负责、谁收益等问题[25],这也是导致研究人员数据共享意愿弱化的重要原因。
2.3 科研数据泄密影响数据共享
大数据时代,隐私泄露风险更为突出。大数据把一切遮蔽掀开,整个世界变成了透明世界[26]。研究人员在数据资源共享与开放平台获取科研数据和学术资源的过程中,其个人信息大多时候都会在默认的情况下被悄无声息地收集。当用户个人信息被全天候、全方位收集并被分享利用或发生泄露时,就有可能损害到用户的个人隐私。同时,由于每个科研用户的背后都对应着其工作的高新技术企业、科研单位、高等院校或国家重要部门,因此当个人和相应机构的信息被全面收集与分析利用时,就不仅可能侵犯到个人隐私,而且也可能对科研机构乃至国家的重要保密单位带来隐私威胁。科研人员对数据隐私和保密性的考虑,会影响到他们对数据共享的意愿[27]。病人隐私受到侵犯也会损害医学科研人员数据共享的积极性[28]。因此,数据隐私困境成为科研数据共享中的一大难题。
2.4 科研数据安全影响数据共享
数据安全主要包括数据存储安全、数据访问安全、数据处理安全和数据交易安全等数据安全问题[29]。在科学数据共享行为中的数据安全除了数据隐私安全之外,还包括科研数据使用的知情同意,数据不得被篡改或剽窃,敏感数据的使用必须符合国家法律规定,不得对国家信息安全造成损害等内容。大数据技术在给研究人员分享和应用科研数据带来方便的同时也加大了数据安全隐患,部分科研人员由于担心数据被篡改、恶意使用、知识产权等问题而拒绝共享数据,还有一些研究人员虽然认识到数据共享的重要意义,但又十分担心数据共享会造成数据泛滥和学术造假,也会对数据共享造成负面影响[30-31]。
2.5 科研数据鸿沟影响数据共享
数据鸿沟意指不同国家、地区、行业的数据用户由于对信息与数据技术的掌握与应用程度的差别,导致信息落差及不平等的后果。在大数据时代,数据资源总量持续呈现扩大之势,但数据资源在配置、应用的过程中逐渐偏离公平、平等的价值诉求,数据的两极分化越来越严重,形成巨大的数据鸿沟。数据伦理学家将这种数据鸿沟称为 “大数据富人”与 “大数据穷人”之间的沟壑[32]。属于 “大数据穷人”的科研人员和单位担心在数据共享中处于不利地位而对数据共享的积极性不高,共享意愿不强。有学者指出,国内985、211重点高校在资源投入和科研数据生成能力方面占据绝对优势,数据共享将会进一步扩大差距,造成数据资源两极分化,使他们不愿共享数据[33]。因为即使是属于 “大数据穷人”的科研单位也能在数据共享中获取科研收益,但是困于数据利用能力,尤其是数据分析技术方面能力有限而致使数据共享中产生的科研效益低于重点院校,这种科研数据鸿沟带来的科研效益鸿沟影响到科研数据的共享水平。不仅如此, “大数据穷人”的数据生产能力远远不及 “大数据富人”,他们在科研数据共享中生产新数据的能力有限,不能持续扩大数据量,很可能造成数据鸿沟的进一步扩大,这也削弱了他们数据共享的意愿。
3 科研数据共享伦理困境的治理
3.1 法律治理:健全数据立法,加强科研伦理失范行为的法律规制
科研数据共享中的伦理危机与法律、规则的缺失有关,没有一套成熟的法律与制度监管体系,数据共享中的伦理规范就难有保障。当前,我国数据隐私与安全保护的立法滞后。2021年6月,首部 《数据安全法》经过全国人大常委会审议通过,给数据加上了 “防护罩”,但该法只是笼统规定数据活动的规范要求,对一些具体的、细节性的数据活动缺少明确规定,法制约束性依然有限,由此导致科研数据共享中数据主体的隐私安全失去法律保护屏障。同时,我国的科研行为规范约束力有限。2006年制定的 《国家科技计划实施中学术不端行为处理办法》将抄袭、剽窃、篡改科研数据等违反科研道德准则行为界定为科研不端行为,各大高校、科研机构也制定相应的科研道德行为规范文件,对科研不端行为的概念、处罚措施做出了各自界定。然而,这些文件和相关法律规范对科研不端行为的定义和认知过于宽泛,受到我国科研管理体制的掣肘,各部门和科研机构对学术不端的定义、调查处理原则、处罚措施等方面存在不一致或矛盾之处,立法体系杂乱,未形成统一的格局[34]。科研单位 “唯论文”的不良导向,滋生了浮躁、腐败的学风,部分高校将论文作为人才评价和培养的唯一标准,高额奖励论文,导致科研论文被商品化、物质化。因此,当前亟需健全数据治理相关立法,为数据隐私与安全提供法律保障,确保研究人员的数据共享行为能够走向法治化道路。
要从国家顶层设计层面制定 《数据安全法》,对数据采集、数据存储、数据管理、数据利用等数据全生命周期的各个流程都要进行法律保护,对数据进行分级分类保护。要明确数据保护的范围、实施主体和惩戒措施等内容, 《数据安全法》尤其要对数据开放共享中涉及国家机密和国防安全的敏感数据进行法律解释,以更好地推动数据开放共享行为的合法进行。相关部门要尽快出台 《数据产权法》 《数据交易法》 《个人数据保护法》以及与数据开放共享相关的法律,减少科研数据知识产权纠纷,保护数据持有者的自身合法权益,对科研数据共享中的伦理失范行为进行法律监管,确保研究人员能够依法进行数据共享。要完善学术不端行为的法律规范体系,现阶段我国的法律规范对研究人员的学术不端行为还未形成强有力的约束力,其中刑法和民法制度的作用有限,而行政法规对科研不端行为的界定、处理规则、惩戒措施不统一,缺乏可操作性[35]。为此亟需将刑法、民法和行政法规结合起来,完善学术不端行为的法律规范体系。我国法律还未明确将学术不端行为定性为犯罪,一般来说,对于一些危害性较小的学术不端行为,由学术界或各研究机构根据学术规范内部处理,或者通过行政法、民事法予以处理,但是对于极少数危害性较大的恶性学术不端行为,诸如窃取危害国家安全的机密数据的行为,应纳入刑法解决方案中[36]。
3.2 主体治理:强化研究人员的科研伦理意识
数据伦理是科研人员在数据开发、利用活动中应当遵循的道德准则,也是衡量科研人员道德品质的重要标准。研究人员在数据共享中产生一系列的数据伦理困境,究其原因,根本在于研究人员自身道德素养的缺位。高校研究人员在进入科研工作之初,尤其是硕士博士生在研究生教育的培养中受到的学术伦理教育严重不足,更多是实用性的专业教育,很少开设学术道德课程,导致研究人员在之后的学术道路中重成果、轻道德,严重削弱了研究人员的道德水准,一旦进行数据开放共享活动,就更容易践踏数据伦理,触碰学术道德底线。因此,加强对研究人员的伦理教育、强化其科研伦理意识,对消解数据共享中的伦理困境至关重要。
首先,应增强研究人员的学术道德意识,要充分认识到科研绩效与科研道德之间的紧密联系,优秀的研究成果必须以遵守科研道德规范为基础。研究人员在科研活动中要将学术道德作为自身科研生涯的必修课,避免将学术研究功利化。其次,应增强数据隐私防护意识。研究人员在科研数据开放共享实践中,要树立明确的个人数据隐私与安全观念,掌握各种数据防护技术,以最大限度避免隐私数据泄露;再次,应增强数据维权意识。在科研数据共享行为中,研究人员除了要有数据隐私保护观念,还要有强烈的维权意识。当个人数据或者其他不愿公开的数据被第三方滥用、剽窃等不道德使用甚至非法使用时,要敢于利用已有的法律和伦理规则维护自身合法权益;最后,应加强对科研人员的科研伦理教育,通过各种数据伦理培训、讲座、公开课和知识宣传等方式向研究人员传达学术伦理的精神精髓,与此同时,高校和各科研机构要加强对研究人员的数据素养教育,拓展科研数据领域,丰富数据资源内容,尽力缩小数据鸿沟。
3.3 环境治理:创建良好的数据共享与学术氛围
要实现科研数据共享中数据伦理困境的有效治理,除了要从法律治理和主体治理层面上发力,还要加强对研究人员科研数据活动的环境治理,潜移默化地影响他们对学术道德的认同感,避免陷入数据伦理的陷阱。通过论坛、讲座、表彰的形式介绍共享科研数据的典型案例,塑造和谐安全的数据共享氛围,完善人才培养方案和评价机制,摒弃 “唯论文”的不良导向。2020年2月,教育部联合科技部出台 《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》,明确指出,高校不宜以发表SCI论文数量和影响因子等指标作为学生毕业和学位授予的限制性条件。2020年12月,教育部再次出台 《关于破除高校哲学社会科学研究评价中 “唯论文”不良导向的若干意见》,进一步强调,不得将SSCI、CSSCI等论文收录数作为导师岗位选聘、人才计划申报评审的唯一指标。在此背景下,科研单位应顺势而为,通过建立健全科学的人才培养方案和学术评价机制,努力将学术活跃度与学术道德责任感统一起来,形成平等、自由、协作、创新的学术氛围。此外,针对科研数据隐私泄露和数据安全问题,还需要利用数据隐私增强技术,包括数据同态加密和数据匿名、区块链等技术的应用和数据安全设备的更新,有效应对科研数据共享中的隐私泄露问题,保障国家敏感数据、核心科技数据的绝对安全。
4 结语
大数据时代,数据的科研价值得到研究人员的广泛重视,为了充分发挥已有科技成果和数据的价值,促进科技创新和数据资源的高效利用,政府已将科研数据共享问题提上日程。2018年3月,国务院印发 《科学数据管理办法》,成为首次在国家层面制定的科学数据管理办法,以推动科研数据共享的规范化发展。然而,在科研数据共享实践过程中,也带来了诸多数据伦理道德问题,对科研人员数据共享的意愿与能力产生了较大的负面效应,制约了科研数据共享活动的发展水平。基于此,我们从科研人员的道德自律、数据法律、学术环境等方面提出应对科研数据共享伦理困境的对策建议,以期解除科研人员对数据共享的后顾之忧,为新时代科技创新发展提供基础支撑。