APP下载

我国生物学领域科研数据重用实践的用户画像与服务启示

2024-06-03张潇月刘金亚赵昆华

现代情报 2024年6期
关键词:社群科研人员领域

张潇月 刘金亚 赵昆华

关键词: 开放科研数据; 数据重用实践; 用户画像; 数据社群; 数据重用服务; 生物学领域

DOI:10.3969 / j.issn.1008-0821.2024.06.003

〔中图分类号〕G316; G250 73 〔文献标识码〕A 〔文章编号〕1008-0821 (2024) 06-0033-12

科研数据重用是指科研人员对科研数据在原始意图以外再次使用的活动[1-2] 。2021 年11 月, 联合国教科文组织(UNESCO)审议通过的《开放科学建议书》, 其序言部分强调了数据重用与开放科学的相互促进关系, 即开放科学提升了科学界和社会公众参与科研过程和获取研究成果的可能, 有助于减少数据的收集、创建、转让和重用成本; 同时,数据重用的实际效果也是衡量开放数据运动成效的一项重要标准。数据重用能够开展更广泛研究, 让更多主体加入研究过程, 使成果获得更大范围传播, 增强科学研究的有效转换性和社会影响力[3] 。

数据重用也是开放科研数据的重要原则之一。基于科研活动产出的数据在开放共享过程中应当遵循可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)的FAIR 原则,已成为国际开放科研数据学界和业界的基本共识。可见, 数据重用是数据可发现、可访问、可互操作的最终目的[4] 。通过进行多源数据融合、数据二次加工与语义分析等多种方式的重用, 可更有效地丰富科研基础材料, 提高科学实验效益, 同时促进理论驱动型和数据驱动型研究的深入发展, 真正促进开放科学理念的落地实施。

尽管我国在国家层面形成了良好的数据重用制度环境, 例如《科学数据管理办法》的发布实施[5] 、《科学数据引用》国家标准的实施[6] 和《国家科技资源共享服务平台优化调整名单的通知》中明确要求依托单位为科学研究、技术进步和社会发展提供高质量的科技资源共享和重用服务[7] , 且目前多个学科领域支持数据重用的基础设施也已初步完成建设, 并面向激发创新提供多样化应用服务[8-9] 。但科研数据重用在实践层面仍然面临新问题和新挑战, 影响了数据重用的深入推进和科研人员的实际受益[10] 。2022 年, 由Digital Science 等机构联合发布的《2022 年开放数据状况》(The State of OpenData 2022)报告指出, 促进科学目标的实现, 不能只关注技术进步, 改变实践行为同样重要[11] 。因此,关注数据重用实践行为有助于实现科学进步。

虽然数据共享和重用理念已经得到了较多科研人员的认可和支持, 但数据重用实践的普遍性在不同学科之间存在较大差异, 例如在生命科学、天文学、空间科学、地球科学等开放基础较好的学科,数据重用发生频率相对较高; 但在数学、农业科学、经济学及人文社科类等学科, 研究人员仍需要努力寻找可以重用的数据[11] 。因此, 为促进数据重用实践在不同学科之间的均衡与可持续发展, 有必要对数据重用基础较为成熟的领域进行深入识别, 总结归纳其发展经验与不足, 从而为优化我国数据重用实践服务体系提供参考借鉴。

考虑到学科的差异性, 本研究调研了2019 年我国20 个国家科学数据中心的学科布局[7] , 遴选了依托机构数量最多、具有较高科研数据开放程度、配备较成熟数据基础设施和重用规则体系[12-13] 的生物学领域作为特定研究学科; 同时考虑到科研人员是主导和影响数据重用实践發展的核心主体, 因此应当遴选生物学领域的科研人员作为特定研究对象。综合上述遴选规则, 本研究选取了在我国生物学领域具有较大研究规模、数据总量和影响力的中国科学院相关学科研究人员作为具体研究案例, 并通过调研问卷和群体画像的方式, 全面深入分析当下科研数据重用实践面临的障碍, 使研究结果与建议具有一定代表性, 能够助力以图书馆和数据中心等为代表的信息服务机构提供更好数据重用服务。

1 文献综述

通过梳理分析国内外有关数据重用实践的相关主题文献, 发现已有研究成果大致基于两种视角展开: 一是从科研人员的用户视角出发, 探讨用户个体与群体对于数据重用在态度感知方面的内在因素和在文化环境方面的外在因素。二是从服务机构的社群培育视角出发, 分析数据重用实践社群的保障机制、培育方式和创新服务实践。

1.1 用户视角: 数据重用的内在驱动力与外在影响因素分析

部分研究成果论述了影响科研人员数据重用实践的内在因素, 主要验证了科研用户个体的数据重用积极/ 消极态度与数据重用行为的关联关系。例如, 李晓等[14] 的分析结果表明, 科研人员对数据重用实践的态度是影响其重用意愿的一项重要因素。Federer L M 等[15] 关注到了影响科研人员的数据重用感知的因素, 发现科研人员对相关基础设施和支持措施的易用与实用程度的感知能够有效提升其参与数据重用实践的积极性, 从而影响特定领域数据的访问率和重用度。也有部分研究从用户对数据重用的目的出发, 分析用户的态度在不同类型重用实践中的影响。Enke N 等[16] 研究发现, 生物多样性领域的科学家重用他人数据的需求, 有些是为了扩展其自身的数据集将其研究置于更广泛的背景中, 有些是为了通过额外数据来支持和评估自身研究建立的模型。尽管科研人员重用科研数据的目的各异, 但其关于数据重用的态度对其行为意愿和具体实践均有较大影响。

还有部分文献研究了影响科研人员数据重用实践的外在环境因素, 从“用户群体—实践” 的互动角度, 揭示了科研人员的数据重用行为是否会由于其所在社群的学科文化、规则机制等外在环境不同而产生感知差异。如Tenopir C 等[17] 研究表明,科研人员所接受到的学科文化不同, 其数据重用行为也会存在较大差异, 如天文学领域重用数据易获取程度比社会科学领域高将近26%。具体到数据实践对用户的影响, Holub P 等[18] 建议通过FAIRhealth原则扩展FAIR 原则在药物领域的标准, 以增强该领域数据和生物材料的重用, 包括数据质量的可重用性、内容的可理解性、过程的透明性和非碎片性以及隐私保护性。另有Zimmerman A[19] 对生态学领域学者的研究表明, 科研人员也会间接受到其关联领域的规则与标准的影响, 建议针对科研人员共享和存储科研数据等实践实施激励机制, 以提升数据重用的普遍性。

1.2 服务者视角: 数据重用社群运营的评估和提升路径研究

国内外文献中有较多研究基于数据重用服务者的视角, 详细论述了基础设施和配套机制对于有效保障、吸引科研用户参与数据重用实践的重要性。Pasquetto I V 等[20] 研究表明, 数据重用依赖于基础设施的建设。宋秀芬等[21] 认为, 依赖于强制性政策引导的手段推动数据重用实践的作用范围有限,需要通过激励机制等措施扩大数据重用的实践范围。Tedersoo L 等[22] 认为, 缺乏激励、缺乏标准的元数据收集和访问机制等因素, 阻碍了研究人员的数据重用行为。Cheruvelil K S 等[23] 在生态学领域开展的研究也表明, 有限资源(如资金、数据)所造成的高度竞争文化会降低数据开放意愿, 进而会限制研究人员的数据重用实践, 建议学术界应承认出版物之外的数据(作为学术成果的)贡献。同时有研究非常认可麻省理工学院(MIT)图书馆开展特定数据重用的培训形式, 建议相关机构提供专题型数据重用实践服务[24] 。

为进一步推动数据重用的实践活动, 也有部分研究开始关注服务机构如何借助数据社群(DataCommunity) “运营” 的理念, 提升数据重用实践。其中, Cooper D M 等[25] 认为, 数据社群是一个由研究人员组成的流动和非正式网络(群组), 并具备自下而上发展、为数据共享减轻技术阻碍和具备社群规则(Community Norms)的三大基本特征。基于上述特征, Cooper D M 等[25] 认为, 数据社群概念可作为实现数据开放共享FAIR 化的重要力量和促进STEM 领域数据共享的一项新模式。蔚海燕[26] 将“数据” “社区” 作为学科化服务研究中的关键词, 在研究中以杜克大学创立的信息共享空间“The Edge” 为例, 鼓励国内图书馆界以社群化形式探索开展数据密集型科研支持服务实践。

近年来的已有研究为推动科研人员开展数据重用实践和服务机构提供数据重用支持提供良好借鉴。但目前对于促进数据重用实践可持续发展的研究, 仍停留在“自上而下” 的相关政策与基础设施的完善建议层面, 对学科化数据重用实践服务需求的研究相对较少, 且大多聚焦在“数据管理” “开放数据” 等较为独立发展的服务理念, 较少整合“数字学术” “开放数据” 等整体学术发展趋势, 以覆盖完整的科研生命周期。因此, 有必要在数据开放基础较成熟的研究领域, 按照“需求识别—机制分析—服务方案制定” 的整体研究逻辑, 对数据重用参与群体进行分类研究, 以进一步识别同一领域中不同类型数据重用群体的行为差异所反应出的需求差异, 并根据研究结果展开细化分析, 提出相应服务建议, 以促进我国科研人员对数据重用实践的持续参与。

2 研究问题与研究设计

2.1 研究问题

基于上述研究背景和已有成果分析, 本文的主要研究问题是: 基于我国生物学领域的现状, 以科研人员的态度和感知为切入点, 需通过哪些服务培育该领域数据重用实践, 进而提升我国生物学领域科研人员数据重用的积极性? 基于该核心问题, 本文设计以下两组问题:

RQ1: 不同岗位状态、是否具备重用经验的科研人员在对待科研数据重用问题的态度和感知方面是否存在差异? 若存在, 则具体差异情况如何?

RQ2: 态度和感知特征如何塑造我国生物学领域科研数据社群的数据重用行为特征? 信息服务机构应如何回应不同类型用户在持续参与数据重用实践中的诉求?

2.2 构念提炼与调查问卷设计

通过文献检索与综述方式, 提炼论文核心构念。以“Open Science” “Open Data” “Open ResearchData” 作为背景关键词, 分别与数据重用相关的行为关键词“Data Reuse” “Research Data Reuse” “Sci?entific Data Reuse” “Secondary Data Analysis” “Sec?ondary Use of Data” “Secondary Use of Scientific Da?ta” 组合, 通过Web of Science 对英文学术论文进行检索, 通过Bing 搜索引擎检索其他类型英文文献。以“开放科学” “开放数据” “开放科研数据”

作为环境关键词, 以“数据” “科学数据” “科研数据” 作为核心术语关键词, 以“重用” “再利用”

“二次使用” 作为行为关键词, 以关键词组配方式在中国知网检索, 得出核心文献集。通过人工阅读该文献集中的文献, 共提炼出4 个构念(Constructs)。具体的提炼过程, 详见上节文献综述部分, 可参照本研究前期发表成果[27] 。

本文在研究工具的选择与考量方面采取了调查问卷方式。因为数据重用实证研究具备一定的研究基础, 相关影响因素的识别也具备初探式成果, 但现有文献缺少群体层面的一手调研资料。因此, 若希望了解用户的重用态度和感知在群体层面的分布,则需在定性研究基础上, 进一步开展定量化的测量研究。问卷是收集有关社会现象和人们社会行为各种资料的工具, 其用途是测量人们的行为、态度和社会特征[28] 。这与本文研究问题中主要探讨的变量特性相契合。另外, 問卷中的封闭式问题可以很容易把人们的观点、看法定量化[29] , 因此采用问卷调研, 能够更好地测量群体层面上用户的特点,从而为用户画像奠定基础。

本文简述所识别构念的具体含义及典型参考来源, 与所对应的数据重用行为影响因素调查问卷测量项, 如表1 所示, 共有22 项量表题(李克特五点量表)、两项多选题, 另通过填空题方式测量科研人员实际重用次数。

3 数据分析结果

3.1 调查问卷的发放与回收

本研究针对中国科学院生物学领域的科研人员(包括硕士和博士研究生以及其他专职科研人员)于2019 年9 月—11 月通过两个主要渠道发放调查问卷: 微信和电子邮件。一是通过微信平台以滚雪球抽样的方式向生物学领域的硕博生群体发放问卷, 成功回收了有效问卷211 份。二是手动收集了中国科学院生物学领域科研人员的邮箱地址, 并发放问卷, 成功回收了有效问卷90 份, 共计回收301份有效问卷。

本文首先统计了调查对象的人口统计学特征,如表2 所示, 而后计算出各测量项的均值、中位数和标准差。X1~X4 测量项的均值均小于取值范围的中位数(取值范围1~5, 中位数为3), 表明我国生物学领域科研人员认为科研数据重用活动在科研实践中的普遍程度较低, 有待进一步提升其对科研数据重用活动态度的积极程度。另外, 总体上, 科研人员对重用数据所涉及相关规则的熟悉程度较低(5项中仅有两项中位数为3, 其余均小于3), 并认为目前数据重用活动支持服务的实用程度有待提升(15项测量结果的中位数均小于取值范围的中位数3)。

3.2 不同用户组别的组间差异分析

针对子问题1, 本节进一步分析用户在态度、感知层面的组间差异, 从而为针对性提供建议奠定基础。组间差异分析包括两部分: 一是不同岗位状态科研用户对重用态度和感知的差异。二是有无重用经验的科研用户在数据重用态度和感知因素方面的差异。通过数据分组, 并在每个测量项上进行方差分析, 汇总组间差异明显的具体测量项至表3。以下两小节分别详述。

3.2.1 不同岗位状态在数据重用态度和感知中的差异

本研究采用方差分析, 探究不同岗位状态(专职科研人员、硕博生两类群体)科研人员对数据重用实践的态度和感知方面的差异, 结果显著的测量项指标如表3 右数第二列所示。计算方式如下: 组间差异=专职科研人员在该项的得分均值-硕博生群体在该项的得分均值。

由表3 可知, 专职科研人员组别仅在X5、X6、X25 这3 个测量项上的表现优于硕博生组别。即专职科研人员对数据重用在本领域的普遍程度(X5、X6)的感知要优于硕博生组别, 并且专职科研人员实际重用科研数据的次数(X25)明显大于硕博生组别。而在其余与态度、感知规则熟悉程度、感知支持措施实用程度相关的测量项中, 专职科研人员的自我报告得分均轻微落后于学生群体。

该结果说明, 专职科研人员群体并未如意料中的因为重用数据经验较为充足而更加熟悉科研数据重用的流程、环节与规则, 所以不应对某一群体的科研数据管理基础做出预判。因此, 科研数据管理培训应当面向专职科研人员和硕博生等不同岗位状态人群, 设置不同层次的培训服务, 必要时应更好地发挥“嵌入式”服务的作用。近期Nature 子刊《Sci?entific Data》发表的一篇文章也得出类似研究结论。该文作者通过调研发现, 科研人员在重用共享的数据时存在许多障碍, 例如, 在申请机构批准、选择数据使用协议和操作数据访问应用程序等环节遇到多种“摩擦” (Friction)。这种“摩擦” 使得评估数据集的潜在效用成为一个令人沮丧和耗时的过程, 导致许多原本能够通过重用来增加数据集价值的研究人员会因此放弃[37] 。所以, 对应到本文调研结果中, 生物学领域不同岗位状态用户之所以对相关社群文化基础、环节流程感知较弱, 也需要探究对现有数据重用流程相关服务进行简化优化的实施路径。

3.2.2 有无重用经验在数据重用态度和感知中的差异

本文将“有重用经验” 和“无重用经验” 分别进行标注。逐一对测量项进行方差分析, 其中结果显著的测量项指标及组间差异情况如表3(最右列)所示。

由表3(最右列)可知, 除X6 指标外, 其余3个显著的测量项中, 有重用经验的人员不如无重用经验人员对于数据重用的态度积极, 感知指标结果更不敏锐。其原因可能在于, 部分科研人员在重用过程中的某些实践环节(诸如开放自身数据、检索数据集、理解重用许可要求等方面)遇到多种阻碍,影响其继续开展重用实践的积极性。因此, 需要进一步细分不同科研用户群体, 深入其重用过程中的具体环节, 探索更有针对性、协同性的支持措施。

3 3 层次聚类与用户群体特征画像

由3.1、3.2 节的分析可知, 在我国生物学领域中, 无论是硕博生还是研究人员群体均需要科研数据管理培训, 以便规范自身的数据重用行为。但现有科研数据管理服务尚存提升空间。因此, 探究不同用户群体更加个性化的需求, 以画像方式细分用户群组, 有利于更有针对性地提升我国生物学领域科研人员在科研数据重用实践过程中的体验。

重用实践中的开放与重用文化建构对数据重用实践培育具有重要意义。已有研究对各类潜变量在我国科研人员科研数据重用行为方面影响的探究已较为充分[14] 。为更好地发挥“自上而下” 和“自下而上” 两种数据社群培育路径的协同作用, 本部分则着重关注“态度” “感知社群文化基础” (“自下而上” 路径)和“感知规则熟悉程度” (“自上而下”路径)这三方面内容, 以探究当前我国生物学领域数据重用文化培育的相关阻碍。因此, 本部分以个案为依据, 选取与科研人员的态度、社群文化基础、规则熟悉程度这3 个潜变量相关的测量项(X1 ~X11)进行层次聚类分析, 以发现科研人员的数据重用行为特征的类别。

根据预期聚类结果的范围, 分析层次聚类结果。在聚类结果中, 存在两个异常个案(Case)(S-7 和S-156 号, 二者中有两组连续5 项以上的题目选项相同, 綜合答题时间较短), 将二者排除后重新聚类。根据预计聚类数量范围, 选取距离15 作为划分类别依据, 共得到6 大类科研人员群体。根据聚类结果, 统计出每组内的个案数量以及在11个影响因素中的平均值, 并计算出每个测量项的加权平均值, 方便后续对结果进行组间比较与特征归纳。对聚类出的6 个组别在态度、社群文化基础、规则熟悉程度这三方面的测量项得分与加权平均值进行比较, 统计出各组内具备重用经验人员的数量。归纳各类别科研人员的特征并对其进行命名,结果如表4 所示。

根据有无重用经验将科研人员分为“参与者”与“潜在参与者” 两大类。再结合这些组别在三大类潜变量测量项中的差异, 对其进行具体命名。以下详述六类用户的特征。

1) 参与者大类中具体画像类别说明

“初步探索型参与者”: 该类科研人员对数据重用活动积极作用的认可度(态度)较低, 对现有重用规则不熟悉, 但却认为当前数据重用活动在其研究领域中较为普遍, 取得了一定程度的发展。同时, 该类别中的绝大部分成员具备重用数据经验,所形成的态度很可能与其重用经验有很大的关系,但从其自身对数据重用规则的了解程度来看, 该类人员对重用实践的满意度、参与度较低。

“边缘观望型参与者”: 该类科研人员对数据重用活动价值认可度也相对较低, 但认为当前有关数据重用的社群文化已有一些基础, 且自身对数据重用规则也较为熟悉, 这可能与该类用户参与重用实践占比较高, 无形中了解到一些重用相关规则有关。

“被动型参与者”: 对数据重用活动的态度与“初步探索型参与者” 处于类似低位, 但其在社群文化基础感知以及规则熟悉程度方面均较高, 且该类用户参与重用实践的比例略高于“边缘观望型参与者”, 因此更可能是由于具体研究范式中数据重用是其重要环节, 客观上需被动参与, 但并未深入反思重用价值。

2) 潜在参与者中具体画像类别说明

“期待型潜在参与者”: 该类科研用户对数据重用价值的认可度和感知规则熟悉程度较高, 但认为当前社群中对于重用实践的文化和氛围还尚未形成,且其目前的研究活動中较少涉及数据重用的机会。

“徘徊型潜在参与者”: 与“期待型” 相似, 该类用户对数据重用价值认可度更高、相关规则也较为熟悉, 但目前重用实践参与机会更少。

“摇摆型潜在参与者”: 这类用户在对数据重用价值认可度、感知社群文化基础和感知规则熟悉程度方面均属中等偏低。但由于该类用户的规模体量最大, 且目前相关影响因素项的感知水平较低, 因此是后续进行服务设计时需要重点关注的一类对象。

4 研究建议

依据上述对中国科学院生物学领域科研人员的调研结果, 本研究将从图书馆和数据中心等信息服务机构开展科研数据管理服务的角度, 首先以用户画像结果中某一组别表现较差的影响因素(得分在“中” 及以下)作为首要参考依据; 其次, 依此类推分析该组用户在实际数据重用过程中的具体特征;最终提供具有针对性和可实施性的服务建议。总体上, 本研究建议信息服务机构提供“层次化” 和“梯度化” 的数据社群培育支持服务, 从而在“自下而上” 的数据社群培育路径方面进行更有效地服务设计。

4.1 “层次化”的数据社群培育路径

4.1.1 针对我国生物学领域科研数据重用“实际参与者”

初步探索型参与者在态度和感知规则熟悉程度方面得分较低, 具体重用实践培育服务方式可包括:①高校图书馆联系相关院系, 共同组织开展科研数据重用实践工作坊, 着重从技能提升方面开展数据重用的小规模手把手教学, 从数据清洗处理等质量控制角度、数据可视化与内容报告合规使用等角度设计服务; ②由专业的学科馆员建立相关的数据管理交流讨论群, 便于第一时间解决科研人员在数据重用活动中遇到的问题。

边缘观望者在态度方面的得分为中低, 具体服务方式可考虑: ①图书馆或数据中心开展配套的数据监管服务, 如定期推送领域相关数据资源列表、或整理采用以数据驱动方式得出结论的文章, 进一步增强科研用户重用开放数据的意识; ②在信息素养教育类课程、学科数据分析类课程中, 介绍或引导学生参与开放数据的重用活动。

被动型参与者在态度方面的得分低, 但感知社群文化基础和规则熟悉程度较高, 该类科研用户呈现出“任务驱动” 的特点。虽然对数据重用的积极作用认可度低, 但是认为当前学科领域中数据重用实践较为普遍, 并对其中的规则较为熟悉。因此可通过政策上额外的激励措施, 使科研人员能够切实体会到数据开放或重用的实际益处。例如, 科研评价时增设开放数据、数据重用相关的评价细目。

4.1.2 针对我国生物学领域科研数据重用“潜在参与者”

期待型潜在参与者的感知社群文化基础较低,服务方式可着重布局如下方面: ①通过与专业学(协)会合作, 举办开放数据大赛, 提升数据重用活动在科研群体中的影响力; ②高校图书馆、学(协)会等机构可牵头开展整合学科领域团队的活动。如搭建相关的数据交流平台, 或在相关的数据管理社区创建专栏, 促进科研社群进行在线讨论。

徘徊型潜在参与者同样感知社群文化基础较低, 且对已有重用规则的熟悉程度为一般。服务方式可着重布局如下方面: ①加强学科/ 数据馆员与一线科研人员的联系, 如建立线上线下咨询的专门通道, 便于及时询问与解决用户疑问, 提升服务响应能力; ②整合网络资源, 形成较为系统化的学习资源列表, 可根据学科分类细化数据重用资源的监管服务, 形成自助式查询入口, 以帮助参与意愿较高的科研人员快速了解、规范开展科研数据重用活动。

摇摆型潜在参与者在态度、感知社群文化基础和规则熟悉程度方面均偏低。可主要采取如下优化服务: ①以云盘的方式提供数据存储服务, 帮助科研用户解决在科研过程中的固有存储需求; ②在数据存储平台上集成数据管理功能, 从而达到“用户引流” 的效果。鼓励用户探索与使用相关数据管理功能, 采取向导方式更好地引导科研人员规范地开展数据重用工作; ③数据中心、图书馆也要通过线上线下的各种渠道, 推送开放数据重用的系列文章, 并且在开展宣传的同时给出开展数据重用完整流程的指导文档列表, 便于用户“按图索骥” 地进行系统式学习。

4.2 “梯度化”的数据重用实践服务

4.2.1 初级阶段: 以数据发现、重用教育为主的多场景、即期科研数据实践辅助服务

分析结果发现, 有重用经验的组别除对数据知识库使用规则较为熟悉外, 在开放个人数据集的态度、发现已有数据集、使用已有数据集的要求方面,均落后于非重用过他人数据的组别。因此, 在数据重用实践服务的初级阶段, 可由图书馆、数据中心发布和维护定期更新的重用数据资源列表, 呼吁其所属高校或科研机构, 将数据集检索、数据重用要求等方面知识纳入通识的信息素养教育课程内容大纲, 面向已有重用经验的科研群体也要制定基础数据重用知识的方案; 有条件的机构也可先行探索开设相关课程资源, 并通过开放教育资源的形式进行共享或通过专题研讨会的形式开展交流。同时, 各类型信息服务机构可以增强生物学领域不同岗位状态科研人员的数据重用能力为目标, 设计提供培训型、指南型、最佳实践工具箱, 或直接为开展一对一参考咨询提供实践辅助服务, 以实现自下而上的数据重用文化构建。

4.2.2 中级阶段: 以扩大体验、有序供给为主的多轮、短期科研数据重用沉浸式体验服务

分析结果发现, 当前我国生物学领域科研数据重用活动中占比最大的用户群体为摇摆型参与者(258, 85. 71%)。因此, 在促进数据重用实践服务的中级阶段, 要以解决其最迫切的存储需求为主,同时拓展提供数据采集、加工、挖掘、应用等不同阶段的配套服務, 使更多“摇摆者” 在科研生命周期的各环节中都能随时了解和参与到数据重用实践中。图书馆或数据中心为其所属机构提供数据重用相关课件素材时, 要兼顾不同学科的数据类型、内容复杂程度、用户数据分析能力等维度, 从而更加有效地吸引“摇摆者” 的参与; 针对科研数据重用过程中用户担心的权益问题, 信息服务机构可联合相关知识产权组织机构, 共同收集最佳实践案例或编制具有梯度层次的重用权益指南, 从而为“摇摆者” 提供可自查、易应用的权益指导; 尝试通过多媒体资源形式进行项目设置, 增加数据重用实践的趣味性和互动性, 更好地吸引“摇摆者” 的参与。

4.2.3 高级阶段: 以增加记忆点的数据重用社群文化构建为主的中长期项目服务

分析结果发现, 专职科研人员有更多的数据重用经验, 但其在态度、感知规则熟悉程度和感知服务支持措施有效性等方面的自我报告得分均略低于硕博生组别。这表明, 当前我国生物学领域社群文化基础较弱, 后续对于科研数据重用的宣传可以从提升科研用户的记忆点、提供多样化的服务方式以及加强科研数据管理机构对用户社群数据重用的支持程度等方面展开, 例如, 有效利用图书馆网站、数据中心平台、微信公众号等各类社交媒体[38] ,每周组织专业团队举办开放咨询日活动等; 同时可以采用迭代设计[39] 的方式来创新科研数据重用实践服务。首先面向承担更加复杂数据重用任务的团队开展调研, 以识别科研用户不同的需求层次以及在权益管理方面的“痛点”, 形成原型化的科研数据服务产品, 包括但不限于相关培训资源、相关服务平台、沉浸式案例参与工作坊; 随后对相关科研数据服务原型产品的应用效果开展后续多轮反馈收集, 从而进一步优化现有服务并开发新服务, 保持用户社群的长期有效记忆。

5 结论

数据重用的最终目标是促进形成数据可持续流动的生态系统。基于实证结果, 笔者建议对数据重用实践建构的典型路径进行内容扩充, 即在“自上而下” 的环境规范基础上(如: 政策、基础设施、规范化流程、包含贡献确认在内的激励措施等内容), 更应注意“自下而上” 的数据流动(如数据开放端和监管端的质量控制, 数据重用端的合规使用与循环开放等服务方式), 从而形成由数据资源和数据工具的应用所带来的一整套社会、技术、行为、文化方面的内容体系(也即数据文化)[40-41] 。目前, 国内的部分科研院所已开始探索数据发现、专题服务、数据分析等集成功能, 从而进一步完善科研人员在重用实践中的体验[42] , 这类集成化生态建构, 是一种有益的服务实践探索。

数据重用文化的培育对营造良好数据生态至关重要, 它是推行政策制度和开展实践行动的重要保障。在我国现有数据环境下, 需根据用户群体“由简至难” 的层次化重用需求, 提供包括但不限于开发课程资源、提供工具系统、制定科研绩效评定激励措施、收集最佳实践案例、编制数据重用实践案例讲解手册[43] 、开展数据叙事的小型工作坊等相关服务, 同时也可借用当前发展迅速的人工智能技术, 配置有关数据重用权益管理方面自助问答服务, 使得具体学科中的宣传教育、工具服务、政策机制与社群中的重用文化氛围相互促进发展。

本研究不足在于, 目前仅通过某一学科领域实践讨论数据重用文化建构的培育路径, 在结论普适性方面尚需探索。未来研究可关注对相似学科领域的对比性分析, 深入探索我国实践情境下数据重用文化建构体系。

致谢:感谢中国科学院文献情报中心顾立平研究员、梁永霞编审在本文写作过程中给予的相关建设性意见。

猜你喜欢

社群科研人员领域
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员破译黑猪肉特征风味物质
治疗艾滋病,中国科研人员有了新发现
广东公安科研人员风采
领域·对峙
社群短命七宗罪
新常态下推动多层次多领域依法治理初探
母婴电商的社群玩法
VC靠边!社群股权众筹来了
天使进化——VC靠边!社群股权众筹来了