科学素养视角下高校实验室研究数据管理信息化的策略研究
2023-01-19肖婷陈慧
肖婷 陈慧
四川大学华西第二医院/出生缺陷与相关妇儿疾病教育部重点实验室 四川 成都 610041
引言
研究数据是指“通常被科学社会所接受的,用于验证研究发现的被记录的必要的事实材料”[1]。该定义包括了分析数据和用于描述这些数据是如何产生的元数据。在大数据时代背景下,快速兴起的数据密集型科学研究[2],表明巨量科学数据的聚合、分析和探索,已然成为科学研究的新基础,将加速推动新科学方法的发现。
高校实验室作为科研活动的重要阵地,是研究数据产生的主要来源,目前大多实验室仍沿用传统纸质载体对研究数据进行管理,由于科研参与人员在实验记录方面的科学素养主观差异性较大,从而导致研究项目中的知识传递极易出现断层和偏差,数据监管也暴露出较大疏漏,严重影响了科研成果的有效延续和应用。
本文将基于科学素养的视角,探讨如何在实现研究数据全周期质量管理的同时,提升研究人员的科学素养,促进科技创新的高速发展。
1 传统管理模式的弊端
由于实验室研究参与人员科学素养的个体化差异,在科研创新大环境下,传统纸质载体的研究数据管理模式,使得科研团队不易协作性愈加突出,其劣势日渐凸显。
1.1 传统模式下,研究数据的规范生成缺乏有效的管理手段
传统的纸质记录,偏重于对记录完成的检查,而对研究人员过程记录的细节规范约束性不足。尤其是部分高校实验室忽视对研究相关工作的要求和管理,当有些研究人员离开实验室后,其研究成果需要进行深入探究时,其他研究人员无法看懂和理解该实验记录,无法重复原来的实验条件和实验步骤来得出相同的实验数据,当已发表的研究成果遭到质疑时,无法提供有效的原始记录[3]。因研究数据缺乏有效的管理手段,使产生研究数据的记录的细节规范缺乏约束性,导致研究过程中得出的研究数据存在多种隐患。
对研究数据的实验记录规范培养不足,同时,重研究结果轻培养过程的普遍现象使研究人员更关注实验进度和部分阳性结果,从而导致记录较为随意,时间不详细,没有条理,书写混乱或表述不专业,实验过程和数据记录不及时,后期凭记忆补记,造成许多细节被遗漏;仅有过程描述,无实验现象和实验结果的描述等。以上行为都可能导致无法还原最初的实验条件和实验步骤,无法重复实验结果,使得已产生的实验数据失去其科学价值。
1.2 传统模式下,研究结论的得出缺乏有力的监管体系
目前,多数高校实验室的研究人员是自主管理实验安排和记录数据,传统的纸质记录产生的研究数据,由于负责人的工作日程安排不固定,难以实现及时有效的进度交流和核对检查。同时,传统模式下,纸质记录具有时间和空间的滞后性,不利于监管,不利于共享和深入开展研究工作,并且导致研究人员往往只关注对自己实验结果有利的部分数据,缺乏对实验数据的深层次挖掘,一定程度上造成实验研究的不全面,降低了研究效率,对于科学研究的投入是极大的浪费。
近年来,在科研活动中,违背科研诚信要求的事件频发,科研诚信失信行为常见于各类媒体,以国家自然科学基金委员会为例,近年来就查处了多起不端行为案例[4-5]。因传统管理模式对研究数据缺乏有效监管,使研究人员有机会对研究数据编造,篡改科研活动中产生的元数据,使数据更理想化,以支持所研究的观点,从而易出现科研诚信问题。
1.3 传统模式下,研究数据的保存不利于共享和延用
高校的研究项目一般持续时间较长,而实验室研究人员流动性较大,传统纸质为主的研究数据的记录容易造成研究项目的断层[6],记录零碎分散,不易保存和不便检索的弊端不利于实验室传承和存储共享,难以实现知识共享和有效利用。
调查发现[7],个人电脑、光盘、移动硬盘、机构电脑等是科研人员保存数据最主要的方式,此外,也有部分科研人员选择保存在纸质载体和网络硬盘上。我国研究数据的保管主要以个人为主(超过80%)[8],这给数据的共享与安全带来不利影响:一是数据分散在个人手中,导致研究数据管理混乱,零碎分散,不仅规范性差、不易保存,不也无法快速检索、查看,使数据不会被公开或者共享给其他研究人员作为研究依据,这对于科研经费的投入是极大的浪费。二是分散保管容易造成数据的丢失和损毁,缺乏手段进行数据记录的规范化管理,数据的安全面临风险。
2 发展趋势
2.1 任务要求
高校作为科研活动的重要阵地,拥有巨量的研究数据,同时,高校研究数据的管理也是国家研究数据管理的重要一环。国家对研究数据管理高度重视,为加强我国科研数据管理的规范性,2018年4月国务院办公厅印发《科学数据管理办法》[9],规定科学数据管理工作实行国家统筹、各部门与各地区分工负责的体制,并明确规定高等院校是科学数据管理的责任主体,应该建立健全本单位科学数据相关管理制度,同时对我国科学数据管理的数据的采集、记录、保存与汇交、共享与应用等方面都进行了规范。对推动科研数据管理与共享实践和促进科技创新具有重要的意义。
2.2 必要手段
近年来,随着信息技术的快速发展与应用,以及互联网+时代的到来,信息化建设不断加强,实现研究数据信息化管理成为必备的工作需求。利用研究数据的信息化管理,可以更加有效地引导研究参与人员完成研究数据的标准化收集、规范性记录、系统分析、完整保存和无偏差的共享。同时,在确认科学问题、使用证据、深入思考、做出科学结论的反复训练过程中,强化知识的理解,训练科学思维以及应用科学知识解决科学问题的能力。
3 策略与建议
大数据时代,对于科研数据的应用和转化,如果没有更加有效的管理手段和途径,科研创新的进度将被严重阻碍和滞后。因此,如何行之有效地进行研究数据管理,在社会发展需求背景下,具有重要的现实意义。
3.1 以实验记录为管理基线,构建研究数据的信息化管理系统
研究数据产生于科学工作流,拥有自己的生命周期。英国DCC将研究数据生命周期分成6个阶段,包括创建、处理、分析、保存、获取、重用,而数据管理是为了以一种有效的方式管理数据生命周期的需要,是一系列架构、政策、实践和程序的开发和执行活动[10]。
研究数据信息化管理系统主要用于实验记录、分析方法库的建立和实验数据的规范管理,确保所有的研究数据都能被适当地记录下来,并在必要时得以使用。实验记录中保存的研究数据,须设计含有多个功能模块的实验记录模板,模板中可容纳被允许的记录要求和研究数据保存形式,包含实验基本信息、记录正文、元数据保存提交等内容。
良好的数据管理是研究过程各阶段的基础,为了有效推动科研发展,应在实验室研究工作的开始就着手建立。以实验记录为管理基线,规范研究数据记录流程,提高研究数据利用效率,全面整合资源,以期实现对实验过程中的记录、结果分析、储存、数据监管和应用在一定范围内共享的研究数据信息化管理,实现数据生命周期内“记录-保存-监管-应用”的完整链条,为科研人员提供一个优质、高效和规范的创新环境,构建规范、高效和适用的研究数据管理系统。
3.2 在研究数据全生命周期的动态管理中不断强化科学素养
通过对研究数据生命周期管理,将数据采集、数据记录、数据保存、数据分析与挖掘等过程痕迹化,一方面,在后续实验过程中重新分析结果时有了更加可靠的数据支持,另一方面,通过研究数据监管信息化,实验记录可实现动态管理,随时检查,便于负责人员或管理人员及时发现和纠正实验过程中发生的错误或疏漏,在存在异议时给予及时指出,使实验结果真实、可信,避免学术造假等学术不端行为。
研究数据记录是研究项目成功的关键因素之一,强调对数据过程和结果记录要及时、真实、清晰、完整和规范,以保证研究数据的真实性和规范性。在研究数据保存方面,强调上传保存所有的原始数据,使后续研究重新分析研究结果时有数据支撑,也杜绝了学术不端的可能。除上传原始数据外,还要求研究人员对上传的数据进行分析说明或归纳总结的详细而准确的解释性文档,以便他人查阅和理解其研究结果,同时也是对研究人员进行科研素质训练。在数据监管方面,强调研究负责人及时审阅研究人员的研究数据记录,同时通过信息化管理系统与研究人员进行有效互动,共同分析实验结果,评价研究项目进展,及时拟定下一步工作计划,该系统使研究数据在细节方面的管理提供了多样化的呈现,对科学素养形成进行了强化。
信息化的研究数据管理体系有利于固定化培养研究人员的规范操作、规范记录、规范分析与研究探讨,在研究数据产生、管理和重用的全生命周期各环节,设置质量管理要求,在整理数据、分析数据、得出科学结论的循环中,不断强化数据意识,提升研究人员归纳、分析、总结、探究的科学思维能力,进而促进科学素养的形成。
3.3 信息化管理模式是实现实验记录数据标准化共享的前提条件
信息化手段在研究数据管理过程中的应用,可以更好地实现研究数据的规范化、精细化、动态化、高效化管理。研究数据应该包括所有可以用来验证结果的,支持研究问题的证据。为了使研究数据在其生命周期中易于发现、使用和管理,研究人员必须确保创建和维护足够的文档或元数据,保存更为完整的数据、描述和观察,通过更为客观的信息,进而获得科学规律。
实验记录模板的设计应突出以人为本的理念,通过便捷的撰写录入,在记录和保存的过程中逐步落实研究数据的规范化要求,可以有效解决传统的实验记录或纸质书写录入报告时可能出现的数据不清楚、格式不规范、难以溯源等问题,避免因科研人员流动、基层管理疏漏及仪器设备更新问题,造成实验记录和数据的流失和损坏。
在线化的研究数据管理系统能够实现快速检索和回顾查看以往各阶段的实验设计和过程细节,有助于研究者保持清醒的实验思路,把握实验执行进度,提高科研效率,抓住关键的实验现象,准确回顾和分析科研实践中的成败得失,得出更加可靠的实验结论。
同时,实验室研究数据信息结构化,实现了即时互通和交流共享,同时,负责人可通过系统对研究数据进行限时的审核归档,使研究数据得到有效监管和及时保存。
信息化管理模式的应用可以高效地提高各种格式的研究数据创建、组织、存储和分发,有利于研究数据的访问、整合、发现、共享、长期保存和重用,使研究数据更加具有可读性和可交流性,提高了知识传递的效率,让研究数据的提取更加直观和便捷,降低科学研究成本,也切实保障了科学研究过程的可回溯性和验证。
4 总结与展望
数据处于研究的核心位置,由研究项目过程创建,拥有比研究项目更长的寿命[11]。有效的研究数据是孕育科研成果的源泉。在科技创新背景下,加强高校实验室研究数据的信息化建设是必然发展趋势,也是促进科学素养教育的重要手段。研究数据管理必须贯穿于整个研究数据生命周期,高校实验室的研究人员应转变心态,接受和适应信息化转型,加快科技创新进程,提高研究数据管理能力,规范科学素养的培养过程,孵化更多的研究成果。