APP下载

《处于十字路口的大数据基础设施:高校的支持需求和挑战》报告解读与启示

2023-06-17陈宝美

图书馆界 2023年2期
关键词:科研人员基础设施图书馆

陈宝美

(福建农业职业技术学院图书馆,福建 福州 350303)

大数据作为新型战略资产正深刻影响着人类的生产生活及对世界的深层理解,催生了以大数据为核心的新思维、新组织、新研究范式和新基础设施。大数据基础设施是以数据为中心,深度整合计算、存储、网络和软件资源,以充分挖掘数据价值为首要目标的基础设施。大数据分为不同类型,科研大数据作为科学研究的驱动力,引发各界高度重视。科研大数据基础设施建设亦被世界各国提升至国家战略层次。科研大数据基础设施包括知识资源(馆藏、档案和科学数据等)、电子基础设施(数据和计算系统、通信网络等)以及其他促进科学研究的工具和服务[1]。在政府部门的引导和推动下,高校积极参与国家级或区域级科研大数据基础设施建设项目,加速布局科研大数据基础设施,取得初步成效。目前,高校科研大数据基础设施正实现由大数据平台向数据云平台过渡,处于转型升级的重要“窗口期”,有必要在回顾历史的基础上形成对新发展阶段的正确认知,包括认识该阶段的挑战与机遇,尤其是科研大数据的产出过程、管理方法与流程以及研究人员面临的问题。为此,Ithaka S+R联合来自20多所高校图书馆的馆员,开展面向科研人员的联合调研项目(下文简称“调研项目”),分析总结新发展阶段基于大数据的科学研究应如何开展,明确了基于大数据的科学研究方法、研究流程及研究产出等内容,并于2021年12月将调研结果发布在《处于十字路口的大数据基础设施:高校的支持需求和挑战》报告(下文简称“研究报告”)中[2],以期为高校、图书馆、资助机构及其他参与方提供指导和建议,助力高校科研大数据基础设施的建设。

1 研究报告的主要内容

Ithaka S+R联合调研项目组对来自不同领域的研究人员持续进行半结构化访谈,访谈围绕大数据环境中的科研方法及科研支持需求展开,提炼形成调研结论。1)针对复杂数据管理问题:数据的获取、清理和管理是劳动密集型工作,成本较高,在一个数据相对丰富的时代,研究人员为节约生成新数据的费用,在可能的情况下,选择使用现有数据。2)针对科研协作问题:科学研究需要教师、教职员工、学生以及校内外参与者的广泛协作;实验室是研究的核心单位,学生在研究过程作出了重大贡献;研究人员通常更喜欢本地的基于实验室的存储和计算资源,而不是集中式校园存储资源和云计算服务。3)针对知识分享问题:尽管同行评议文章仍然是学术交流中最受欢迎的形式,但研究人员亦共享包括数据和代码在内的更多开放研究成果;共享实践远超在开放存储库中类似FAIR(Findability,Accessibility,Interoperability and Reusability)标准的正式共享,呈现出多类型的非正式共享;数据派生、质量及来源问题是知识分享的主要障碍。4)针对大数据伦理挑战问题:大数据研究的伦理维度仍然存在争议,如对学术伦理审查委员会(Institutional Review Board,IRB)法规适应性的担忧,导致研究人员无法确定伦理研究行为的最佳实践。5)针对科研培训形式问题:研究人员倾向于参加非正式培训,对缺乏灵活性的正式培训兴趣不大。6)针对科研大数据基础设施建设参与度问题:大数据基础设施建设是跨学科工作,不同学科的不同激励体系、资助体系会影响研究者对项目的参与度。基于上述主要调研结论,研究报告对高校大数据基础设施建设参与各方也给出了指导和建议(见表1)。

表1 研究报告为参与方提供的指导建议

续表1

2 研究报告的深层解读

2.1 解析了高校大数据基础设施建设的新形势

在新的学术生态环境中,云计算、大数据和人工智能等技术正深刻影响高校的基础设施建设,以数据为中心、由数据驱动应用正成为高校基础设施的典型特征。科研大数据基础设施作为科学研究范式转型的底层基础,即将迎来大发展。报告中的“十字路口”包括两层含义:一是不确定性。从大数据平台发展到数据云平台,高校大数据基础设施建设进一步朝着智能化的方向转型迈进,在取得阶段性成果的同时也面临新的严峻挑战,表现为各高校大数据基础设施仍呈现分散与孤立状态,远未达到全球数据共享、合作研究的最终目标。此外,高校大数据基础设施建设在跨学科合作、数据共享、数据管理、数据伦理方面仍面临的一系列挑战[3]。二是选择性。身处转型发展的新阶段,参与高校大数据基础设施建设的各方主体,均期待自身能够作出准确判断,在明确新定位、阐述新职责、确立新机制的基础上凝聚共识,引领大数据基础设施建设的新方向。在“十字路口”的正确抉择,既需要迎难而上的创新和对发展趋势的深度洞察,也需要对产业、技术、用户市场需求的变化保持高度敏感性。为此,Ithaka S+R联合调研项目组立足科研人员的需求,通过访谈获取大量第一手资料,研究报告不仅对现有基础设施有效性进行评估,更全景式地展现高校大数据基础设施对研究人员支持的现状,启发多方参与者理解科研需求的变化,思考基础设施建设的变革,揭示高校未来大数据基础设施的建设路径。

2.2 明确了高校大数据基础设施建设参与者的职责

高校科研大数据基础设施建设既具有传统基建的特征(公共性、通用性与基础性等),又具有新基建的特征(技术性与专业性),需要参与方集聚智慧并发挥合力,各参与方既分工明确又相互协作,通过制度创新加快系统中要素资源流动,推动构建高校科研大数据基础设施建设。为此,Ithaka S+R联合调研项目组聚焦科研人员、高校教师、IT和信息专业人员、图书馆员、科研与法律办公室行政人员、学生等广泛群体的正式和非正式合作,挖掘不同参与主体在高校科研大数据基础设施建设中的共同诉求,促进要素资源合理流动和集聚,平衡利益和风险,鼓励和引导多方参与,并在研究报告中明确各方参与者的职责:1)高校科研管理部门主要承担规划引导、统筹协调的职责,作为支持机构,它的工作重点是制定基础设施建设计划和行动方案,提供技术与沟通支持,开展其他行政性工作,并评估建设成效。2)教学与研究部门主要支持师生开展项目研究和人才培养,普及与推广设施的应用。3)图书馆主要承担专业化知识服务的职责,包括扩展数字学术资源(数据集)、促进学术交流、开展数字技能提升服务等。4)资助单位主要承担政策引领和资金扶持的职责。5)学术社区主要承担文化引领和学术氛围营造的职责。6)供应商则主要承担其他辅助支持服务的职责。

2.3 阐释了高校大数据基础设施建设的行动路线

高校应以满足科研人员的需求为中心,以新的数字化理念和方法为指导,重新定义高校大数据基础设施的建设战略及行动路线。Ithaka S+R联合调研项目组在与科研人员及其他参与方协商探讨的基础上,形成对未来的科学判断,并从数据、服务、制度、规则等四个维度给出面向未来的建设行动路线。1)数据层面。从丰富元数据提升研究数据的可发现性、建立数据标准格式促进数据交互、形成一致且自动化的工作流程以简化科研人员的活动、强化使用许可促进数据复用等方面着手,提升数据质量,确保正式和非正式的研究输出,依据FAIR研究数据原则有效实现数据的发现、获取、交互和复用[4]。2)服务层面。从强化数据供给、开展服务营销、开发资源导航和指南、强化咨询和培训等方式入手,提供满足科研人员多样化需求的精准服务。3)制度层面。支持构建涵盖资源和行动协调、法律和伦理指导、数据规则、数据能力等要素的数据基础设施评估制度;提出涉及本科生和博士生的学校教育制度;提出涉及“招聘、任职、晋升”全流程的在职教育制度;建议出台支持跨学校、跨领域的合作制度与稳定的资助制度。4)规则层面。从数据质量管理、数据隐私与伦理保护、数据安全工作等方面入手,在现有法律和技术框架的基础上形成新的法律治理框架。

3 研究报告带来的启示

3.1 认清高校图书馆参与大数据基础设施建设的必要性

其一,环境要求。2021年7月,教育部等六部门发布《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》,提出将信息网络、平台体系、数字资源、智慧校园等新型基础设施作为建设重点方向,到2025年基本形成结构优化、集约高效、安全可靠教育信息基础设施体系的建设目标[5]。以国家大数据、新基建战略为引导,我国高等教育正处于依托新基建打造“数字底座”,激发教育变革内生动力,推动教学科研数字转型、智能升级、融合创新,迈向高质量发展的关键转型期。科研大数据基础设施建设是教育新型基础设施建设的重要内容,新发展阶段,需要高校图书馆及其他参与方在系统研究的基础上形成对数字化趋势和用户市场需求的精准洞察。其二,使命要求。高校图书馆的核心使命是促进知识传播和管理。大数据环境下,学术知识的表现形式非常丰富,研究过程中产生的数据、会议演示、学者间的在线讨论、持续的社区讨论、公开的同行评审、数据再利用、正式或非正式学术活动成果等共同构成科研大数据的内容载体。作为学术社区的重要基础设施,高校图书馆需要从提供服务支持、发展合作网络、强化人才培育等三个层面发力,积极参与到高校以“融合、协同、智能、安全、开放”为特征的科研大数据基础设施建设中去,让数据存得了、流得动、用得好[6],增强科研大数据基础设施的弹性,提升学术社区的科研生产力、灵活性和创新性。

3.2 精准把握高校图书馆科研大数据支持服务的丰富内涵

高校图书馆应精准把握科研大数据支持服务内涵,遵循高校大数据基础设施建设行动路线,聚焦数据、服务、制度和规则等维度的要素建设,从科研数据全生命周期管理视角出发,从数据接入、存储、计算、管理和赋能等五个方面入手,强化高校图书馆的数据采集、存储、计算和管理服务,同时从数据治理全流程视角出发,从数据战略、数据架构、数据质量、数据标准、数据应用、数据安全等多个层面切入[7],提供嵌入式科研大数据支持服务。具体来说:1)高校图书馆应基于“国家数字图书馆工程”这一信息基础设施,以数字馆藏为核心,盘活已有数据库、机构知识库等数字资源,开放访问接口,通过与其他高校图书馆、开放知识库的聚合关联,建设高校图书馆“大数据”体系,使其成为科研大数据底座中的重要组成部分。2)高校图书馆应立足长期开展嵌入式科研支持服务经验,继续加强图书馆与科研人员间的沟通和了解,缔结相互信赖的友好关系,通过实地调研,精准了解科研人员的研究经历、面临的挑战以及最迫切的需求,针对性地完善科研大数据支持服务。3)高校图书馆应立足于其在知识组织领域的专长,通过强化数据集馆藏建设、加强数据管理、参与数据集标准化建设等具体路径落实科研大数据支持服务。高校图书馆需要科学制定数据集馆藏发展规划,合理分配预算,建立数据集采购决策的评估机制,加强与供应商的协商,获得更多授权和许可,在法律允许范围内保障数据集的合理使用[8]。在数据集馆藏建设过程中,高校图书馆可通过智能采集技术自动捕获科研人员的产出,协助学术社区建立共享数据集[9]。同时,高校图书馆应积极创建并维护管理组织的数据资产清单(数据目录),开发数据管理工具包,构建数字资产管理系统,并面向用户提供数据管理课程培训和咨询服务。此外,为了推进数据集的标准化建设,高校图书馆应探索建立符合开放共享要求的元数据通用描述标准和交叉链接框架,加快推出共享数据的标准格式和开放API等。

3.3 积极拓展高校图书馆科研大数据支持服务的相关培训

高校开展科研大数据服务对图书馆员及科研人员均提出更高的职业能力要求,高校科研人员及科研办公室在获得科研支持和强化科研合作方面,对高校图书馆服务的期望值越来越高。未来图书馆员将承担科研大数据资源建设、科研大数据知识管理、科研人员数字科学技能培育等更多职责。因此,高校图书馆应顺应科研大数据基础设施建设和发展趋势,构建与之契合的人才培育模式,助力培养具有数字思维能力和数据分析素养的专业人才。具体来说:一是要革新教学理念并创新教学模式。根据大数据研究支持需求,动态调整馆员培养目标与核心培训内容,推动传统LIS(LIBRARY AND INFORMATION SCIENCE)课程与数据科学的加快融合,关注跨学科的复合型数据科学能力和实践应用能力培养,采用灵活的授课和认证模式,开展多元化的图书情报专业人才培育[10]。二是要营造馆内浓郁的大数据服务氛围。通过线上线下授课、工作实践、论坛交流、会议研讨等多种形式,打造涵盖大数据通识教育、专项教育和拓展教育的馆员在职学习培训体系。三是要面向馆员和用户开展大数据服务专项培训。结合科研人员需求,高校图书馆明确专项培训目标、培训路径与实施策略,通过访谈、问卷、实地观察等方式深入调研不同专业、不同层次科研人员的数据科学能力培训需求,制定分层次、分类别、针对性的培训计划,融合采用视频教学、专题研讨、个性指导等方法,既关注大数据科学服务理念和实际操作技能间的平衡,又重视不同专业科研人员大数据科学能力发展的均衡,通过定制化、个性化培训工具包的开发,满足差异化的人员培训需求[11]。

3.4 全面加强高校图书馆科研大数据支持服务的多方协同

高校科研大数据基础设施建设过程中涉及两类合作网络的构建,一是学术社区间科研人员之间的合作网络,二是大数据产业链中多方参与主体的合作网络。为更好地开展科研大数据支持服务,高校图书馆需要不断拓展科研合作网络建设。具体来说:一是要积极打造开放的学术平台。高校图书馆可以依托馆藏大数据为圆心,延伸服务半径,辐射学术社区,搭建开放式的区域平台,打造线上与线下结合的交流论坛和联盟,开发开放平台配套工具和技术,促进跨学科和跨部门的协同合作[12]。二是要探索制定促进科研共享与协作的激励机制。从主体角度出发,高校图书馆应树立共享与协作的组织文化和价值观,通过文化引导,激发参与主体的共享协作动机。同时,高校图书馆应提供数据咨询服务,培养用户数据素养,提升用户知识共享的直接收益和协同收益[13],不断强化科研人员共享与协作的主观意愿。从载体角度出发,图书馆应通过明确数据标准、规范数据来源和数据质量,消除科研人员共享与协作过程中的各种顾虑,在互惠基础上建立信任关系。从绩效角度出发,图书馆应将数据组织与共享纳入科研评价,激励科研人员间的共享与协作[14]。三是要缔结多方参与共建基础设施的友好关系。高校图书馆应充分利用自身对相关参与方需求的深刻理解,以及长期合作过程中与相关参与方形成的信任与默契,发挥协调者角色,促进多方参与者达成共同目标和进行持续沟通。同时,高校图书馆应充分发挥其作为科研关键合作伙伴的作用,牵引科研模式和科研支持服务的变革,向合作网络施加影响,进而引领催生合作社区在服务模式、合作模式、业务流程等方面的重组变革,为大数据研究提供更为智能化的服务支持。

4 结 语

建设科研大数据基础设施将打造一个全新的科研场景,更好地满足科研人员跨学科共享、协作和创新的需求,为科研发展提供强大驱动力。从典型方法、工作流程、科研产出、机遇挑战等方面对科研过程进行全景式认知,有助于科研大数据基础设施建设参与方整体把控。高校图书馆作为重要的参与方之一,需要以数据为核心,盘活已有数据中心、机构知识库等资源,加强数据汇聚和数据治理,从框架流程、政策和技术等维度入手,强化数据监护[15],不断完善科研大数据服务体系,提供贯穿数据采集、存储、计算、管理和使用的全生命周期科研大数据支持服务。同时,作为科研人员最重要的合作伙伴,高校图书馆应把握科研大数据基础设施建设机遇,立足自身优势,从强化数据服务、拓展合作网络、重视队伍培训三个维度发力,打造开放的科研服务生态,释放科研数据的价值红利。

猜你喜欢

科研人员基础设施图书馆
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
农业基础设施建设有望加速
科研人员揭示油桃果实表皮不长毛的奥秘
公募基础设施REITs与股票的比较
科研人员破译黑猪肉特征风味物质
广东公安科研人员风采
图书馆
振动搅拌,基础设施耐久性的保障
充分挖掘基础设施建设发展潜力
去图书馆