数据密集型环境下农业科研信息化发展路径研究
2022-09-27赵瑞雪孙坦杨晓蓉王剑
赵瑞雪, 孙坦, 杨晓蓉*, 王剑
(1.中国农业科学院农业信息研究所,北京 100081;2.中国农业科学院,农业农村部农业大数据重点实验室,北京 100081)
进入21世纪20年代,新一代信息技术在农业科研领域中的交互应用迎来了集中爆发期,不同技术横向融合的广度与纵向应用的深度进一步加强,智能化和5G技术对农业科研领域的全方位赋能,在显著拓展农业各学科的数据获取范围和计算存储传输能力的同时,也极大地提升了科研管理的决策能力,使现代科研治理体系日益成为农业科技创新能力提升的重要保障[1]。当前,科研信息化作为落实农业科技创新治理体系现代化的重要途径,是支撑科研治理体系创新与改革的主要抓手[2]。在实践中,科研信息化能够引领“数据管理、数据决策、数据创新”的农业科研治理新业态,形成数据驱动、人机协同、跨界融合、共创分享的农业科研治理新模式,实现信息化治理带来的高效能[3]。因此,探索新时期农业科研信息化发展路径,对于赋能数字化、网络化、智能化“三化融合”的农业科技创新治理新格局具有极其重要的意义。
数据密集型科研范式是基于数据资源进行知识发现与科学创新的一种科研模式[4],其所引领的研究范式变革已成为当前决定科研实力的战略要素,也是科研机构提升其在本领域地位的重要保障[5]。在此背景下,科研信息化只有迅速适应数据密集型科研范式所带来的新需求,加速与开放科学的融合发展[6-7],才能推动农业数据资源与应用场景深度融合,实现科研信息化对农业科技创新体系的引领与带动作用[1],这也是新时期农业科研信息化发展与变革的重要方向。
“十四五”时期是我国数据密集型农业科研创新范式革命性变革关键期,数据密集型环境驱动创新的“新模式”也必然会持续发力,从而引领整个农业科技创新体系向科研信息化、信息数据化、数据知识化的方向持续发展。为此,本文聚焦农业科研创新活动的信息化发展路径,通过分析数据密集型环境下科研活动所面临的新问题和新需求,从信息化引领科研创新能力建设的角度,探讨构建数据密集型科研范式变革下的科研信息化发展路径框架,从而为新时期科研信息化推动科技创新范式和效率的革命性改变与提升提供借鉴。
1 数据密集型科研及其信息化
1.1 科研信息化发展研究的主要维度
科研信息化是伴随新兴信息技术发展而产生的一种面向科学研究的信息化形式,是信息技术应用于科学研究的实践方式,其能够借助新型的信息技术构建支撑研究的各类基础设施,并借此拓展和延伸科研的方法与手段[7]。早在2000年,英国科学家提出科研信息化(e-Science)概念,其所代表的全球合作可催生构建新一代科学研究基础设施,并表示英国将推行e-Science战略[8-9]。从此以后,科研信息化的发展获得了世界各国学者的广泛重视。目前,学术界普遍认为科研信息化发展的本质可以归结为两类问题:一是科研信息化发展理论的维度,主要关注在科研创新背景下如何利用既有信息化资源结合传统和新兴科研模式支撑科研活动,即科研信息化“做什么”的问题[10];二是科研信息化应用的维度,重点聚焦如何利用信息化的先进方法和理念体系来支撑科研创新活动,即科研信息化“怎么做”的问题[11]。具体研究实践中,在科研信息化发展理论研究维度下,主要从科研信息化模式、科研信息化影响模型、科研信息化作用机理等多个角度开展了大量研究。其中,Anderson等[12]2003年出版的《科研信息化:方法、策略和问题》一书是其中较为有代表性的研究成果,书中主要从科研新模式构建的角度探讨了科研信息化融入科研活动的各类可能的方式,并对其在科研创新各个环节的作用进行了探索。此外,Jankowski[13]、李世收等[14]、陈光欣等[11]也分别从影响力和作用方式等方面构建模型,揭示了科研信息化在科研活动中所面临的挑战和问题,得到了较大范围的关注。而在科研信息化发展应用维度下,随着近年来信息技术在科研领域应用的深入,对科研信息化发展应用的研究也日益广泛,侧重点也由最初的面向信息管理和服务领域探索[2],逐步拓展到社会、人文、生产以及行业规划领域。终端用户需求表达、应用标准规范、科研融合,以及5G、区块链等新型信息技术在各领域中的应用模式[7],已经成为该维度下研究的热点,并取得了很多研究成果。例如,Atkinson[15]对教育研究领域科研信息化应用方法的研究和邓敏等[8]对管理信息化模型建设的探索是其中比较有代表性的成果。
1.2 数据密集型科研下的需求表达
数据密集型科研范式作为一种面向数据科学的研究思维,源自“数据密集型计算(data intensive computing)”的科研模式[16],是继理论科研范式、实验科研范式和计算科研范式之后出现的一种全新的研究范式,其以大数据为研究基点,综合实验、推理和模拟等研究方法要素,并能有效应对当前海量数据挑战的新型研究方式[17]。在数据密集型科研范式下,科学家所面临的研究客体、数据形式、科学分工、研究驱动方式和科学发现模式等要素都发生了很大变化,因此,在科研实践中如何快速、准确获取数据密集型科研范式变革中的各项需求,并以此构建符合开放理念的科研合作体系,已成为数据密集型科研环境下研究者广泛关注的问题。
目前,国内外学者对数据密集型科研环境下需求表达的研究主要集中于2个层面:一是数据层面,即研究在数据密集型环境下,科研活动过程中由于数据复杂性、数据质量不确定性以及数据安全性所引发的各类特殊需求及其解决方案[18];二是科研层面,即聚焦于科研过程中由于数据基础设施、人员数据素养和数据交流活动的变化所引发的挑战和需求[19]。在实践中,研究者主要从问题导向的角度,探索数据密集型科研在不同学科创新场景下所发挥的作用,在图情、医药、环境、资源等众多学科领域取得了大量的研究成果。例如,Szabo等[20]在分析数据密集型科研活动过程配置和执行流程的基础上,重点探索了云计算设施所发挥的作用,并展望了其在未来数据密集型科研中将发挥的作用;周晓英[16]以情报学为研究情境,重点探索了数据密集型科研环境对情报学科发展的影响和所面临的挑战,并从内容、方法和交流体系的角度总结了数据密集型科研范式下,情报学所亟需拓展的研究要素。总之,对数据密集型科研范式需求表达的系统研究表明了这种新型科研范式的表述已被越来越多的科研工作者所接受,以数据为核心的研究思维与模式已成为大数据时代的一种趋势[21]。
2 数据密集型环境下农业科研信息化需求分析
数据密集型科研范式下,数据作为科研创新的基础与核心要素,也是科研信息化建设过程中所必需关注的重要因素。科研数据规模的爆发式增长使得科研信息化在支撑科研人员创新活动时所面临的需求与挑战变得更加复杂,因此,如何精准识别数据密集型环境下科研信息化所面临的痛点问题,对于聚焦信息化发展重点和节约资源投入具有重要的意义。
在实际科研活动中,随着研究方式的不断演进,以数据驱动科研范式变革为特征的数据密集型环境已成为新亮点,主要国家和地区纷纷推出和部署了宏大的发展计划与顶层设计,在工业、服务业、资源环境等诸多领域积极布局大数据科研,如美国的“大数据研究与开发倡议”、我国的《促进大数据发展纲要》等,形成了“产学研”协同创新的新模式[22]。然而在数据密集型科研不断推进的同时,科研信息化发展依然在基础设施建设、关键应用方式和科研融入模式等领域面临着较大挑战[23]。在农业领域,由于自身研究对象与研究环境的特点,其研究数据与计算需求扩张所带来科研信息化建设压力则更为严峻。因此,在开放的网络与信息化环境中,如何面向海量数据有效开展知识发现和协同创新活动,扩展农业科研活动的数据发现与检索能力、数据管理能力、数据分析与挖掘能力,是当前农业科研机构信息化建设的重要任务。在这一过程中,数据密集型科研环境对于科研信息化推进所面临的不同层次需求具体表现在以下几个方面。
2.1 科研大数据设施建设方面
当前农业科研机构所拥有的各类仪器设备以及重大科技基础设施等所产出的科研数据,还没有实现普遍意义下的有效收集、开发和挖掘,数据孤岛与数据碎片现象较为普遍,数据资源供给与农业科研活动实际需求的匹配程度不足,支撑科研大数据中心建设的核心资源集聚能力与应用水平相较国家科研创新的实际要求尚有较大差距,开放科学所依托的网络协作与数据密集型科研环境还未形成。因此,迫切需要以科研大数据资源优化整合和高效利用为导向,加快推进科研数据开放体系建设,全面支撑数据密集型农业开放科学研究,充分满足农业科技创新发展的实际需求。
2.2 新型信息技术应用方面
在农业科研机构中,目前科研活动数字化生存能力较为欠缺,新型信息技术对科研活动的引领作用还未完全展现,人工智能等战略性信息技术应用能力滞后,基地、实验室与检测中心的人员、试剂和资产、安保等信息化管理能力相较数据密集型科研范式转型升级的相关要求还有较大差距,相关顶层设计和标准规范建设工作尚有较大提升空间,基地“孤岛”现象还未完全消除,新型信息技术应用生态还未完全建立。因此,迫切需要进一步强化科研信息化的带动引领作用,研制面向科研创新的信息系统平台与相关设施,强化信息技术对科研活动的赋能作用,开发新型的科研活动模式和智能技术设施,将新技术融入实验设计、分析和创新发现等科研活动的各个过程,打造具有适应不同环境的、低成本的智能设备,突破在危险有害环境中数据采集和传输的技术瓶颈,在提升科研活动效率的同时,有效增强科研创新能力。
2.3 科技资源建设方面
相较于其他学术领域,当前农业科技创新资源建设、组织、挖掘分析等能力相对滞后,支撑科技创新的信息与知识服务缺乏自主工具和领跑技术,科技信息供给与知识服务中某些特定领域的核心关键技术研发还未得到明显突破,新型知识服务产品研发还不完善,资源服务水平与国家对农业科研创新的整体需求尚存在着较大差距,因此,迫切需要深度融合大数据、人工智能等核心关键技术,研制新一代科技知识资源融汇治理和智能服务的工具、模型及产品,构建面向数据密集型科研的知识服务支撑体系,实现技术、服务和创新的深度融合。
3 新时期农业科研信息化发展路径设计
科研信息化本质上是以信息技术与科学研究融合为基础,通过信息技术对过程支撑、资源共享与群体协作而形成的支撑能力[10]。在数据密集型环境下,信息化发展程度决定了科研机构的创新能力。因此,构建新时期面向创新的科研信息化发展路径是分析并提升科研机构在数据密集型科研环境下创新能力的重要基础。特别是对于农业领域,由于其研究范围广、研究对象繁多、研究环节复杂,农业科研机构对科研信息化的依托更加紧密。这意味着在数据密集型科研范式变革中,合理的农业信息化发展路径是支撑科研创新活动的基础。
图1 是基于农业科研机构信息化发展需求分析而构建的科研信息化发展路径模型。该模型以保障科研人员在数据密集型科研环境下数据信息能力为核心,以提升农业科研机构创新能力为外延,聚焦科研信息化如何从推动科研人员的数据能力转化为科研机构的创新能力。该路径模型具备2个特点:其一是路径模型以支撑科研人员数据能力为基础,从而充分适应数据密集型科研范式变革的需求;其二是路径模型具有较好的扩展性,即科研信息化支撑能力是可以无限扩展的,但组成路径模型的各个维度之间具有一定的边界。具体而言,本文的科研信息化发展路径模型的维度和功能分析如下。
图1 科研信息化发展路径模型Fig.1 Path model for e-Science development
3.1 信息化基础环境建设支撑农业科研大数据传输、存储与计算能力
信息化基础环境是科研信息化的基点,也是数据密集型科研的重要保障。信息化基础环境作为引领科技创新和科研管理的数字底板,在数据密集型科研范式下其可以为科研人员使用数据提供基础保障,“网通(网络通信)”而后“数通(数据传输与交换)”,而“数通”则是新型科研范式变革与应用的前提条件。从这点意义上来说,信息化基础环境的优劣决定着科研工作者能否及时获取数据资源以及有效地保存和应用数据成果,进而影响到科研人员数据应用能力的提升和整体创新水平的可持续发展。因此,为了应对数据密集型科研环境的需求,科研信息化硬件条件建设应重点聚焦于构建支撑数据能力和创新能力的基础环境设施建设,即借助新型高速互联网技术,搭建连接各个创新单元的高速网络,持续推进、整合及提升云服务资源、存储资源和高性能计算资源,建设面向农业科研大数据的一体化信息安全平台,显著提升和引领数据密集型科研活动与管理的信息化服务水平。
3.2 农业科研大数据中心建设促进数据共享与应用能力
农业科研大数据中心是指通过聚集农业各学科科研领域的数据资源而形成的一个规模庞大的数据平台[19]。实践经验表明,农业科研大数据中心能够通过先进信息技术在数据采集、存储、管理、分析的各个环节为农业科研人员提供便捷的数据应用与共享服务,进而实现支撑科研创新的目标[24]。在数据密集型科研环境下,随着农业科研数据的爆发式增长,科研人员面向数据资源的高效应用与共享需求不断提升,而农业科研大数据中心能够通过对海量数据的存储、集成和整合,为农业科研提供有效的数据服务,促进科研数据的共享、应用和创新,从而赋能整体科研创新能力。由此可见,当前农业科研机构的大数据中心建设应在前瞻把握数据密集型研究范式、开放科学对农业科技创新的作用的基础上,建设面向试验基地、实验室等科研数据产出单元的科研大数据标准规范和融汇治理平台,推动农业科研数据持续积累、资产化管理、长期保存和开放共享。深度融合和应用大数据、人工智能等关键性核心技术,研发支撑智能化数据提取、分析、挖掘过程的模型、工具和产品,推动科研模式从传统的统计计算形式向高阶建模计算形式转变[22],从而使农业研究能够从海量数据中充分挖掘出潜在的关系、规律及知识,解决农业创新实践中的更复杂、更前沿的科学问题,实现重点农业领域的科研大数据试点应用,打造农业科研大数据生态圈。
3.3 农业智能化装备研发强化数据采集和获取能力
农业数据采集与获取能力是数据密集型科研范式下科技创新的基础,相关研究成果显示,农业科研人员必需借助具有传感能力的智能装备和设施才能得到有关数据,相关的研究活动才能顺利开展[9]。因此,农业智能装备和设施是数据密集型科研环境下农业科研活动开展的必要条件。随着数据传感技术的进步,农业传感器件的智慧化、小型化和融合化应用能力不断增强,其与互联网的融合使得农业科研人员能够在短时间内采集数量更多、精度更高的观测数据。在实践中,如何应用先进的信息技术与传感器系统准确地记录感知数据,智能判断并排除数据所存在的各类问题,提升农业科研人员数据采集和获取能力,是新时期农业科研信息化发展所面临的重要议题。为此,农业科研信息化在该领域的发展路径应聚焦于人工智能赋能智慧科研,充分应用高速网络、人工智能等战略性信息技术,持续开发符合农业科研特色的、辅助试验过程的信息化类数据采集工具设备,实现农业生产对象表型性状数据的智慧化获取,研发并应用具有人类部分信息感知能力和行动能力的自动化或半自动化农业机器人和相关智能装备,推动重点农业学科领域智能化数据采集技术的优先发展,赋能数据密集型科研创新发展。
3.4 新型农业科研平台研制推进开放科学与科研协作体系形成
在数据密集型科研范式下,科研活动更多地以多学科、多机构、多层次的分工协作模式来开展[21],且整体研究过程的体系化、平台化和精细化程度日益突出,这就促使以开放协作为主要特征的开放科学成为数据密集型科研范式的重要研究形式。相关研究显示,在农业科研领域随着科学研究对各类科研力量包容能力的不断提升,应用新型农业科研信息化平台推动开放科学以网络平台和众包科学的方式融入到科学研究中,已日益成为农业开放协同创新一种新常态[18]。为此,农业科研院所的科研信息化发展应聚焦数据密集型科研平台建设,面向重点学科领域开展支撑数据密集型科研范式变革的关键技术研究,研发支持开放科学理念的系统平台和工具,形成开放式科研协作环境,提升重点农业学科领域科研协作交流活跃度;进一步强化面向试验基地、实验室等科研数据产出单元的科研大数据融汇治理平台的研制,实时汇聚、管理、分析和共享各类科研数据,实现数据的确权、防篡改、可追溯,提升科研机构体系内数据共享和实验协同水平,推动传统科研向数据密集型科研的转型与升级,实现农业数据密集型科研范式的革新与应用。
4 结语
本文以数据密集型科研范式变革为研究背景,以支撑科研人员基于数据的创新能力为目标,从农业科研创新总体需求的视角,构建了面向农业科研机构的科研信息化未来发展路径框架模型,该路径模型以信息化基础环境、科研大数据中心、智能化装备和新型科研平台4个维度进行建构,并针对科研人员在这4个维度下的数据能力培养与创新需求提出了重点建设举措和发展方向,以期能够全面提升科研信息化面向农业科研创新与管理的“融入环境,嵌入过程”的能力,推动未来农业科研机构科研信息化从支撑辅助到引领发展的转变。
值得指出的是,这一科研信息化发展路径模型是基于现阶段农业科研机构科研创新需求研判和未来技术展望而建立的,而其中各个维度支撑作用的实际效果以及促进科研机构创新能力量化程度还没有进行深入的研究。因此,下一步应在实证研究的基础上对路径模型进行完善和验证,使其更符合数据密集型环境下农业科研信息化发展的实际。