基于农业环境的农业科学观测数据融合研究
2020-03-16胡国铮干珠扎布余沛东杨振琳高清竹
胡国铮 干珠扎布 余沛东 杨振琳 高清竹*
(1.中国农业科学院农业环境与可持续发展研究所,北京 100081;2.国家农业环境数据中心,北京 100081;3.农业农村部农业环境重点实验室,北京 100081)
1 引言
农药、地膜、除草剂、抗生素的过度使用及重金属污染等农业环境问题受到社会各界的广泛关注[1]。基于长期定位观测的农业环境数据是开展相关研究的关键基础,也是地区或国家农业政策制定的有力依据。长期定位观测是揭示全球环境结构与功能演变规律的重要研究手段,依托定位观测实验站,在固定地块上,对大气环境、水环境、土壤环境、生物群落等要素开展长期观测[2]。随着长期定位观测研究向着大规模、长时间、跨学科、多因子联合发展[3],各类观测网络在诸如英国洛桑实验站的长期定位观测实验站基础上发展起来[4],全球尺度的环境观测网络有全球环境监测系统(Global Environmental Monitoring System,GEMS)、全球陆地观测系统(Global Terrestrial Observing System,GTOS)、国际长期生态研究网络(International Long-Term Ecological Research,ILTER)、全球通量观测网络(FLUXNET)等[5]。
我国农业领域也形成了一些基础较好的长期定位观测网络,其中最典型的是肥力网和种质资源圃网。国家土壤肥力与肥料效益监测站网于1987 年建立,在全国8 个主要土壤类型上开展长期定位监测试验,积累了连续系统的土壤肥力观测数据[6]。1979年—1989年,陆续建设起的32个国家种质资源圃,在保存延续种质资源材料的同时,长期积累下大量作物性状科学观测数据[7]。然而我国农业科学观测数据的信息化程度仍然较低[8],分散、间断、各自为战的农业科学观测,在支撑国家农业重大决策中仍显乏力。
随着传感器技术发展,各类自动观测设备的应用,推动传统的科学观测工作进入大数据时代[3]。“大科学、大数据”已成为未来科学观测的重要发展和应用方向,既要开展跨领域的数据融合,也要开展多尺度的数据融合,挖掘科学观测大数据的价值[9]。大数据技术跨领域数据挖掘的能力,使得丰富多元化的跨界信息服务将成为大数据时代农情监测与预警的主流发展方向[10]。然而,多数据源、不同类型数据的跨领域融合,既是大数据应用的前倾,也是技术挑战[11]。农业领域的大数据应用主要集中在生产端,支撑精准农业、智慧农业等方面[12-13],而较少涉及支撑基础研究和应用研究的农业科学观测大数据融合。本文以农业环境科学观测数据为出发点,重点关注农业科学观测数据的跨领域融合问题,探讨农业环境与农业各学科领域的交叉与联系,研究农业环境对农业科学观测大数据融合的纽带作用,以及农业科学观测大数据融合所需条件,以期对未来农业科学观测大数据融和发展提供一些参考思路,促进农业科学观测数据融合发展。
2 农业环境对农业科学观测的影响
农业生产、管理活动离不开水、土壤、大气等农业环境要素,因此,农业环境与农业各学科领域有着千丝万缕的联系,也就成为各领域科学观测数据汇交融合的纽带。
2.1 农业环境对作物种质资源收集与利用的影响
农业环境演变尤其是气候变化,对作物种植资源的发掘、保存和利用都有重要影响[14]。随着全球升温,我国高纬度地区热量资源改善,生育期延长,喜温作物界限北移,如冬小麦的安全种植北界将由目前的长城一线北移到沈阳—张家口—包头—乌鲁木齐一线[15]。然而升温导致热带和亚热带地区需求种质资源材料的支持,培育出适应未来气候变化条件种植的新品种[16-17]。过去几十年,我国绝大部分农业气象灾害危害加重,特别是极端气候事件发生频率加大[18-19],其中干旱和洪涝灾害是对我国农业生产影响最为严重的因素[20]。这就需要着力汇交资源抗逆性状数据,支撑关键基因发掘和新品种培育改良以应对未来气候变化的不利影响[21]。
2.2 农业环境对土壤质量影响
升温、降水格局改变、CO2肥效引起土壤中碳氮元素周转速率变化[22-23],对发展中国家的研究结果显示气候变化对土壤肥力的负面影响远高于有益效果[24]。而农田土壤中的碳氮循环过程对气候变化具有显著反馈作用。农田土壤碳汇潜力对减缓气候变化具有重要意义[25];然而农田土壤同样是我国最主要的N2O 排放源,水田是CH4的重要排放源[26],N2O和CH4两种温室气体排则会加剧全球变暖。此外,农田中的氮素、磷素、农药及其他污染物质通过地表径流、农田排水和土壤淋溶等途径进入周围水体形成的面源污染[27],已经成为当前最严重的农业环境污染问题[28]。
2.3 农业环境对虫害影响
我国农业产值因病虫害造成的损失约为农业总产值的20%~25%[29]。虫害的发生或流行与气候条件有着密切的关系,甚至一些虫害的发生与否主要取决于气候条件,而气候变化还可能使新的虫害类型出现,对害虫的发生世代、越冬北界及分布范围产生巨大的影响[30-31]。随着全球升温,迁飞性害虫向高纬度和高海拔地区的迁移,使其与寄主植物、天敌昆虫之间的同步性发生改变,进而整个农业生态系统的稳定性[32]。
2.4 农业环境对农业微生物影响
细菌、真菌及放线菌是土壤中枯落物和有机质最主要的分解者,微生物群落结构和活性受土壤环境(如土壤温度、水分、透气性及pH)变化影响[23],参与有机质分解所需的胞外酶活性同样受土壤环境调控,进而影响着土壤的碳氮循环过程[33],对气候变化产生反馈作用[34]。过去几十年,我国农区气候变化总体有利于农作物病害发生[35]。尤其是冬季气温升高将降低病原菌越冬死亡率,延长病菌冬前侵染时间,增加冬后菌源;而春季气温升高将使越冬病原提前萌发,造成病害发生期和危害期提前[36]。
2.5 农业环境对畜禽养殖影响
全球升温有利于喜温品种的养殖界限扩展;改变家畜新陈代谢速度与效率,气温的适当提高有利于家畜生长发育,延长生长期,也可使动物提前成熟期,长期影响可提高繁育效率;高寒地区冬季升温有利于家畜越冬,提高幼畜的成活率[37]。然而家畜的生理周期与节律受气候变化影响可能出现紊乱;由于家畜的呼吸系统和消化系统对气候变化十分敏感,流感等动物疫病导致家畜患病几率提高、传播范围扩大[38];极端气候事件频发,尤其是在繁育期,可能导致繁殖率降低[39]。此外,畜禽养殖是我国最主要的CH4排放源[26],而畜禽粪污也是重要的农业面源污染源[27]。
2.6 农业环境对渔业资源环境生产影响
全球升温对渔业资源多样性有积极作用,一方面高纬度和高海拔寒冷地区可养殖的水生生物种类增加,另一方面海洋中暖水性水生生物从低纬度海区向高纬度海区迁徙,改变海区生物群落和生物地理学的结构[40]。而极端气候事件频发则对我国水产养殖业造成严重影响,高温热害使鱼塘池水蒸发过快、降低水质,导致水生动物进食困难、生长缓慢、病害增多,引起倒藻或单一藻类大量繁殖,造成泛塘[41]。暴雨、台风的危害则更为直接而剧烈,还会引发水位上涨、洪涝等次生灾害[42]。气压和洋流等变化的影响也不容忽视,2008 年拉尼娜导致的中国沿岸流冲击澎湖群岛,引起海水温度降低,导致73 吨野生海鱼和80%的养殖海鱼死亡[43]。此外,农业面源污染不仅影响渔业养殖环境,而且对自然界水环境造成严重影响,威胁着渔业种质资源。
2.7 农业环境对农产品质量安全影响
作物品种的基因型决定了作物品质的可能性,而农业环境尤其是气候条件影响着作物的表现型,即农产品品质[39]。CO2浓度、温度、辐射、水分等农业环境要素变化,影响着农产品中糖、氨基酸和蛋白质含量、矿质养分浓度[44],“气候品质”在烟草、茶叶等经济作物的种植生产中尤其受到重视,如茶多酚、咖啡碱、盐碱、石油醚等影响其品质与风味的关键物质合成受环境调控[45-46]。此外,农药、除草剂、抗生素等投入品的过度施用不仅造成了严重的农业面源污染,投入品残留及富集效应也严重威胁着食品安全[47]。
3 以农业环境为纽带的农业科学观测数据融合
3.1 农业科学观测数据融合框架
受气候变暖为主要特征的全球变化影响,农业环境显著影响着作物、畜禽、水生生物、微生物和病虫害的生长节律和分布范围,土壤环境与土壤质量密切联系,土壤环境和水环境中的污染物影响农产品质量安全。此外,耕作和畜禽养殖产生的CO2、CH4和N2O等温室气体对气候变暖有正反馈效应,而投入品和畜禽粪污形成的面源污染也影响着土壤环境和水环境。因此,应用机器学习、人工智能等方法,在传统统计模型的基础上,建立各农业观测要素与农业环境要素的系统模型,以农业环境数据为纽带,形成观测数据融合框架。
3.2 农业科学观测大数据融合的条件
(1)联网观测。我国农业野外科学观测实验站经过过去几十年的发展,为联网观测打下了坚实的基础[48],农业基础性长期性科技工作已建立起由100 个国家农业科学观测实验站组成的长期定位观测网络,依据我国农业生产区划与农业学科发展特征,对农业生产要素及其动态变化进行系统地观测、监测和记录。但每个国家农业科学观测实验站有明确的领域划分,只针对所属数据中心的观测任务开展工作,观测网络并未真正融合,呈现多个小型观测网络“组装”的结构。这种工作架构无疑会成为农业科学观测数据融合过程中的先天障碍。以农业环境数据为纽带可以一定程度克服这种障碍,需各领域实验站同步观测农业环境数据。而联系紧密的领域或为解决特定交叉学科问题,可通过多领域联合观测减少数据融合过程中的不确定性。因此,大数据融合要求科学观测实验站向综合型发展,在保持自身原有学科特色的同事,也应具备开展多学科基本要素观测的能力。
(2)数据标准化。数据的标准化是科学观测数据共享和应用过程中的巨大障碍[49]。数据在标准化和清洗过程中会损失大量的数据以及数据所携带的信息,而标准化的科学观测直接积累标准化数据,提高科学观测数据的应用共享效率。地面观测数据的时间和空间信息是准确把握数据之间的内在联系和规律的关键[50]。全球气候观测系统(GCOS)通过地面观测网络、高空网络、海洋和水下观测网络、卫星遥感观测系统,开展多圈层的综合观测,提供群和系统的综合信息[51]。跨区域的不同实验站甚至不同观测网络进行联合观测与研究,从样地到区域甚至到全球多尺度的、系统的观测与研究,必须建立在观测的标准化和规范化基础之上[5]。
(3)数据采集。传统的观测手段人力成本高,观测人员的专业门槛高,主观因素带来的不确定性高。而随着各类型传感器和数据采集器的发展,农业科学观测将逐渐向全自动化、实时化、精准化与智能化的方向发展[10]。诸如作物生育期、作物表型等人力成本较高且不确定性难以控制的观测内容,在智能感知技术的支持下,通过对传感器获取数据的分析、建模、图谱识别等实现自动化观测[52]。田间作物高通量表型信息获取与分析技术已成为了当前植物表型领域的一个研究热点[53],基于无人机的高通量植物表型观测技术更是有着灵活便捷的特点[54]。而农业物联网技术实现了自动观测数据的远程传输、实时监控和直接入库[52],物联网呈现百花齐放的状态,以成为自动观测仪器设备的重要参数,但也成为了学观测数据汇交系统对数据自动访问和传输的障碍。国家农业科学观测实验站在获得农业科技创新能力条件建设过程中,应注意自动化、智能化观测设备的引入。
(4)数据融合。农业科学观测大数据融合的难点在跨学科数据融合和跨尺度数据融合[4]。联网观测和数据标准化是跨学科和跨尺度数据融合的基础。而交叉学科研究是跨学科数据融合的路径,基于农业环境与农业各学科的交互关系,引入信息学方法,如神经网络、机器学习、人工智能等[6],开展交叉学科研究,建立系统模型以实现农业科学观测数据的跨学科融合。多尺度观测技术的发展也为跨尺度数据融合奠定了基础。卫星遥感技术在环境监测与管理中的应用越发广泛,空间分辨率已从公里级发展到亚米级,观测频率从月周期发展到几小时,光谱波段涵盖了可见光、红外到微波,光谱分辨率从多波段发展到超光谱[5]。地面农业环境观测数据与遥感数据结合,应用尺度转换方法,可以使地面观测的众多数据由点推向面,衍生出区域尺度空间数据,为解决区域乃至国家尺度的农业环境问题提供数据支撑。统一的标准规范在观测数据跨区域对比分析中起到了至关重要的作用,特别是全球尺度的环境观测网络中数据的尺度转换和跨尺度融合[5]。
4 结论与建议
农业基础性长期性科技工作为我国农业科学观测大数据融合建立了农业科学观测网络体系,为实现农业科学观测大数据融合尚需在以下几点突破。一是在联网观测的基础上,着重发展学科交叉。通过在各实验站开展各学科基本要素观测,为多学科的数据融合打下基础,使国家农业科学观测实验站网络成为有机整体,而不是在网络内各中心各自为战。短期需明确农业环境共性观测指标,各学科实验站以统一标准进行观测,充分发挥农业环境数据的纽带作用,为农业科学观测大数据的跨学科融合打下基础。中期可引入联合观测机制,加强学科交叉,逐步建立一支跨领域观测队伍,将破碎化的观测网络编织完整,探索综合实验站观测模式。长期发展全面实现综合实验站模式,真正实现全国农业科学观测一张网,加强农业数据尺度转化研究,支撑农业科学观测大数据的多尺度融合;二是推动数据标准化。标准化的科学数据观测是农业基础性长期性科技工作的重要发展,但体系内部的标准缺乏约束力度和发展支撑。需推进观测标准形成行业标准乃至国家标准,一方面体系内的实验站需严格执行,另一方面体系外的实验站可以参考实施,为跨网络的农业科学观测大数据融合奠定基础;三是稳定经费支持,保障数据采集。当前农业科学观测仍依靠大量一线观测专家获取数据,需要稳定的运行经费以维持农业科学观测数据的持续积累。此外,随着传感器技术发展,实验站引进自动化观测设备需要能力条件建设经费的定期支持。人“财”支持是农业基础性长期性科技工作持续稳定积累农业科学观测大数据,实现数据融合,支撑农业原始创新,为农业农村绿色发展和管理决策提供科学依据的基础保障;四是加强交叉学科研究,探索数据融合方法。农业科学观测大数据融合是农学与信息科学交叉的必然选择,也是多尺度观测技术的发展方向。通过交叉学科研究,在跨学科和跨尺度数据融合方法上取得突破,才能真正实现农业科学观测大数据融合,挖掘出观测数据更大的价值,指导农业生产,为农业政策制定提供基础支撑。