我国芒果产业数据资源现状与发展对策①
2020-12-09李玉萍梁伟红邓春梅刘燕群
李玉萍 叶 露 梁伟红 邓春梅 刘燕群
(中国热带农业科学院科技信息研究所∕海南省热带作物信息技术应用研究重点实验室 海南海口571101)
随着大数据、物联网、云计算等技术的快速发展,数据资源建设越来越受各行业的重视。在农业领域,随着我国对“三农”工作的高度重视,数据资源开发与应用已逐步参透到生产、加工、销售各环节,而针对作物产业开展数据资源建设已成为产业发展的重要需求。芒果素有“热带果王”之美称,与香蕉、葡萄、柑桔、苹果齐名世界五大水果,在全球水果贸易中占有重要的位置。我国芒果栽培历史悠久,早在唐代就开始从印度引种,经过多年的发展,芒果已发展成为我国热区农业发展的支柱产业之一。在芒果产业较长的生产、管理、科研活动实践中,产生并积累了大量的基础数据和科学数据,这些数据是推动我国芒果产业发展和科技创新重要保障,因此加大对芒果产业数据资源的开发与利用,用数据带动产业活力,以数据价值促进产业发展,已成为当前支撑我国芒果产业科技创新的必然趋势。
1 我国芒果产业数据资源及开发利用现状
1.1 我国芒果产业的主要数据源分析
我国芒果产业的数据来源广泛,主要来自于科研院所、高等院校、政府管理部门、行业协会学会、生产经营主体等。
1.1.1 科研院所
科研院所是我国芒果科学数据的主要来源之一。据初步统计,目前从事芒果研究的科研院所大概有二十余个,主要分布在海南、广西、广东、云南、福建、四川、贵州等省(区)科研院所,包括中国热带农业科学院的南亚热带作物研究所、环境与植物保护研究所、热带作物品种资源研究所、科技信息研究所等;海南省农业科学院的热带果树研究所、农产品加工设计研究所等;广西农业科学院的植物保护研究所、园艺研究所、农产品加工研究所等,以及广西亚热带作物研究所、广西百色市农业科学研究所;广东省农业科学院的果树研究所、植物保护研究所等;云南省农业科学院的热带亚热带经济作物研究所、热区生态农业研究所,以及云南省热带作物科学研究所;福建省农业科学院的植物保护研究所、果树研究所,以及福建省亚热带植物研究所、福建省热带作物科学研究所;四川省攀枝花市农林科学研究院、四川省攀枝花市农业科学研究所、四川省凉山州亚热带作物研究所等;贵州省亚热带作物科学研究所等;中国科学院华南植物研究所。这些研究机构中,有开展芒果基础性研究,也有开展芒果应用研究,在研究工作中着重解决芒果生产中存在的重大问题。在科研和活动实践过程中主要产生实验(试验)数据、检测数据、观测数据、调查数据等,以及论文、专利、标准等成果数据及报告、规划等产业基础数据。
1.1.2 高等院校
据“中国知网CNKI”检索结果,从发表论文作者所属机构统计来看,我国涉及芒果研究的高等院校中有20多所,主要包括:海南大学、广西大学、中国农业大学、广西中医学院、广西中医药大学、广西医科大学、广东海洋大学、华南农业大学、广东药学院、云南农业大学、福建农林大学、贵州大学、西南农业大学、百色学院、右江民族医学院、攀枝花学院、华中农业大学等。这些高等院校以教学任务和基础科学研究为主,在活动和实践过程主要产生实验数据、观测数据、调查数据、专利、学术(位)论文等,也是我国芒果科学数据的主要来源。
1.1.3 政府管理部门
我国农业农村部农垦局、热区各省农业农村厅、商务厅等,以及(市、区、县)农业局、农垦局、商务局、气象局、物价局、统计局等管理部门,是我国芒果生产、流通、消费、政策法规、成果、统计、监测预警、气象观测数据、战略发展报告等数据的主要来源。由于各部门都在不同范围内收集相关信息数据,目前尚处于分散管理阶段。
1.1.4 行业协会及组织团体
我国芒果主产省区成立了多个芒果相关协会。如,海南省除了有省级协会海南省芒果协会外,还有三亚芒果协会、昌江县芒果协会、保亭县半弓芒果行业协会等市县级协会;广西有百色市芒果协会、田东县芒果行业协会、田阳县东江芒果生产技术协会、田阳县芒果协会等;四川有攀枝花市仁和芒果专业技术协会、仁和芒果专业技术协会、金河乡金江村芒果协会、宁南县芒果专业技术协会等;云南有华坪县芒果专业技术协会、龙头村芒果专业技术经济合作协会等;贵州有望谟金煌芒果培育专业合作社、望谟县平卜芒果种植农民专业合作社、兴义市坝艾种养殖农民专业合作社、贞丰县鲁容种养殖专业合作社等。这些协会或组织作为政府与企业之间的桥梁,主要进行芒果生产、经营、技术指导和信息服务,开展新品种引进、新技术培训和示范,组织内外经济协作,此外也会关注并分析当地及销地芒果产业和市场价格动态情况,因此这类协会组织也会产生芒果产业基础数据、市场价格数据、销售数据等。
1.1.5 其他
我国芒果的生产者、加工者、销售者以及消费者,在从事相关活动中,也会产生如产量、面积、投入品使用量、加工量、价格、消费、成本等相关产业数据,这类数据和市场活动关系密切,但采集难度相对较大,需要深入一线做好调查和统计。此外网络数据库、网站、社交平台等也是芒果数据的来源渠道。
1.2 我国芒果产业数据资源的特点
1.2.1 资源丰富
我国芒果的数据资源极其丰富,包括产前、产中和产后各环节产生的各类数据。其中产前数据包括地块、种子、种苗、农药、化肥、农膜等;产中数据包括栽培、水肥管理、病虫害防治等;产后数据主要包括采收、储藏保鲜、加工、流通、市场销售、贸易等。此外,还有产业链环节中的支撑基础数据,如政策法规、科技文献、专利、标准等[1]。
1.2.2 分布广泛
我国芒果种植主要分布在海南、广西、云南、四川、贵州等省区[2]。其中海南主要分布在三亚、东方、乐东、陵水、昌江等地;广西主要分布在右江区、田阳、田东等地;云南主要分布在保山、临沧、丽江、普洱、西双版纳、玉溪、红河、元江等地;四川主要分布在攀枝花、安宁、会东、会理等地;贵州主要分布在望谟、册亨、兴义、贞丰、罗甸、安龙、关岭等地。因此,芒果数据的来源地分散,分布非常广泛,遍布热区各地,数据的空间分布呈零星分散状态,而且生产、储藏、加工、流通、销售等产前、产中、产后的各环节数据分别属于不同的单位。
1.2.3 数据结构复杂多样
伴随着互联网、大数据技术的快速发展,传感器、移动终端、RFID射频等快速推广和应用,包括芒果在内的作物产业数据,在获取的时间、空间、方式、范围、力度等都发生很大变化[3]。数以万计的农业数据不断产生,数据结构越发复杂多样[4],有结构化数据(农业生产、流通、消费数据等)、半结构化数据(农业种植图像、视频等)和非结构化数据(分析文档等)。
1.3 芒果产业数据资源建设及开发利用现状
芒果产业作为我国热带农业中具有竞争力的一个重要产业,数据资源建设支撑和服务产业发展显得尤为重要。近年来,我国芒果数据资源开发和利用取得了一定的进展,常见的有各类系统、数据库、综合的网络信息平台及相关网站。
1.3.1 专家系统
2006年,陆玉英等人建立了集智能决策、农业科普、新技术成果、专家在线等内容的广西芒果电脑农业专家系统,其中包括果园规划、品种选择、种植密度、修剪技术等决策模块19个,规则500条,为广西芒果生产提供产前、产中和产后的全程技术服务[5]。2012年,李贵利等应用模仿农业专家进行决策的计算机技术,开发建立了攀枝花市芒果农业专家系统。该系统由7个子系统组成,包含新品种介绍、管理技术、科研成果、视频播放、决策系统等,将单项技术进行组装,实现高层次的多项技术集成,通过数据库决策树算法进行数据查询和挖掘,对需要解决的农业问题解答、解释和判断,提出决策建议[6]。2012年谢龙莲等将案例推理和模糊推理技术相结合,研发出芒果病虫害诊断系统,为农户正确识别芒果病虫害提供科学指导[7]。
1.3.2 专题信息系统
车秀芬等研发了集成气象数据、芒果生育期数据、模型参数、结果计算及等级认证5个模块的海南芒果气象灾害监测及气候品质认证系统。该系统结合气象数据和芒果生育期生理生化检测数据,可实现芒果的气候品质等级认证和评价[8]。江昌旭等研发了基于RFID技术的芒果品种识别与信息追溯系统,通过信息技术手段自动采集芒果从生产、加工、流通、销售各环节的信息,并采用电子标签进行标识,完成对芒果品种的识别和芒果信息追溯[9]。
1.3.3 基于芒果建立的网站
目前国内针对芒果所建网站,在内容中更有针对性,主要以信息发布和服务为主,数值型数据较少。如中国芒果产业网(http://mangguo‐cyw.99114.com/),是专业的芒果交易平台,为广大芒果商家提供各类不同的芒果服务,包括最新的采购、供应、招商、企业、资讯等。中国芒果商情网(https://www.lvguo.net/)是绿果网旗下芒果价格信息网站,为行业农友提供全面的芒果供求信息、价格信息、行情分析等信息服务。海南芒果网站(http://www.hainanmangguo.com/),是集芒果种类、芒果资讯、芒果种植、芒果行情为主的专业海南芒果信息服务网站。
1.3.4 专业及综合性数据库
1.3.4.1 针对热带作物建立的数据平台
热带作物种质资源信息平台(http://tc‐gris.catas.cn)是针对我国主要热带作物种质资源数据进行建设的平台,通过平台可以查找和获取包括芒果在内的热带作物种质资源收集、保存、评价、新品种、共享利用等信息数据。国家农业科学数据共享中心热带作物科学数据分中心(http://trop.agridata.cn),是集成我国热带农业科学数据资源的重要平台,该中心已建成5个主体数据库,43个热带农业特色专题数据库,其中也对芒果产业的部分数据进行了一定程度的建设和整合。热带农业大数据平台(http://agridata.catas.cn),致力于整合、优化国内外热带农业产前、产中、产后全产业链数据资源,其中汇集了芒果种质资源、生产与加工、病虫害、价格与贸易等数据,可对各类数据进行查询和检索。
1.3.4.2 综合性的农业网络数据库
我国很多综合性数据库如中国知网、万方数据、维普等数据平台也涵盖了农业领域的很多数据,通过篇名、主题、全文、作者、作者单位、关键词等检索途径,都可以获得芒果相关的论文、成果、专利、标准等信息资料。
2 我国芒果产业数据资源建设存在问题
2.1 数据资源建设缺乏整体规划,存在数据孤岛
芒果的数据资源是在科学研究取得长足进步的同时,产生的大量科学数据,类型丰富多样。但由于缺乏整体建设规划,加上各部门条块分割严重,目前数据资源多处于分散管理、自成体系、封闭使用的状态[10]。而在目前已建立的相关系统或数据库中,多数小而散,相互独立,缺乏开放性、兼容性和可扩展性。因此数据共享不到位,数据孤岛比较突出,现有数据资源还很难满足产业发展和市场经济的需求,不能有效支撑芒果产业发展。
2.2 数据采集渠道不健全,部分数据缺失还较严重
据粗略估计,目前在农业产业数据采集中,80%的数据获取依然以人工采集和填报等传统的方式为主,仅有20%是用运用物联网传感器、网络自动抓取、文本挖掘、图像识别等新型工具和方法。生产、资源本底、消费等数据缺失还较严重,国际贸易信息不够充分,市场信息混杂。
2.3 缺乏统一的采集加工标准规范,共享技术支撑不足
长期以来,由于体制和利益等原因,对数据的采集、分类、管理等没有形成统一的标准和规范,数据存储、处理、分析、服务等方面标准缺乏,已制定的仍然存在诸多问题。由于标准的缺乏和不统一,必然导致低水平重复建设、数据利用率低、信息资源零乱分散和大量冗余等。此外,因缺乏共享标准体系,数据的管理与共享机制还未形成,影响芒果产业数据资源的共建共享,限制了数据资源的跨地区、跨部门、跨学科的广泛应用。
2.4 数据的挖掘与分析利用不足
目前,芒果产业数据资源利用大多停留在表面,数据挖掘与分析应用尚不深入,应用领域相对较窄,数据与场景融合不够,多数数据以空间数据库和关系数据库的形式进行管理,数据之间缺乏关联,没有形成体系,仍然是“碎片化”数据,导致数据之“沙”难以汇聚成“塔”,数据资源无法有效盘活。此外,通过数据建模、数据挖掘、智能数据分析处理等大数据技术,提供预警研判决策支持等方面少有涉及,数据优势及潜力得不到充分释放。
3 对策建议
3.1 加强数据建设顶层设计,建设汇集融合的芒果产业数据资源体系
立足我国芒果数据资源建设现状及数据资源内容特点,坚持数据资源统筹管理,加强数据资源建设的总体规划,统一部署,使多部门、多单位、多学科的数据建设整体协调发展。参考借鉴现有农业信息资源分类体系,从整个产业链出发,对芒果产前、产中、产后不同来源、不同结构的的数据资源进行梳理和分类,建设汇集融合的芒果产业数据资源体系框架,在此基础上开展对数据资源进行开发利用和科学的整合利用,避免数据资源的重复建设,同时促进数据资源的有效利用。
3.2 建立全流程统一的芒果产业数据标准体系
数据标准是数据实现共享的基础支撑条件,是实现互联互通、数据共建共享的重保障。建立科学、统一、先进、实用的标准规范体系能够有效破解“孤岛”问题,促进信息共享,避免数据低水平开发和重复建设。因此在芒果数据资源建设中,必须从数据采集、加工处理、存储、分析、服务、共享标准等全流程做好标准规范的制定,建立起完善的标准体系,突破农业大数据集成与融合的工作瓶颈。
3.3 健全产业数据采集体系
科学全面布局数据调查渠道,在传统数据采集渠道的基础上,不断健全采集体系,拓展物联网数据采集渠道,通过视频监控、物联网传感器、网络通信和遥感等物联网技术的应用,实时采集产业链各环节数据,基本形成现代采集手段为主、传统采集手段为辅、优势互补、相互融合的数据采集体系。
3.4 建立数据开放共享机制
建立对内开放和对外开放两种机制。对内要摸清家底,建立数据资源共享目录;整合资源,建立数据共享平台;开展部门协作,建立数据会商制度。对外要加强合作,参与国际数据交流,明分类、确顺序,制定数据公开路线图。同时解决数据开放共享核心问题,包括数据自身质量问题、数据开放技术与格式、数据开放安全性评估等。
3.5 加强数据挖掘与分析应用,拓展数据赋能容量
数据资源建设的核心环节是数据应用,因此要加强芒果产业宏观经济数据分析、市场数据、销量走势等数据分析,通过数据建模、数据汇聚、数据挖掘、智能数据分析处理等大数据技术,提供预警研判决策支持,指导产业的种植、销售、加工、贸易,提高产业链全要素生产率,实现绿色可持续发展。