农业单品全产业链大数据平台设计与实现
2021-05-24齐晓军苑青微曾庆鸿
顾 君 齐晓军 苑青微 曾庆鸿
(1.同方知网(北京)技术有限公司,北京 100192;2.贵州省农业农村厅,贵阳 550001)
1 前言
农产品全产业链运作是一种农业产业化创新经营模式[1-2],是以消费者的需求为导向,将农作物种植、加工、运输及销售等多种产业环节组成一个完整的产业链系统,推动农业产业集聚,进而释放巨大的发展潜力,不仅能在加工储藏、市场营销、农产品市场等方面衍生相应的服务行业,更能加速实现农业现代化[3-4]。
农产品全产业链管理需要大数据支撑。中国农业农村部早在2015 年就明确提出要构建农业大数据体系,2016 年印发《农业农村大数据试点方案》,开展生猪等8 种重要农产品的大数据试点工作,探索建立分品种分产业的全产业链大数据工作[5]。大数据服务农业全产业链,就是高效整合各类数据资源要素,完善农业大数据采集、汇聚、分析、服务机制,打造智能化的全产业链大数据平台,为全产业链上的各类主体提供科学准确的决策支持服务,并充分利用信息技术推动农业全产业链改造升级[6][7]。
本文从农业单品全产业链关键环节入手,提出了一种农业单品全产业链大数据平台的构建框架,希望为相关的农业农村大数据系统建设提供可借鉴和可复制的模式和经验。
2 农业单品全产业链大数据平台设计
农业单品全产业链大数据平台的整体建设思路是,按照育种、栽培、收获、贮藏、加工、产业化发展等全产业链关键环节,依托互联网、物联网、大数据等技术,构建全产业链数据资源体系,实现全产业链数据的自动采集、动态更新、多源数据存储、数据治理,为数据融合共享和数据应用提供支撑,为产业链上各类主体提供及时的产业数据信息和“数据+知识”融合的产业问题解决方案,有效指导生产、加工、流通,促进生产和市场平稳运行,引导产业生产经营决策、协调区域发展、支撑联动调控,为促进产业平稳发展、农民增收提供信息服务和数据支撑。
2.1 数据指标体系
农业单品在各业务环节产生海量数据,存在着结构化数据和非结构化数据混杂、数据质量良莠不齐、数据标准不统一问题;数据开发利用低;数据语言与业务语言不通等诸多问题[8-10]。为了解决上述问题,需以全产业链为基线,构建从生产、加工、流通仓储、价格、消费、贸易、成本收益、舆情等八大全产业链环节的数据指标体系(见表1),实现农业数据的全产业链目录导航检索,从而满足平台用户对数据快速查阅,促进数据资源的再开发、再利用。
在具体农业单品(水稻、玉米、茶叶、马铃薯、苹果、中药材等)全产业链大数据平台建设过程中,需要以表1 的数据指标体系为基础,建立指标本体及其属性的规范名称、代码规范表,平台通过规范表自动生成同等数量的规范映射表(见图1),实现数字资源碎片化时数据库相关字段的归一化处理,解决来源不同指标不统一的问题,形成规范化数据库,为打通内部数据关联,实现智能应用奠定基础。
2.2 全产业链数据分析模型
图1 标准化映射Fig.1 Standardized mapping
表1 农业单品全产业链数据指标体系Table 1 index system of the whole industry chain
平台对结构化和非结构化数据进行深度挖掘,除了一些通用模型算法,如数据分类、回归、聚类、关联降维、时间序列、识别、预测、优化等类型外,还需要根据全产业链数据分析的特点,构建农业产业结构与自然资源禀赋协调性分析模型、农产品供需平衡模型、农产品市场监测预警模型等,形成一个全产业链监测与预警分析算法库。
2.2.1 农业产业结构与自然资源禀赋协调性分析模型
产业规划是未来经济运行的指南针,产业规划的编制需要准确而实际的数据以及运用科学的方法进行整体到细节的设计。该模型从全国、省级、市级维度,结合地区特点和产业特征,从农业产业结构和农业自然资源生态系统两方面进行综合指数评价,通过构建指标体系及耦合协调模型,建立协调发展标准,助力用户进行区域农业产业结构与自然资源协调度评判。
2.2.2 农产品供需平衡分析模型
农产品供需不对称问题的形成是多种因素共同作用的结果,但它也是造成农产品“卖难买难”、价格异常波动等问题的根源,因此要保障农产品的有效供给首先还是要保障供给和需求在数量方面的均衡[11]。根据农产品产销系统模型,即“系统输入量+系统生产量=系统输出量+系统消耗量”,基于需求相关经济指标数据,实现从产销分析、产能分析、进出口以及指数模型分析方面分析全国农产品的供需平衡状况。
2.2.3 农产品市场监测预警模型
基于农产品生产量年涨跌度、消费量年涨跌幅,以及价格日涨跌幅、按年累计涨跌幅,对农产品的生产量、消费量、价格,分别设定监测预警阈值,将预警等级划分为四个等级,用红橙黄绿颜色表示,对涨幅超过一定数值的农产品进行预警提醒以达到及时对农产品供需过程进行诊断和分析。
2.3 模型对数据的授权访问
平台建设过程中,数据安全是特别重要。平台通过本体及其属性建设,标明不同指标需要什么样的数据,这些数据来源在哪里,采用哪种数据集成方式获取数据。平台给每个模型授予不同的底层数据的访问权限,即给一个模型授予了底层数据的访问权限,那么能够使用该模型的用户就有这些数据的获取权限,如图2所示。
图2 数据模型和数据定性Fig.2 Data model and data qualitative analysis
2 农业单品全产业链大数据平台的实现与应用
农业单品全产业链大数据平台实现了大数据资源管理、海量数据智能搜索、数据可视分析、产业智能报告等功能。平台汇聚单品产业相关CNKI 期刊、图书、表格、视频、问答资源及舆情资讯等多源异构资源,形成大数据资源中心,以单品全产业链数据指标体系为基础,实现农业单品数据资源的集中管理、实时更新与交换共享。平台以数据资源中心为基础,知识图谱技术为支撑,通过检索结果的智能优化,满足平台不同用户群体多样性获取信息的要求,实现数据的智能搜索。平台根据具体业务需求,实现了以数据地图、数据图表、数据一张图等方式来可视化展示分析数据。平台通过对海量数据进行深入挖掘分析,并基于知识图谱与CNKI 碎片化重组的期刊文本产生关联,将知识资源和数据分析进行结合,实现产业报告的自动生成。
2.1 全产业链数据分析可视化
平台实现了常用算法的封装,包括分类、回归、聚类等,支撑混杂型数据的联动、连接、计算分析,可自动或通过可视化操作实现常见计量统计指标的统计与分析,针对海量数据,对用户目标数据进行检索,方便用户快速查找数据,可实现多约束条件、多数据源、多数据格式、多人同时的数据检索,在线生成图表,以支撑单品产业市场行情、景气指数、投入产出、竞争格局、消费热点分析,辅助农户、经营主体、科研人员、主管部门科学决策,如图3、图4和图5。
2.2 全产业链监测与预警
农产品供需不平衡,卖难买难,以及价格异常波动等问题是产业链运行的主要风险所在,需要进行监测与预警。通过对农产品的生产量、消费量、价格,分别设定监测预警阈值,平台对涨幅超过一定数值的农产品进行预警提醒以达到及时对农产品供需过程进行诊断和分析,如图6所示。
2.3 农业单品全产业链智能报告
通过对海量数据进行深入挖掘分析,平台按照全产业链(生产、加工、流通仓储、价格、消费、贸易、成本收益、舆情)实现了产业报告的自动生成,报告的种类有价格报告,以及针对产业现状分析、问题研究、对策建议形成的产业分析报告等,引导产业生产经营决策、协调区域发展、支撑联动调控,如图7 和图8所示。
3 总结与展望
图3 数据分析Fig.3 Data analysis
图4 数据分析可视化Fig.4 Data analysis visualization
图5 农业产业结构与自然资源禀赋协调性分析Fig.5 Analysis on the coordination between agricultural industrial structure and natural resources endowment
图6 农产品监测预警阈值Fig.6 Threshold of agricultural products monitoring and warning
图7 智能报告全产业链知识体系Fig.7 Intelligent report whole industry chain knowledge system
图8 产业报告生成类别Fig.8 Industry report generation category
围绕农业单品全产业链,本文提出了一个全产业链大数据平台框架设计。平台按照产前、产中和产后构建形成多维度关键环节数据指标体系,实现对农业单品全产业链数据的自动采集、动态更新、多源数据存储、数据治理,为产业链上相关主体提供及时的产业数据可视化分析、产业监测预警、产业智能分析报告,有效指导生产、加工、流通,促进生产和市场平稳运行,为促进产业平稳发展提供信息服务和数据支撑。通过在贵州省的相关应用实践表明,平台结构合理,功能丰富,性能优越,对同类平台的建设具有参考价值。下一步将加强平台上数据驱动模型的开发,提升平台用户界面的友好性,更好地发挥大数据在农产品全产业链管理上的作用。