APP下载

蔬菜全产业链大数据平台建设与应用研究
——以大白菜为例

2021-05-24董春岩牛明雷姚艳常晓燕吕凌峰

农业大数据学报 2021年1期
关键词:大白菜产业链蔬菜

董春岩 牛明雷 姚艳 常晓燕 吕凌峰* 李 楠

(1.农业农村部信息中心,北京 100025;2.农业农村部工程建设服务中心,北京 100081;3.北京航天丰益信息技术有限公司,北京 100081)

1 引言

在我国,蔬菜是除粮食作物外栽培面积最广、经济地位最重要的作物。根据农业农村部农情调度数据,我国蔬菜种植面积达3 亿亩,年产量超7 亿吨,人均占有量达500 多公斤,均居世界第一位。据估计全国有超过9000 万人直接从事蔬菜生产,来自蔬菜产业的收益对农民收入的贡献达到了人均1000 元。蔬菜产业已发展成为我国农业和农村经济的支柱产业,在农民增收、农村发展、城乡就业以及对外贸易平衡方面具有不可替代的作用。我国现今拥有的栽培蔬菜作物(含食用菌、西甜瓜)至少有298 种,分属50 个科,常年生产的蔬菜达14 大类150 多个品种。其中,大白菜全年播种面积约4000 万亩,约占全国蔬菜总播种面积的15%,是我国栽培面积最大的蔬菜作物。选择以大白菜为例开展蔬菜单品种全产业链大数据平台建设是解决我国蔬菜发展问题的突破口,符合国家对农产品全产业链大数据建设的工作部署和要求。全产业链要求企业或者农户的生产要能够依据严格的生产标准来执行,进而形成一个完整的农业产业供应链[1],全产业链的优势在于对市场具有较强的敏锐度,利用大数据技术洞察市场需求[2]。本文以大白菜产业为研究领域,在分析产业链发展主要问题的基础上,规划了大数据平台的总体架构,设计了基于数据资源体系建设和大数据挖掘分析技术的监测预警、分析决策、公共服务和移动应用等功能和服务。平台建设将打造蔬菜全产业链的数据、技术、应用和服务协同发展体系,全面提升大白菜产业的数据资源掌控能力、技术应用支撑能力、产业价值发掘能力和宏观政策决策能力,推动大白菜产业的科学、健康发展。

2 大白菜产业链中存在的问题

2.1 规模化种植程度低造成数字化发展和大数据应用难

随着产业化经营的兴起和发展,涌现出了多种多样的蔬菜生产组织形式,但家庭承包经营为主体的小生产仍是基础和核心。在我国,家庭农场是规模化种植的主要形式,农业农村部推荐的规模化面积是相当于当地户均承包地面积10 至15 倍。根据土流网估算,我国农户平均经营规模只有9 亩,全国家庭农场的种植面积占比约14%,户均种植规模200 亩。这说明,我国规模化种植占比仍然偏低。蔬菜产业链从生产到消费的每个环节都比较分散,缺乏组织化和规模化[3],小规模的生产导致资金、技术投入不足,先进技术和设施设备难以推广应用,不利于大白菜产业的数字化发展。同时,农业信息系统的“孤岛”、“烟囱”现象普遍存在,信息资源共享不够,“数据通”、“业务通”困难、不适应“互联网+”和农业农村大数据应用的实际需求[4],在数据资源的共享开放和开发利用上,普遍存在不愿、不想、不敢共享开放的问题,主动开放让社会主体进行二次开发应用的体制机制还存在很多障碍[5],也为进一步的大数据应用带来了极大的困难。

2.2 流通成本高造成产业持续发展和健康发展难

在经济新常态下,作为供需对接的最后一棒,流通对供给侧结构性改革发挥着双重作用。作为北方老百姓冬日里的“当家菜”,大白菜市场供应存在明显的季节及地域特征。白菜主要输出区域以北方为主,山东、河北、吉林、湖北、河南都是白菜输出大省。流通运输环节的各级物流中间商对产品物流的技术要求极高,但是由于缺少物流设备和技术支持,农产品物流产品损毁的处理成本也很高[6],大范围的跨区域运输极大的抬高了产业发展成本。根据中国物流与采购联合会的研究,物流成本占产品成本的比例,我国大约在30%~40%,而其他发展中国家约为15%~25%,发达国家一般为10%~15%。统计数据显示,我国蔬菜类农产品流通成本占售价的50%~60%,甚至更高[7]。流通不畅导致的“卖难买贵”长期困扰产销双方,是推高商品终端价格、阻碍居民扩大消费的关键因素。

2.3 市场信息不对称造成产业平衡发展难

我国以大白菜为代表的蔬菜产业发展面临新的形势和挑战,由于生产者与消费者市场信息不对称导致产业发展不平衡的矛盾日益显现。一是供给的数量和质量不平衡,城乡居民对农产品的消费更加关注品质、营养和安全,消费者和市场要求提供更多优质绿色安全蔬菜;二是市场需求与生产结构不平衡,当前中国农业的主要矛盾已经由总量不足转变为结构性矛盾,集中体现在阶段性供过于求和供给不足并存[8],市场上经常出现“卖菜难”和“买菜贵”的矛盾[9]。由于品种结构存在季节性、区域性供求不平衡,价格大幅波动现象在各个主产区轮番上演。据媒体报道,2020年沈阳秋白菜身价翻番,收购价格比去年涨近两倍,去年新民大白菜地头收购价0.16元/kg,今年达到0.44元/kg左右。市场需求与生产结构不平衡带来的影响由此可见一斑。三是生产的投入与效益不平衡,蔬菜生产用工多、用肥用药多,机械化水平低,生产成本不断上升,菜农增收缓慢。例如,湖南省湘潭市价格成本调查队于2020年1月初,对辖区蔬菜定点调查户露地大白菜品种进行了生产成本调查,2019年度露地大白菜每亩生产总成本为2903.07元,较去年同期增加96.82元/亩,增幅3.45%,成本增加的主要是土地成本和化肥费用增加。综合往年情况,总体成本一直居高不下,并预测后期运输、储存成本还会小幅增加。

2.4 产业链碎片化造成信息采集和质量追溯难

我国农业体制特色之一是家庭小农户对社会大市场,大白菜等种植性农产品规模化生产程度不高,在流通中则更加分散,在每个单品上做出标签或标码的相对成本太高。时空跨度大、责任主体多、数字化程度低、技术手段少、监管效率低的现状给全产业链的信息采集和质量追溯带来极大的困难。农产品信息采集与处理能力较低,最主要的因素在于我国农产品信息采集与处理手段较为落后[10],现有的大部分数据采集和质量追溯主要集中在商户的称重和结算过程中,其他环节则比较薄弱,造成全产业链数据不够完整、不够准确。又由于各部门和各单位信息采集与资源开发的方法与标准不统一,导致信息链被人为割裂,相互间的信息存在交叉重复现象,信息利用率过低[11]。有限的数据主要分散在政府各行业主管部门和大型电商、大型产供销一体化企业手中,受部门利益和企业自身经营策略影响,主动加入数据共享的积极性有限,数据对接和共享难度较大。随着国家大力实行乡村振兴战略和数字乡村建设,未来数据采集手段将更加丰富、质量追溯技术将更加先进,蔬菜产业链碎片化给信息采集和质量追溯带来的困难和问题应该会逐步得到解决,但技术推广、多方对接和共享协同的运行机制仍需探索。

3 蔬菜全产业链大数据平台总体架构

蔬菜全产业链大数据平台建设应以生产、加工、流通、监管等全产业链关键环节的数据资源为基础,以提升蔬菜生产经营和管理决策水平为目标,围绕产业发展的问题和痛点,整合上下游数据信息资源,通过对大数据、物联网、卫星遥感、人工智能等信息技术的综合运用,充分挖掘产业大数据价值,服务政府监管和生产经营需求,推动产业模式与监管方式变革,助力蔬菜产业的科学健康发展。

平台的总体架构可划分为三个大的逻辑层次,自下而上分别是数据资源层、数据分析层和数据应用层。数据资源层要与主产区县监测站点等产业链各环节的数据源建立技术连接,采集相关数据,并对采集到的数据进行治理和存储,形成可供分析应用的数据库和数据仓库;数据分析层是利用大数据技术对采集上来的海量数据进行挖掘和分析,面向数据应用构建价格预测模型等各类分析模型;数据应用层是以海量大数据和主题分析模型为支撑,面向主管部门等最终用户建设监测预警系统等业务应用体系。平台总体架构如图1所示。

图1 蔬菜全产业链大数据平台总体架构Fig.1 Overall architecture of big data platform for the whole vegetable industry chain

4 数据资源体系建设

数据是新型生产要素和社会财富,是国家重要的基础性战略资源[12],数据资源体系建设是大数据平台建设的基础工程。2020年3月,中国共产党中央委员会、中华人民共和国国务院《关于构建更加完善的要素市场化配置体制机制的意见》已将数据作为与土地、劳动力同等重要的生产要素,可以说,数据资源已经成为推动传统产业转型升级的重要资源[13]。在建设农产品全产业链大数据时,往往会出现农产品信息采集、处理能力较差的问题,这就为利益相关者提供准确、有效的农产品信息造成了一定的困难[14]。农业大数据的建设和应用现状显示,农业数据资源的采集和开发利用方面仍有较大提升空间,需要增强除政府推动以外的动力[15]。只有蔬菜产业链条各环节的衔接、流转、运行在信息系统上来完成,形成数字化记录,才能形成蔬菜大数据的来源[16]。蔬菜全产业链大数据平台数据资源体系的构建,需要综合利用物联网传感、遥感监测、API接入、互联网采集和批量购买等多种技术和方法,整合各种数据提供渠道,建立数据标准、数据采集网络和数据库、数据仓库,开展数据监测和数据治理工作,为大数据平台的数据分析应用提供持续鲜活的数据资源。如表1所示。

表1 大白菜全产业链数据资源表Table 1 Data Resource Table of Chinese Cabbage Industry Chain

5 蔬菜全产业链大数据平台的主要功能

5.1 监测预警

监测预警功能基于数据资源体系建设的数据成果,实现对大白菜等蔬菜品种的生产数据、加工数据、消费数据、贸易数据和监管数据的全面接入和动态监测。支持阈值设置,实现对面积、产量、价格、消费等关键指标信息的预警,当某项指标数据超出阈值范围,出现明显异常时,向用户发出警报。

5.2 分析决策

分析决策功能基于大白菜的价格预测模型、产量分析模型、供需预测模型、品质评价模型、贸易损害模型等专业分析模型,利用大数据挖掘分析技术和数据可视化技术面向政府主管部门等决策用户提供品质评价和主题分析等服务,为政府主管部门制定产业政策、开展行业监管提供决策支持。

5.3 公共服务

公共服务功能基于大数据平台汇聚的大白菜全产业链大数据,综合利用大数据分析和统计报表技术为种植户、种植企业、科研机构和社会公众等各类用户提供查询统计、监测报告、预警信息等数据增值服务。让用户能够掌握大白菜生产、加工、消费、贸易和监管等各环节的种植面积、作物产量、交易量、交易价格关键信息。特别是通过向种植户等市场主体主动推送基于大数据挖掘分析的趋势预测信息,可以显著提高其应对市场变化和把握市场趋势的能力,避免被动"盲种",解决因市场信息不对称造成的产业发展不平衡等问题。

5.4 移动应用

移动应用功能是利用手机等移动智能终端的普及化和便利性优势,以APP 或小程序的形式,向大白菜种植户、种植企业和社会公众提供数据填报、信息查询、专家知识和质量追溯等基础服务。其中,数据填报功能可以灵活定制数据项,通过终端用户的填报,让平台及时获取第一手的真实数据,促进为用户提供更全面、更准确的信息查询、专家知识等服务;质量追溯功能则可以通过“随手拍”等多种方式快速识别产品质量信息。移动应用各项功能在服务用户的同时,也利用目标用户地域分散但人数规模大的特点,化被动为主动,在一定程度上解决产业链碎片化带来的数据采集难和质量追溯难的问题。

6 总结与展望

6.1 多源异构数据的获取和共享问题急需解决

如何及时、准确、全面的获取产业链各环节的信息一直是蔬菜全产业链大数据建设的难点。解决这一难题要着力克服和破解产业链的分散性,通过适当的激励措施引导分散的生产经营主体建立信息化、网络化的联结,推动产业链货物流、资金流、信息流的数字化记录,从而完成大数据的积累。农业农村部近年来持续推动数字农业试点建设,正是为了从根本上提升我国农业生产的数字化程度。随着经济发展,更多的种植基地、种植大户在机械化、智能化上进行投入,以及一些智能化的农业物联网设备越来越受到更多大农场的欢迎,相信未来数据生产难、数据获取难等问题将逐步得到解决。

6.2 单品种数据资源的标准体系需要探索

蔬菜产品品种丰富,类型繁杂,同一个品种还有多种类型,这种情况无疑增加了全产业链大数据建设的难度。以大白菜为例,按株型可分为直立、半直立、开展3个类型;按球型可分为舒心、拧抱、合抱、叠抱4个类型;按外叶颜色可分为黄绿、浅绿、绿、灰绿、深绿5个类型;按叶柄颜色可分为白、绿白、浅绿、绿4个类型;按叶球内颜色可分为白、浅黄、黄、桔黄4个类型。针对这种情况,需要基于复杂的数字资源,探索构建简明适用的数据标准体系,规范数据资源的获取、分析和应用。

6.3 大数据分析模型需要持续研究和优化

数据分析建模作为大数据应用的关键因素,既是对原始数据的有效组织,也是对数据展现的重要支撑。任何模型的应用和成熟都是复杂而长期的过程,大数据分析建模需要进行5 个步骤,即选择模型、训练模型、评估模型、应用模型、优化模型结构。在真实应用场景中,应加强业务需求调研与业务架构优化,夯实数据基础和应用基础。不断选择、训练、评估、应用和优化模型,推进大数据分析建模的应用,为全产业链大数据建设打下坚实的基础。

猜你喜欢

大白菜产业链蔬菜
大白菜要高产这样管理
打造藜麦全产业链稼祺从“芯”开始
奇怪的蔬菜
蔬菜
不忘初心 打造农业全产业链大格局
产业链条“链” 着增收链条
铲除论文造假背后的黑色产业链
大白菜
蔬菜也“疯狂”
大白菜竖切营养流失少