基于大数据的农产品信息服务云平台设计
2021-04-18向模军邹承俊张霞
向模军 邹承俊 张霞
摘 要:针对现有农产品信息服务存在的数据质量低、整合难、流通差等问题和大数据时代的工作要求,依托物联网、大数据、云计算等技术,设计一种基于大数据的农产品信息服务云平台。数据获取层主要利用物联网感知采集数据,在大数据中心完成数据转换、处理、分析,通过应用层可视化展示实现“4A”应用。平台进行云化管理,为不同参与主体提供按需服务,将大数据技术应用于农产品信息服务领域,实现农产品大数据的实时共享,有利于农产品数据资源的有效充分利用。
关键词:大数据;云计算;农产品;平台设计
中图分类号:TP319 文献标识码:A
文章编号:2096-1472(2021)-04-60-03
Abstract: Existing agricultural products information services, with problems of poor data quality, difficulty in integration, and slow circulation, cannot meet the demands of the big data era. This paper proposes to design a big data-based cloud platform for agricultural products information service, using technologies such as Internet of Things, big data and cloud computing. On the proposed service cloud platform, Internet of Things is mainly used to sense and collect data on data acquisition layer, and data conversion, processing, and analysis are completed in big data center. "4A" applications are realized through visualization display on application layer. The platform, which is managed by cloud, provides on-demand services for different participants, applies big data technology to the field of agricultural products information services, and realizes the real-time sharing of agricultural products big data. The platform facilitates full and effective use of agricultural products data resources.
Keywords: big data; cloud computing; agricultural products; platform design
1 引言(Introduction)
我國是名副其实的农产品大国,农产品相关数据量井喷式地增长,使得原有的农产品数据处理模式已经不能适应大数据时代农产品信息服务工作的需要。因此,急需加快推进农产品信息化,利用以物联网、大数据、云计算、人工智能、5G网络、区块链为代表的现代信息技术,构建农产品信息服务平台,让农产品在迈向现代化的进程中插上信息化的翅膀。
2 目前农产品信息服务中存在的问题(Problems in information service of agricultural products)
在我国农产品信息服务领域,农产品信息不对称,“卖难”和“买难”现象尴尬并存,农产品生产不均衡,整体规模庞大与个体规模分散现象长期存在,加上城乡数字鸿沟,致使同国外发达国家相比有很大差距,主要表现在:
(1)农产品信息资源质量较低。一方面农民文化水平相对不高,没有能力也不爱学习农业信息技术,拉低了农产品信息资源采集质量;另一方面,偏远山区农村信息化基础薄弱,没有信息化系统和信息化设备,结合本地情况开发利用的信息资源极为匮乏。
(2)农产品信息未能有效整合。农产品涉及的环节众多,农产品全产业链较长,融合了地域性、季节性、多样性、周期性等自身特征后产生的来源广泛、类型多样、结构复杂的农产品信息,还未出现有效的整合方案,现有的农产品信息比较分散,大数据的优势有望从技术上改变这一问题。
(3)农产品市场信息流通不畅。农产品信息接收方式落后、单向、滞后,尤其在农产品市场价格及供求波动方面,在缺乏信息或信息被扭曲的条件下,广大农户一哄而上、一哄而下,不管不顾盲目生产,难以做到对突发事件及时发现苗头并提前应对。
产前缺乏市场信息引导,产中缺乏生产技术指导,产后缺乏销售信息和渠道。针对这些问题,国务院印发《促进大数据发展行动纲要》(国发〔2015〕50号)明确提出:发展大数据在农业等行业领域应用,构建农业信息综合服务平台,实现数据自动化采集、网络化传输、标准化处理和可视化运用[1]。农业农村部发布《农业部关于推进农业农村大数据发展的实施意见》(农市发〔2015〕6号)指出:鼓励开展大数据时代农业信息服务平台建设,更好地做好农业信息服务工作,实现农业生产智能化、经营网络化、管理高效化、服务便捷化[2]。
3 农产品信息服务平台功能设计(Function design of agricultural product information service platform)
农产品信息化包括农产品种植(养殖)、生长、收获、加工、包装、存储、运输、分销、销售全流程的信息化[3],根据对涉及农产品生产、加工、销售等参与主体的调研情况,结合提供农产品信息共享和服务这一主要目标,将平台划分为六大系统模块。
(1)用户管理。由于农产品参与主体众多,用户群体多样,本平台将用户类型分为政府监管人员、农产品企业、农业科研机构、农户以及消费者五种类型,通过基于角色的访问控制RBAC(Role-Based Access Control)权限管理模型,构造“用户-角色-权限”授权模型,确保不同用户类型拥有适当的权限,对应访问平台上不同的功能模块。
(2)农产品生产管控。基于农业物联网技术,利用传感器等设备实时监测农产品生产信息,如土壤湿润度等,同时利用智慧农业大棚等设施实现远程自动化控制,如智能灌溉等,以此帮助农户和企业构建一套农产品生产管控解决方案,期间积累的过程数据服务于科研机构用于农业的相关研究[4-5]。
(3)农产品安全溯源。溯源是农产品质量安全的重要保证手段,基于区块链技术解决农产品质量控制与可信追溯的问题,融合政府监管、消费服务等功能,与农业生产管控等模块相连构建农产品质量安全溯源系统,实现农产品从“种子”到“餐桌”的全生命周期管理[6-7],农产品各方参与主体共同建立健全农产品追溯体系,共同确保人民群众“舌尖上的安全”。
(4)农产品电商。借助农产品大数据实现精准在线交易,基于互联网开放的网络环境,实现C2B模式,即农户根据用户的订单需求定制化生产农产品;B2C模式,即商家通过平台卖农产品给消费者;B2B模式,即商家集中采購,分发配送给中小经销商;F2C模式,即农户通过网上平台直接卖给消费者;O2O模式,即消费者线上买单,线下自提农产品。
(5)农技智能问答。基于5G(5th-Generation,第五代移动通信技术)+AI(Artificial Intelligence,人工智能),构建懂业务、知用户的农业技术服务机器人系统,为农户、企业等农产品参与主体提供专业的技术信息服务。通过机器人智能问答,辅以农业专家在线指导,借助手机、iPad等移动终端,使多方不受时空限制开展互动,进行农技科普。
(6)综合信息服务。基于B/S结构(Browser/Server,浏览器/服务器模式)建设农产品信息网站,用于对农产品信息的发布、浏览、查询和订阅等,内容可以包括相关政策法规、农业新闻资讯、农产品市场信息等,力争实现农产品信息的及时、畅通。
4 构建农产品大数据应用架构(Building big data application architecture for agricultural products)
随着农业物联网的风生水起和农业信息化的不断深入,诸如农产品信息服务平台等智慧农业系统不断投建,农业大数据时代也应运而来。如何有效利用农业大数据服务农业现代化是当下热点[3,8]。图1展示了一种农产品大数据应用架构,图2是其网络拓扑结构。在这种设计中,将农产品大数据应用简单分为三层,即数据获取层(物联网感知层)、大数据处理中心(业务平台层)和数据应用层(应用展示层)。
在数据获取层,利用多种方式采集数据。可以手动录入数据,如各参与主体的原始数据批量导入;可以与其他农业系统对接采集数据;可以利用手机、iPad等移动终端拍照、扫码等采集数据,利用基于位置的服务LBS(Location Based Services)来获取设备/人员的所在位置;甚至可以使用无人机或人造卫星等采集农产品信息。从网络拓扑结构来看,更多的是通过物联网的感知来采集数据,通过LoRa(Long Range Radio,远距离无线电)、ZigBee、Wi-Fi等技术采集农产品环境数据,如空气的光照度、土壤的湿润度、水质的PH值。
数据采集的方式越来越多,数据类型也越来越多样化,各种结构化、半结构化和非结构化的数据不断产生,这些数据通过无线传感器网络(Wireless Sensor Networks,WSN)、局域网(Local Area Network,LAN)或5G网络传输到大数据中心。在大数据中心数据处理中,首先要利用“ETL(Extract-Transform-Load)”技术,结合利用网络爬虫爬取来自互联网的农产品数据,将这些数据经过抽取、清洗、转换之后加载到数据仓库。利用开源工具Sqoop,实现Hadoop(HDFS)与传统的关系型数据库(MySQL等)之间进行数据的传递,将分散、零乱、标准不统一的数据整合到一起。本设计中,非结构化数据还是采用NoSQL数据库的HBase数据库分布式存储,全文检索等搜索引擎采用Solr搜索应用服务器,统一的资源管理和调度采用YARN资源管理器,大数据集群计算环境采用专为大规模数据处理而设计的Spark计算引擎,查询、分析等采用基于SQL(Structured Query Language)的查询计算工具Impala[4,9-10]。
这些农产品数据经过大数据中心处理后,针对本信息服务平台六大功能模块开展大数据分析、数据挖掘,完成大数据可视化,实现平台的“4A”应用:任何设备(Any Device)、任何时间(Any Time)、任何地点(Any Where)、任何人(Any One),让包括本平台五种用户类型的所有人,可以打破时空局限,随时随地访问农产品信息服务平台。
5 农产品信息服务云平台设计(Design of cloud platform for agricultural products information service)
为了以低成本的方式提供规模可伸缩的高可用的农产品信息服务,省去购买软、硬件以及建立现场大数据中心的费用,本设计引入云计算技术来构建农产品信息服务平台。
“云计算”在其概念提出的10多年间,取得了飞速的发展与翻天覆地的变化,包含SaaS(Software-as-a-Service,软件即服务)、PaaS(Platform-as-a-Service,平台即服务)和IaaS(Infrastructure-as-a-Service,基础设施即服务)。
如图3所示设计的农产品服务云平台架构[5,7],将各类资源利用虚拟化技术进行高效统一的整合,应用先进的大数据处理、分析技术对其进行云化管理,以满足不同参与群体的需求。
农产品数据存储层(IaaS层):将计算资源,包括服务器、存储、网络和农产品数据等,利用VMware虚拟化技术提供可扩展的弹性的云服务给用户,用户按需购买资源,而不必购买全部硬件。
农产品数据处理层(PaaS层):将平台运行环境等构建成统一的自动化协调的分布式运行环境,以服务的形式或以API、SDK的形式提供给用户,简化应用的部署、运行等。
农产品数据交互层(SaaS层):面向终端客户,提供一站式的解决方案,以本设计的农户为例,可以利用农技智能问答系统获取专业知识,可以利用农产品电商平台进行在线交易等。
集中管理平台:有效管理整个服务平台,确保整个服务平台安全稳定。
6 结论(Conclusion)
针对当下农产品信息服务中存在的问题,以及农产品数据格式多样、物理分散等特征,设计了一种基于大数据的农产品信息服务云平台,以期打破不同农业数据库的“数据孤岛”,突破不同农业应用系统的“服务孤岛”,实现农产品大数据的有效共享和运用。
参考文献(References)
[1] 国务院.促进大数据发展行动纲要(国发〔2015〕50号)[Z].2015-08-31.
[2] 农业农村部.农业部关于推进农业农村大数据发展的实施意见(农市发〔2015〕6号)[Z].2015-12-29.
[3] 吕婧.农业大数据信息服务平台设计与实现[D].兰州:兰州大学,2019.
[4] SONG S H, ZHANG Z. Database resources in big data center: Submission, archiving, and integration of big data in plant science[J]. Molecular Plant, 2019, 12(3):279-281.
[5] 沈超.基于云计算的农产品信息服务平台构建策略研究[D].杭州:浙江工业大学,2017.
[6] 李秀峰,陈守合,郭雷风.大数据时代农业信息服务的技术创新[J].中国农业科技导报,2014,16(4):10-15.
[7] 李朝锋.大数据时代基于云计算技术构建农业信息服务平台研究[J].河南科技,2017(5):19-21.
[8] SHANG H Y, LIU Y, ZHENG A, et al. Research on technical architecture and application of big data cloud platform for electric power measurement[J]. Journal of Physics: Conference Series, 2019, 1213(4):1-6.
[9] 李錦华.基于大数据分析的海量信息软件系统设计与开发[J].软件工程,2017,20(11):54-56.
[10] 姚艳敏,白玉琪.农业大数据标准体系框架研究[J].农业大数据学报,2019,1(4):76-85.
作者简介:
向模军(1974-),男,硕士,副教授.研究领域:农业信息化.
邹承俊(1963-),男,硕士,教授.研究领域:农业物联网.
张 霞(1981-),女,硕士,副教授.研究领域:软件工程.