农业信息化资源管理现状及大数据在其中的应用
2014-04-29董定超张慧坚
董定超 张慧坚
[摘 要] 农业信息化资源管理是为了服务农业,提高农业信息资源利用价值而采取的一系列措施。农业资源管理在数十年的发展中取得了丰硕成果。本文简述了农业信息化资源管理的发展现状,分析了农业信息化管理特点,总结了目前存在的问题,并提出了基于大数据的农业信息化资源管理方法和对策,为农业信息化资源管理提供了新的途径。
[关键词] 大数据;农业信息化;资源;信息技术
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 21. 058
[中图分类号] F302.4 [文献标识码] A [文章编号] 1673 - 0194(2014)21- 0077- 03
0 前 言
农业信息化资源是指通过科技、政策与经济等多种手段对农业资源、农业生产、农产品流通服务与监管过程中获得的规划、测量、控制、协调、服务等一系列数据集合。海量农业信息化资源因来源的多样以及数据格式的复杂,分布较分散。目前大多数农业资源管理仍然采用传统的分布式数据库架构存储和管理农业数据 [1-2]。
大数据是新一代信息技术的集中反映,是一个应用驱动性很强的技术服务领域,无法用现有的软件工具提取、存储、搜索、共享、分析和处理海量的、复杂的数据集合[3]。由于各类传感器日益普及,通讯技术的飞跃以及网络基础设施的高速发展,越来越多的领域如金融、电商、广告、医疗、生物、物流等开始有意识地收集和积累大量数据,并从中挖掘以前不曾也不可能触及的价值。过去两年所产生的数据量为有史以来所有数据量的90%[4],其中2013年中国产生的数据总量超过0.8ZB(相当于8亿TB),是2012年所产生的数据量的2倍,相当于2009年全球的数据总量。大数据已深入到各个行业,被誉为信息技术的又一次浪潮,为技术进步和行业发展带来全新方向。
农业信息化资源数据的增长速度越来越快,数据结构越发复杂,数据量不断增大,数据分析应用越来越困难。进入大数据时代,研究思维的发散使农业工作者将大数据技术引入农业,以解决农业数据的多样、复杂和冗余,摆脱农业信息化资源数据的应用依赖,使数据搜索、比较、聚类和分析简单有效。本文对农业信息资源管理的发展现状进行概述,并结合大数据的特点,指出其在农业信息资源管理中的应用前景,为农业信息资源化管理提供参考。
1 农业信息化数据管理发展历程
改革开放30年来,中国进行了多次农业资源调查和区划,完成了大量基础性工作,积累了大量的土地资源、水资源、气候资源、生物资源、农村能源、海岸带资源、生态环境、社会和农村经济等方面的图件、数据和文字报告等资料[5]。20世纪80年代,信息技术的崛起使信息化手段开始向农业渗透,计算机、数据库和3S技术开始运用于农业,土地、水域、气象等数据的采集和管理,海量数据通过信息技术手段获得,与传统调查、测量数据结合,成为农业生产中数据分析应用的重要来源,农业已成为信息技术的重要应用领域。
2 目前农业信息化资源数据类型及管理手段
2.1 农业信息化资源数据类型
(1)统计数据。统计数据是农业发展的基本,也是对农业实际情况的反映,包括农业基础记录数据、农业社会经济统计数据、农产品产量数据、气象观测数据等[6]。其中农业社会经济统计数据包括农业人口、农村劳动力、农业各项生产产值;农业基础技术数据包括有效灌溉面积、农业机械拥有量、肥料使用量,以及各种农作物播种面积、产量等相关数据。农业统计数据能够全面掌握农业发展情况,是农业发展情况的重要保证,是农业建设的重点依据,也是农业评估及政策制定的基础数据[7]。
(2)空间数据。空间数据是通过空间分布特征,用一种点、线、面及空间实体管理来展现资源位置、形状和大小的数据形式,具有定位、定性和时空管理等特性。农业信息化资源空间数据信息化研究始于3S技术的出现,其目的是通过地理信息系统(GIS)、遥感(RS)和空间定位系统(GPS)等技术手段将农业专题地图数据进行系统化管理[8-9]。
空间数据在区域农业资源展现方面有着无法替代的优势,多元信息的展示是空间数据的独有特点,区域农业资源规划、农业施肥管理、农作物适宜性评价、农业环境保护、农产品流通、农业病虫害防治因空间数据的引入,使得农业生产和农业决策得到了更准确和直观的数据支撑[10-14]。
(3)多媒体数据。多媒体数据是农业信息化资源管理近几年发展的新形式,主要体现形式是通过图像、音频、视频和动画等数据格式,将农业基础数据管理、农业生产、农产品流通等过程和方式以及复杂和专业的理论形象化展现,把农业科技成果和先进技术用通俗易懂的形式向管理方和农民展示[15]。多媒体图、文、声、像并茂的优点,在水稻栽培专家系统、棉花施肥专家系统、玉米栽培专家系统、饲料配方专家系统等均有应用[16]。
2.2 农业信息化资源的管理模式
(1)数据库管理信息系统在农业信息化资源管理中的应用。数据库管理信息系统在农业中已有较成熟的应用。国家级农业资源数据库自20世纪80年代初开始建立,经过30多年的发展,技术成熟,数据量已有相当规模,包括国家农业科学数据共享中心、中国农技网第三方农业技术平台、中国农作物种子资源数据库和中国西南药用植物资源数据库等。与此同时,各省份也十分重视农业资源数据管理,构建了包括北京农业资源数据库、江苏省农业资源数据库、宁夏农业数据库、德州市农业气象数据库和简阳市农业资源数据库等省市和地方数据库。农业资源数据库的建立,是新时期农业区划、农业资源管理的重要成果,收集了技术、信息、交易的基础信息,打造了农业战略体系,实现了农业信息化,并使农业信息成功服务于工业和服务业。
(2)3S技术结合数据库管理系统在农业信息化资源管理中的应用。农业资源内容繁杂,除类型和数据量的差异外,还涉及空间和展现形式差异。GIS技术可将空间数据和属性数据紧密关联,以数据的一致性体现资源的整体性,能构建完整有序的数据体系,并可将数据以图件的形式直观展现。GIS与农业的结合,诞生了“精准农业”,延伸了农业资源信息管理、区域农业规划、农作物估产、农业可持续发展、农业环境监测和农业生产潜力研究等诸多方面。RS技术的出现,使人类可在不接触的情况下获得作物生长、农业生态环境在地表的分布信息,是获得作物养分数据、土地利用现状数据和土壤数据的重要手段。RS的数据成果,是GIS决策和展现的基础之一。GPS配合GIS和RS,可在大比例尺数据基础上,将具体位置数据点精确测量,构成了精准农业中的重要一环。
3S技术是信息技术发展的产物,但是3S技术与数据库技术和网络技术的结合,进一步提升了农业资源管理的信息化水平。经过十多年的发展,WebGIS、空间数据库技术成为农业资源管理的主要信息手段,全国涌现了一大批先进的农业信息化资源管理系统。浙江省基于WebGIS 的农业资源信息系统就是一个整合了网络系统、农业资源信息数据库和GIS 系统,面向Internet/Intranet,以数据库系统为支撑的农业资源管理系统[17];江苏省农业资源地理信息系统的构建,采用了空间数据库和网页实时性技术开发,对该省农业资源数据进行了系统管理[18];新疆耕地资源数据库的构建基于WebGIS和空间数据库技术,构建了基于B/S模式的三层应用体系,实现了信息化手段对农业耕地资源的管理[19];海南省橡胶资源信息系统以WebGIS体系结构和空间数据模型为技术基础,构建了具有开放性、可共享性和实效性的农业资源管理系统[20]。
3 目前农业资源管理存在的问题
3.1 农业资源管理层级脱节
“十一五”以来,农业资源管理取得了巨大成就,以省为单位的农业资源管理与信息服务平台迅速发展,农业资源得到了全面和详尽的获取与保存,但直接可用于农业生产的资源管理应用较少,尽管在2000年后出现了以县为单位的县域农业资源管理系统,但自上而下的衔接不够,农业资源数据难以充分发挥作用。
3.2 部门和区域各自为政,资源融合力度差
农业资源数据因调查和获取手段差异,相关数据如地域、水文、气象和作物产量数据涉及农业、国土、水资源和气象等多个部门,数据格式、门类、语义不一致,区域和部门间重复收集管理,各类资源管理系统传输不畅、融合性低,限制了数据流通、共享和有效利用。
3.3 资源数据重复,信息重叠,类别不全
因政策的出台以及采集手段的演进,农业资源数据因技术不同、采集方法差异存在重复和重叠,数据难以按照标准统一整合。另外不同省份、不同部门信息化建设水平的差异,导致农业资源数据门类不全、数据分散,集成化程度较低。
4 大数据在农业信息化数据管理中的应用前景
4.1 大数据在农业信息化资源管理的应用基础
农业信息化资源经过多年的发展,积累了分布式管理的海量数据,而且由于农业信息化资源的诸多类型,存在大量非结构化数据。随着农业科技发展,物联网、云计算等新型信息手段的应用,非结构化数据增长势头迅猛,农业信息化资源已成为名副其实的大数据,如何将数据做好统计并充分利用发挥其价值是大数据技术在农业信息化资源管理的重要任务[21-22]。
4.2 面向农业信息化资源广度,发挥大数据分布与集成功能
以现有数据为基础,构建分布式数据部署应用,以区域和部门数据为核心,借助大数据分布式数据管理引擎和分布式文件系统(DFS)[23]优化效能,突破分布式非关系型数据管理与处理技术,融合农业信息化资源异构数据,通过数据组织技术建立大数据索引模型,打破农业资源分散、片面的应用局限,实现区域和部门间农业资源移动、备份和复制,优化存储和计算效能,整合国土、环境、水文等基础数据,涵盖种植业、林业、畜牧水产养殖业和农产品加工业等行业数据,从数据的广度和专业性出发,利用大数据挖掘和关联技术,构建非专业领域的数据应用,构建农业信息化资源本应有的关联[24]。
4.3 面向农业产业链深度,发挥大数据挖掘与分析功能
将农业产业各个环节通过大数据关联,针对行业需求开展大数据的垂直应用,将生产、加工、物流、营销和回溯用大数据进行特异群组挖掘,突破对象型数据连接和融合,仅从数据本身进行NoSQL应用以及以语义为基础的大数据挖掘和分析[25-26],将农业资源以序列模式发现和管理,面向空间数据、统计数据、时态数据进行决策支持,以松耦合方式管理和运用。目前绝大多数农业管理都将农业产业链分割,此举便于管理,但是却丢失了农业资源内在的关联,如农业生产、农产品存储和流通、农机由不同部门管理和调配。借助大数据,在不移动和拷贝各部门数据的情况下,通过大数据引擎将数据以分布式文件系统的形式耦合,具体应用时则通过映射和过滤将目标数据提取分析,得到最合适的数据集,而大数据对庞大的数据的处理和建模能力,则可将农业资源进行研究、分析和判断,建立信息系统,决策将更加科学化[27]。
4.4 面向农业和行业外部数据,构建“大数据驱动农业”模式
农业资源数据的收集和应用,不仅仅涉及农业单个行业,还包括社会、经济和服务等各个行业[28]。单纯从农业考虑农业,必然会发生农业生产的偏差。通过大数据驱动,以农业信息化资源为核心,将其他行业数据以序列和并列模式与其关联,运用大数据底层技术对关联进行分层和模拟,打造农业信息化资源各类针对性解决方案,把管理建立在数据分析的基础上,做到对农业的科学管理,从而更加合理地制定政策和措施,有效监管和扶持[29-31]。
通过整合农业信息化资源内部和外部数据,农业与行业外数据,建立数据模型,针对农业各项应用实施,形成惠及农业、农民和农村的数据共享互通,形成大数据网络支撑,是大数据在农业应用的终极目标。
主要参考文献
[1]陈印军,卢布,杨瑞珍,等.农业资源管理研究发展趋势与未来展望[J].中国农业资源与区划, 2007, 28(6): 21-25
[2]钟求喜,朱昕.分布式数据检索系统的设计与实现[J].湖南大学学报:自然科学版, 2010, 37(1): 86-88.
[3]李清泉,李德仁.大数据GIS[J].武汉大学学报:信息科学版,2014,6(39):641-644.
[4]Ahalt S C. Why Data Science[J]. Communications of the CCF, 2013, 9(12):11-15.
[5]曹尔辰,王秀山.我国省级农业资源信息管理的现状和发展设想[J].中国农业资源与区划,2001(29):37-39.
[6]段建军,王彦国,王晓风,等.1957-2006年塔里木河流域气候变化和人类活动对水资源和生态环境的影响[J].冰川冻土,2009,31(5):781-791.
[7]孙鸿烈.青藏高原科学考察研究的回顾与展望[J].资源科学,2000,22(3):6-8.
[8]毕硕本,王桥,徐秀华.地理信息系统:软件工程的原理与方法[M].北京:科学出版社,2003.
[9]王家耀.地图学与地理信息工程研究[M].北京:科学出版社,2005.
[10]吕晓男,孟赐福,麻万诸.重金属与土壤环境质量及食物安全问题研究[J].中国生态农业学报,2007,15(2):198-200.
[11]王少青.空间数据库技术在海南橡胶园管理的应用[D].重庆:西南大学,2009.
[12]王彦集,张瑞瑞,陈立平,等.农田环境信息远程采集和Web发布系统的实现[J].农业工程学报,2008,24(z2):279-282.
[13]李卫江,吴永新,茅国芳.基于WebGIS与模型的农业经济监测与评价系统的建立[J].农业工程学报,2010,26(5):213-219.
[14]潘喻春,赵春江.地理信息技术在精准农业中的应用[J].农业工程学报,2003,19(4):1- 6.
[15]梅安新,彭望禄,秦其明,等.遥感导论[M].北京:高等教育出版社,2001:261-286.
[16]王博,罗微,张培松.信息技术在农业资源管理中应用的现状与展望[J].农业网络信息,2009(9):5-9.
[17]祝利莉,郑可锋,胡为群,等.基于WebGIS的省域尺度农业资源信息系统的设计与开发[J].浙江农业学报,2006,18(4):221-225.
[18]胡雪琼.江苏省农业资源地理信息系统的组建与开发[D].南京:南京气象学院,2004.
[19]邹鹏.基于WebGIS的新疆耕地资源数据库的建设及其应用研究[D].乌鲁木齐:新疆农业大学,2012.
[20]侍慧宇.基于WebGIS的海南橡胶资源信息系统研究[D].重庆:西南大学,2009.
[21]李志刚.大数据:大价值、大机遇、大变革[M].北京:电子工业出版社,2012.
[22]Clifford Lynch. Big data: How Do Your Data Grow? [J]. Nature, 2008, 455(7209) :28 -29.
[23]DataStax Corporation. Big Data: Beyond the Hype,Why Big Data Matters to You[R]. White paper, 2012.
[24]王忠.美国推动大数据技术发展的战略价值及启示[J].中国发展观察,2012(6) : 44-45.
[25]Franks, Bill, Taming. The Big Data Tidal Wave[M].New York,NY:John Wiley&Sons, 2012.
[26]H V Alexandres. Jagadish,Challenges and Opportunities with Big Data [J].Proceedings of the VLDB Endowment, 2012, 5 (12):2032-2033.
[27]孟小峰,慈祥. 大数据管理、概念、技术与挑战[J].计算机研究与发展, 2013, 50(1):146-169.
[28]李树奎,李同昇,周杜辉.区域社会经济与农业技术扩散环境协调发展研究——以西北地区为例[J].地域研究与开发,2011(30):43-46
[29]黄伯仲, 沈汉威, 克里斯托弗·约翰逊,等. 超大规模数据可视分析十大挑战[J]. 中国计算机学会通讯,2012,8(9):38-43.
[30]Burstein F,Holsapple C W. Handbook of Decision Support System [M]. Berlin: Springer,2008.
[31]Konstantin Shvachko, Hairong Kuang, Sanjay Radia, Robert Chansler. The Hadoop Distributed File System[C]//Mass Storage Systems and Technologies (MSST), 2010 IEEE 26th Symposium, 2010:1-10.