以大数据思维反观农业大数据发展现状
2018-05-14李闰枚孔娟娟张立平方钰徐桂珍
李闰枚 孔娟娟 张立平 方钰 徐桂珍
摘要 大数据是新型战略资源,应用在农业领域前景广阔,不仅能挖掘出农业资源间的发展潜力,发挥耦合效应,还可以实现精准生产和销售,提升决策水平。相比较其他产业,农业大数据的发展相对滞后。阐述了大数据思维3个方面特征,以此为指标反观我国农业大数据的发展现状,并提出了建议。
关键词 大数据;大数据思维;应用;反观
中图分类号 S-058文献标识码 A文章编号 0517-6611(2018)34-0190-03
2016年5月25日,在中国大数据产业峰会上,李克强总理强调“大数据为21世纪的钻石矿”,必须下决心打通数据壁垒,实现各部门和各层级数据信息互联互通、充分共享。为在新一轮信息化潮流中抢得先机,2016年农业部推出《关于推进农业农村大数据发展的实施意见》,牵头建设的国家农业大数据中心已经启动,投资3 000万元。由此可见,信息化与国民经济深度整合是政府的重大战略部署。在此背景下,全国各地纷纷建立农业大数据中心,经过2年的发展,大数据在农业生产、经营、管理、服务中均有一定程度的应用,但距离大数据和现代农业发展的要求有较大差距,存在着认识不足、顶层设计缺失、采集机制不健全、基础设施薄弱、技术支撑能力不强、深度应用滞后等一系列问题[1]。因此,发展农业大数据,首先要提高对大数据的认识水平,不仅应深入理解大数据的概念,而且要理解大数据既是一种新兴的技术,也是一种思维模式,只有掌握大数据思维,才能有完善的顶层设计指导农业大数据的可持续发展。
1 从数据到大数据
大数据和传统数据的本质都是数据,但是由于产生方式、载体、形式、体量的不同,它们有很大的区别。数据需要用一些形式表现出来,并用载体记录下来。传统数据的形式为文字、图形和数字,造纸术发明以前,数据记录在石材、羊皮、竹简等物件上,造纸术发明以后,数据的保留和传播得到了质的飞跃。传统数据是一种宝贵的资源,将有价值的信息挖掘出来,需要付出努力去探索并记录下来。计算机发明以后,特别是进入大数据时代,这些数据更多记录在计算机里,大数据的形式多种多样,除了文字、数字、音频、视频、图片,还包括网页浏览检索痕迹、金融交易记录、外出行程记录等。大数据是现代生活的副产物,是各种传感设备或者手机APP在为人提供服务时自动产生并记录下来的,并非有目的性探索发现的结果,这些记录在计算机里的数据,是一种更纯粹意义上的数据,本身并没有什么价值,如果不对这些大数据进行分析和挖掘,反而会浪费计算机宝贵的存储空间。2011年5月,麦肯锡研究院发布报告,第一次给大数据做出相对清晰的定义:“大数据是指其大小超出了常规数据库工具获取、储存、管理和分析能力的数据集[2]。”
2 大数据思维
大数据的产生为信息化发展开启了新的时代,各行业纷纷进军大数据领域,并达成了前所未有的效能。比如亚马逊(Amazon)利用用户的购买和浏览历史数据,进行针对性的购买推荐;阿尔法围棋(AlphaGo)在和世界围棋冠军的对弈中大获全胜。这些案例的出现说明了一点,大数据时代的出现标志着思维方式的转变,人们要学会用大数据思维去发掘数据的潜在价值。
根据维克托·迈尔·舍恩伯格在《大数据时代》一书中的看法,大数据思维有3个方面的特征:第一,需要全部数据样本而不是抽样样本;第二,关注效率而不是精确度;第三,关注相关性而不是因果关系[3]。
2.1 使用全数据样本
传统的统计学根据有限的数据样本去分析推理,以达到理解研究对象及规律的目的,数据及样本的限制难免会产生误差,当数据量足够大的时候,就无需使用样本来理解事物,因此,大数据是全数据思维,全方位真实立体反映客观事物,发掘隐藏的规律和关联,甚至可以做出准确的预测,也就是说,一切用数据说话。
2.2 重视效率而非精准度
在数据有限的情况下,数据的准确性非常重要,否则会被误导。但当数据足够大时,可以接受一定的错误存在,大数据仍然可以准确预测事物发展的趋势,因此人们不会把精力放在少数数据是否精准之上,而是尽快根据大数据给出的趋势,迅速采取相应的决策和行动,特别在市场销售领域,这样就能尽快抢占市场先机,这就是重视效率而非精准度的思维方式。
2.3 以相关思维取代因果思维
长久以来人们对世界的了解多采用因果思维的方式,数据可以展示出“是什么”,人们通过数据进而发掘“为什么”,通过这样的过程不断进行科学研究和探索,但大数据的出现带来了全新认知方式。以经典的沃尔玛“啤酒+尿布”营销案例为例,在传统的货架展示中,超市会对货品进行分门别类的摆放,啤酒和尿布这2件不相干的商品不会摆在一起,但大数据显示,伴随尿布被一起销售的东西往往是啤酒,这个现象与美国文化有关,即父亲会在下班路上去超市采购,他们会在买尿布时顺便买啤酒,于是超市工作人员会将啤酒和尿布擺放在一起,明显提升了销售量。这个案例说明,大数据让人们看到了尿布和啤酒的相关性,这是用因果思维方式看不到、想不到的。
3 大数据与农业
大数据技术掀起了新的技术革命,目前在各行各业都有了长足的发展和应用。农业大数据是指大数据技术、理念和思维在农业领域的应用。从更深层次考虑,农业大数据是智慧化、协作化、智能化、精准化、网络化、先觉泛在的现代信息技术不断发展而衍生的一种计算机技术农业应用的高级阶段[4]。
3.1 农业大数据的产生和获取
随着农业信息化的发展,农业领域已经积累了大量的数据,比如政府统计部门、科研院所、植保站和农技站都拥有大量农业相关数据,这些数据虽然体量较大,整理并激活也有一定的价值,但大数据技术的核心并不在于整理存量数据,否则与传统的统计学无异,大数据技术的关键是快速采集实时数据并处理和应用。农业大数据主要从3个渠道进行采集。第一是感知技术,包括各种传感器、遥感设备、飞行器等,感知技术从不同角度和尺度感知并采集动植物生命与环境信息;第二是识别技术,包括RGID技术、光谱扫描、无损检测技术等,主要用于农产品品质分析、产地环境监测、商品流通监控等环节;第三是智能移动采集技术,包括各种智能终端、手机APP等,主要采集农产品市场、营销价格和农业管理信息[5]。
感知技术、识别技术和智能移动采集技术的发展,使得现代农业在全产业链中源源不断产生海量数据,农业大数据的重要意义不在于获得庞大的数据信息,而主要在于对这些数据进行挖掘和应用。
3.2 大数据在农业上的应用
大数据在农业上所发挥的作用,用一个词来概括就是“智慧农业”,大数据思维的本质就是智慧思维,这种智慧的主体不是人类,而是经过挖掘的大数据,这是跨越式的改变。在地球上,智慧一直是人类所独有的,现在由于大数据技术的发展,有了人工智能,这种智能在某些领域已经超越了人类。 同样,智慧农业的出现也是农业发展突破性的改变,这种改变可以用3个关键词来概括,就是耦合、精准、决策。
3.2.1 耦合。农业生产者一般只能将精力放在生产环节。农业产生是一个整体,环环相扣,但由于信息不對称或者滞后,不能统筹规划生产,造成了资源及产品不足或者浪费的问题。
大数据技术为解决这一难题带来了转机,农业不同生产环节实时数据的采集和处理可以全面立体反映生产现状,也能体现出不同环节之间的关联及相互作用,发挥耦合效应,挖掘农业资源间的发展潜力、搭配关系,精确计算最优化配置模式,提升效能。比如M6生鲜超市服务器从2012年开始,一边从互联网上采集天气数据,一边收集顾客的消费数据,然后分析不同节气和温度下顾客的生鲜购买习惯会发生哪些变化。大数据使气象和销售这两个看似不相关的领域联系起来,M6生鲜超市根据大数据分析去配送货物,避免了不必要的损耗,这就是大数据发挥耦合作用的体现[6]。M6生鲜超市的例子是耦合效应小范围的应用,未来有大数据的支持,可以站在全产业链的高度甚至跨行业进行深度耦合,农业生产力将会有跨越式的提升。
3.2.2 精准。我国农业生产由于科技含量较低,供销信息不对称,一直处于粗放生产和经营状态。根据国家统计局2007—2015年的统计,我国化肥和农药使用量呈现逐年增加的态势,虽然用量大但效率低下。以2013年为例,农用化肥施用量为5 911.8万t,综合利用率仅为30%左右,农药施用量为180.2万t,利用率仅为35%左右。显而易见,滥用农药化肥的现象普遍存在。
大数据技术为精准农业带来了可能,地面传感器能实时捕捉地面情况,遥感技术能从空中观测地表情况的改变,全面立体准确反映农业生产情况,不仅能及时应对出现的情况,而且能积累数据发现规律,对未来发生的情况做出预测。也就是说,有了大数据技术,才能对出现的问题进行精准描述,从而有精准决策。传感器等设备的使用,不仅解决了人力不足的问题,而且克服了因知识、经验以及主观意识不同而产生的误差。比如美国土壤抽样分析商Solum使用整套硬件加软件分析,实现了土壤的精准分析,帮助农民制订合理的施肥计划,不仅精准到土地何处施多少量的肥料,还包括施肥时间,并根据返回的土壤数据不断修改施肥计划[7]。这些大数据技术的应用,不仅可以在生产领域达成精准这个目标,而且可以在产前准备阶段及产后销售领域发挥精准效应。
3.2.3 决策。智慧与判断和决策能力密不可分,智慧农业的重要特色就是决策水平的提升。在传统农业生产及销售过程中,常常因为农户认知水平有限、信息闭塞不流通而做出错误的决策,导致出现诸多问题。有了大数据之后,海量数据能够立体反映客观事物,发掘隐藏的规律和关联,通过预测分析事物未来发展的趋势,帮助数据使用者提前做好相应决策,避免出现扎堆种植养殖,滞销难卖的情况,真正实现从以生产为导向到以消费为导向的转变。
4 以大数据思维反观农业大数据
中国大数据产业结构总体而言落后于全球市场的步伐,大部分企业仍停留在基础软硬件设施投入和部署阶段,国内大数据市场虽然在快速增长,但仍处于增长的早期阶段,而农业大数据在我国大数据产业中又属于薄弱环节。要发展农业大数据,首先要对大数据有准确而深刻的理解,才能把精力放在正确的发展方向,有的放矢。著名企业家稻盛和夫认为成功是3个要素在起作用,第一是思维方式,第二是工作热情,第三是能力。3个要素当中,思维方式最为重要,如果思维方式错了,工作激情与能力再强都只能加重损失与失败[8]。同样,理解大数据前提是掌握大数据中小的思维方式,维克托·迈尔·舍恩伯格论述大数据思维包括3个方面特征,使用全数据样本、重视效率以及相关思维,这些特征不仅对大数据进行了描述,而且提供了一种尺度,帮助人们理解目前农业大数据。下面以这3个方面为尺度,反观我国农业大数据发展现状。
4.1 从全数据样本角度
全数据可以全方位真实立体反映客观事物,发掘隐藏的规律和关联,因此数据成为一种新型资产和宝藏,而采集整理存储数据是发展大数据的基础。从政府到企业,必须有意识采集整理甚至共享数据,逐步形成全数据样本,否则即便掌握了很好的挖掘技术,也会陷入“巧妇难为无米之炊”的境地。在某些领域,受政府需求或市场导向,数据采集方面已经发展得很好,比如电子商务、交通旅游、医疗安防。但农业是较为特殊的产业,不仅涉及农林牧副渔不同门类的生产,也涉及到市场销售及售后,行业跨幅大,区域差别大,从业人员老龄化,跟不上信息化的步伐,仅靠公司企业很难构建全数据样本,需要政府的财力人力支持,牵头数据采集、整理、清洗及共享工作。
不少发达国家非常重视农业数据的采集共享,比如美国会发布年度《农业中长期展望报告》、月度《世界农产品供需预测报告》、周度《农作物生长报告》,美国政府创建了data.gov数据网站,提供了348个农业数据集,这些数据免费提供给个人以及公司企业,极大地推动了农业数据分析决策的发展[9]。
我国也越来越重视农业大数据的采集,农业部《关于推进农业农村大数据发展的实施意见》中明确提出要拓展物联网、互联网等数据采集渠道,但目前我国的数据积累还处于起步阶段。随着物联网、智能终端技术的发展,涉农数据呈“爆炸式”增长,这就产生3个方面的问题亟待落实,第一,需要专人专项资金负责海量涉农数据的存储、检索和组织工作;第二,需要尽快攻克多种类数据标准融合技术;第三,需要建立数据长期运作及共享机制。