APP下载

大数据背景下农业科技平台发展的困境及对策

2015-04-17徐小俊

福建农业科技 2015年6期
关键词:数据服务科学科技

徐小俊,方 佳

(1.中国热带农业科学院科技信息研究所 571737;2.中国热带农业科学院;3.国家农业科学数据共享中心热带作物科学数据分中心)

随着信息技术的创新和发展,人类社会已进入“大数据智能云服务”时代,各类数据资源包括农业科技数据成为国家经济社会发展的重要战略资源。海量数据呈几何式增长,加速了全球信息化进程,也增加了行业发展的各种变数和知识需求。从国家政策层面来看,随着十八届三中全会《关于全面深化改革若干重大问题的决定》的公布与实施,我国的改革进入新一轮的深化阶段,各领域正在推进国家治理体系建设和治理能力现代化,农业信息化发展也是国家治理的重要组成部分,其中作为农业科技信息资源重要载体的农业科技平台的发展对农业信息化发展起着至关重要的作用。农业科技平台是开展农业科技活动和创新的物质基础,是农业信息化建设的基础支撑,也是国家现代农业发展水平的重要体现,必须紧跟深化改革的时代步伐。由此,无论是大数据时代背景,还是我国现阶段的现实国情,探讨农业科技平台的信息资源整合、知识服务产业、战略管理等具有非常重要的现实意义。然而,诸多原因导致了我国农业科技平台发展面临许多困境。如何在爆炸式信息增量中提取和利用最有价值的信息资源来支持产业发展和服务管理决策;如何通过改善知识服务和信息化建设来实现产业战略升级;如何借鉴大数据做好社会治理顶层设计和研究,是迫切需要深入思考的问题。李道亮[1]将诺兰模型与“S”曲线理论结合起来对我国农业信息化发展阶段进行了研究,认为当前我国农业信息化处于诺兰模型的第二、三阶段,即农业信息基础设施建设阶段 (信息化普及和发展阶段)。李瑾等[2]认为我国农业信息化起步晚、基础薄、农民知识水平低,导致农业信息化发展严重滞后于国家信息化发展,在农业信息基础设施建设阶段应该着重加强各类农业信息资源的开发,包括农业数据库、农业科技平台的开发和运用。利用农业科技平台去规范记录、科学表达,最大限度地采集、分析、挖掘这些农业科技数据资源的价值,成为农业科技平台发展必须解决的问题。本文以国家农业科学数据共享中心热带作物科学数据分中心 (以下简称“分中心”)为例,从个性到共性的角度分析大数据背景下农业科技平台发展遇到的困境,并提出相关对策。

1 我国农业科技平台发展概况

1.1 国内农业科技平台发展概况

我国农业科技平台的建设起步较晚。就国家级的农业科技基础条件平台建设来说也是从21世纪初才开始起步,之后,地方的农业科技平台建设随之跟进。农业科技平台发展时间短,但发展速度较快。截至2010年,在短短10年时间,我国1058个地市级以上农业科研机构拥有农业科技创新平台、成果转化平台、农业科技服务平台等各类平台2364个,平均每个单位拥有平台2.2个。以59个部属单位为例,拥有各类平台366个,平均每个单位有6.2个,其中,省部级及以上平台数量达357个,平均每个单位有6个[3]。我国农业科技平台在数量上比较多,但真正有影响力的比较少,存在数据规模不大、数据信息质量不高、精品数据库少、数据标准化程度低、资源共享程度低、重复建设、同质化发展等问题。农业科技平台的类型也较多,技术条件和资金支持差别也较大,本文主要探讨数据存储式平台。

1.2 国家农业科学数据共享中心热带作物科学数据分中心

国家农业科学数据共享中心 (以下简称“主中心”http://www.agridata.cn/)是国家科学数据共享工程中农学领域的科学数据共享平台,于2006年上线,2011年通过科技部、财政部考核成为全国23个国家级科技基础条件平台之一,以满足国家和社会对农业科学数据共享服务需求为目的,立足于农业部门,以数据源单位为主体,通过集成、整合、引进、交换等方式汇集国内外农业科技数据资源 (从事农业科技活动所产生的基本数据),并进行规范化加工处理、分类存储,最终形成覆盖全国、联结世界、可提供快速共享服务的网络体系,属公益性农业公共科技服务平台。分中心 (http://trop.agridata.cn/index.asp)是主中心下属的7个分中心之一,分中心的承建单位是中国热带农业科学院科技信息研究所,主要承担热区作物科学数据库的资源建设,实现为热带农业科技创新和发展提供信息支撑。目前,分中心已建成五大主题数据库,包括热带作物遗传资源数据库、热带作物栽培数据库、热带作物生物学数据库、热带作物育种数据库、热带作物基础数据库,第六大主题库——热区栽培数据库即将筹建完成。分中心在数据分级分类和用户分级的基础上,将所有已建成的数据库通过农业科学数据中心共享网络系统面向全社会免费开放,以服务科研人员为主,服务“三农”为辅。服务形式包括:在线服务 (数据浏览、检索、下载、提问等)和离线服务 (电子邮件、光盘、电话、印刷物等)。通过多种方式和手段,使整合的数据资源实现全部共享,让更多的农业科技人员和公众通过共享平台获得益处。同时,分中心在整个发展过程中也遇到许多困境,这些困境大多与整个农业科技平台发展的大环境有关,具有一定的共性,本文将对这些共性问题进行分析和研究。

2 农业科技平台发展面临的困境

由于诸多原因,我国农业信息化发展严重滞后于国家信息化发展,加之农业数据的增量速度惊人,使得农业科技领域对大数据的驾驭能力显得明显不足,农业科技平台发展面临很多困境,主要表现在以下几个方面。

2.1 农业科学数据异构复杂,采集难度大

农业科学数据是农业科研活动的基本产出之一,也是推动农业科研向深度和广度两个方向不断发展最为活跃、最为基础的科研要素。我国大多数的农业科技平台都属于数据存储式平台,而数据存储式平台的第一步就是要解决数据采集的问题。

农业科技平台数据采集的难度大主要表现在:采集对象的特殊性、复杂性;采集的滞后性;缺乏科学、系统的采集机制和法律法规的支撑。每个行业的数据都有其特定的特征,而农业作为一个开放性的空间系统更为复杂,如农业要受到时间、空间、天气、地理环境、病虫害等综合因素的影响,是一个多维、动态的过程。农业科学数据的专业性较强,涉及的知识领域广泛,包括微生物、昆虫、植物、动物、化学、自然资源、生态环境、大气等多种学科,这些都决定了农业科学数据呈现复杂异构化的特点。当今世界,各种数据采集和存储设备每时每刻都在获取和存储大量新数据,这些数据以高密度流形式快速演变,具有很强的时效性,只有快速适时处理才可有效利用[4]。而我国的农业总体上信息化程度不高,难以实现机器和传感进行数据实时记录和采集,存在数据采集滞后的问题。目前农业数据的采集主要依赖国家统计机构、科研机构和高校等机构的人工采集,只有少量数据可以通过监测传感网络实现实时采集。农业科学数据成“碎片化”掌握在不同的研究机构、部门和科研人员的手中,由于“信息壁垒、信息孤岛”的存在,缺乏相关法律的硬约束,立法推进过程缓慢,以及数据采集机制的不完善,单位或个人不愿将手中的数据共享,给数据采集带来了阻碍。目前农业科技平台的数据采集模式除来自本单位科研部门提交外,还有相当一部分是委托第三方进行数据的收集和整理,数据的来源渠道比较窄,跟不上形势发展的需求。

2.2 数据分析审核难度高,缺乏农业数据专家

长期以来,农业科技平台存在重建设、轻管理的问题,数据质量的把关不严。主要有两个方面的原因。

一是农业数据深度分析审核难度大。因农业数据本身的特殊性、复杂性、专业性等特点,给数据分析审核带来难度。数据管理软件更新升级跟不上发展的需要。农业科技平台还处于发展完善阶段,在数据管理软件的设计上还存在不完善的地方,不能实现一般的数据质量分析和全面、批量的智能审核,有些数据信息存在的问题具有隐蔽性,目前数据库的处理软件只能完成部分逻辑分析审核,数据的分析审核主要依赖人工。缺乏一套可供参考的科学、系统的专门针对农业数据分析审核的标准体系。虽然也制订了一些管理办法、规范和标准,但过于分散,还没有形成一套系统科学的农业数据标准,数据分析审核主要依靠审核人员的知识水平、经验积累以及借鉴、探索来进行。

二是缺乏懂农业的数据专家,没有制定完善的人才培养机制。数据的行业性特征比较明显,农业数据管理除了需要熟悉平台架构的数据库工程师,还需要既懂农业又懂数据萃取分析、有极强的驾驭和管理海量数据能力的数据科学家,对从业人员要求较高。美国农业科技平台都是通过数据团队来完成的。目前,国内许多农业科研机构做数据平台的人员一般都是兼职的,专业背景各异,人员的素质参差不齐,没有形成数据团队。由于技术力量薄弱,领军人才缺乏,专门针对农业数据专业人才的培训还不是很足,对人才的培养还没有形成常态化的机制。

2.3 数据支持科技创新和服务共享不足

目前,我国农业科学数据共享工程结构体系是由主体数据库、科学数据中心或科学数据网、门户网站所构成的三级数据管理与共享服务体系[5]。科学数据中心是常设机构,负责统筹数据库、门户网站的建设和管理、数据服务以及日常工作,主体数据库是科研产品,主要是面向科研人员自行查询获取,同时免费向全社会开放。

农业科技平台主要有四大功能:一是支撑农业科技创新,二是实现服务共享,三是保护农业科技资源,四是促进科技交流[5]。目前农业科技平台在保护农业科技资源和促进科技交流方面做得较好,在支撑农业科技创新和实现服务共享方面还做得不足,传统的数据服务模式已不能满足形势发展的需求,表现在以下几方面:数据萃取、分析解读能力不高,数据价值未能得到充分挖掘,为相关部门和政府提供科学决策的力度不够;对有关国家科技计划和重大科研项目、经济建设、服务民生等方面数据支撑力度不够;数据服务缺乏主动性,数据服务滞后,服务的模式比较单一,服务共享的范围比较窄,长期以来农业科技平台的主要服务对象是科研人员,由科研人员自主查询和获取,在服务社会、服务企业,特别是在服务“三农”方面显得不足,而服务“三农”的难点在于我国农业从业人员的整体知识文化水平都不高,数据的直接使用存在一定困难,数据必须经过二次加工转化或者通过科研人员的解读,才能满足农户对信息资源的需求,这无疑增加了数据服务的难度和成本。

2.4 缺乏大数据的战略设计,平台建设投入不足

虽然已进入大数据时代,但目前整个农业科技平台的运作还停留在小数据时代。农业科技平台的搭建和发展还是依赖自上而下的行政干预和利益驱动来实现,平台的发展缺乏强劲的动力和活力,从数据的采集到最后实现数据的服务,整个过程耗时、费力、低效,发展模式缺乏大数据的战略思维,数据处理能力、管理和服务水平已经越来越不适应现代农业信息化发展的需要。平台建设投入滞后于发展需要,主要表现在以下3个方面。

一是经费投入不足。长期以来,除少数国家级科技平台有部分运转经费外,大部分平台没有运转经费,只是在申请国家各类科技计划项目中优先重点支持,但日常运转经费等仍需自筹[6]。就国家农业科学数据共享中心来说,每年的经费支持700万~1000多万元,并且还需要层层分配,分中心每年的经费支持40万~70万元,但由于目前科研经费开支的种种限制,存在“花钱难”的问题,导致平台的管理者和合作者都缺乏积极性,平台的委托项目缺乏吸引力,给平台工作的推进带来了难度。对于其他需要自筹经费的平台来说,运行和发展就更加艰难了。而对比许多发达国家,如美国单个国家级的农业数据平台每年的投入就高达上亿元人民币。

二是人力投入不足。根据国家和省部级农业科技平台管理实际需求,一般每个平台都需配备1名专职管理人员全面负责实验室的日常管理工作,才能保证管理制度得到正常执行[7],一般的单位配备平台管理人员1~2人,但一些实力较弱的基层农业研究单位没有专职管理人员[8]。人力的不足,难以保证农业科技平台的稳定持续发展。

三是技术投入不足。我国农业科技平台发展起步晚,但发展速度相对较快。由于基础薄,技术投入跟不上形势发展的需求,例如:数据搜索的精准性差、网页设计还不够人性化、数据分类还不够科学等。大数据时代数据量大、结构异化、增速快、价值密度低,在数据的实时获取、存储、传输、处理等方面,常规的IT技术已难以应对,必须加强技术的更新和升级,比如:实时高效的PB、EB级的大规模数据储存技术、关联数据技术、数据传感网络的建设、数据分析模型的构建、数据的价值萃取技术等。

3 对策

农业科技平台发展的两大重点是资源建设和数据服务。资源建设主要解决农业科学数据来源以及来源的可靠性问题,确保数据的真实和有价值,避免出现虚假和垃圾数据;数据服务主要是解决服务的广度和深度问题,加强数据分析,充分挖掘数据的价值,扩大数据服务的对象,提高数据服务的质量和成效。

3.1 建立科学的建设模式,构建完善的采集机制

从短期来看,应继续依托现有的联合共建共享农业科技平台建设模式,进一步扩大合作范围,拓宽数据采集渠道。加强政、企、学、研各界的交流与合作,扩大与相关部门和单位的合作,如国家统计部门、高校、农业公司等,进一步拓展数据的采集渠道,保证数据来源。可以通过与有关单位进行协议互签,建立稳定的合作机制。但未来应该谋求一种更为科学的模式,有学者认为建立农业数据联盟模式,将是一个可供选择和探讨的方向。国家可以设立类似数据托管中心这样的机构来实现农业数据的交换和管理[9],更多的稳定成员,更多的数据源,但是难点在于成员之间的约束和顺畅的运行机制。

从长期来看,必须加快推进立法实现农业数据信息的共享。我国农业现有的信息共享机制大多属于合作的性质,过于柔性,缺乏硬约束,给信息共享带来障碍,必须采取立法的刚性措施:强制性规定只要是接受政府经费支持的机构、个人、项目等,都有义务向国家提交相关数据,从而从根本上破除“信息壁垒”的存在。例如,1946年美国就通过农业市场法案授权规定,凡享受政府补贴的农民和农业生产者,都有义务无偿向政府提供农产品产销信息,如果提供的数据信息失真,将影响他们的信誉甚至补贴;科研项目的数据应强制性向国家相关部门或机构提交,应先提交再结题,确保农业科研数据最大限度地采集。

此外,还需进一步规范数据的采集程序、内容和方法标准。美国从农业数据资源采集到发布均实行立法管理,有着整套规范的体系,并不断完善,可供借鉴参考。

3.2 规范数据分析审核,培养农业数据科学家

数据的分析审核要围绕技术升级、人才培养和健全管理体制来进行,三方面缺一不可。

更新、升级数据库管理软件,提高数据质量分析和逻辑审核功能,摆脱目前过于依赖人工分析和审核的局面。

借鉴其他行业的先进经验,像金融、证券、电商等,培养既懂技术又懂业务的农业数据科学家和数据团队,建立人才储备机制。现实的情况是懂农业的不懂数据管理,懂数据管理的不懂农业,要将两方面都结合起来,只有通过不断地进行系统培训,把计算机技术同农学、数学、统计学等结合起来,并形成常态化培训机制,注重团队的合理分工和人才结构配置,才能培养打造精英农业数据团队,还要建立人才激励机制,提高平台管理人员的待遇、福利,提供良好的职业前景,确保人才队伍的稳定。

整合、补充、完善现有的农业元数据标准体系。根据国家科技平台标准化体系建设要求,将现有零散、不完善的农业元数据标准加以整合、补充完善,形成一套科学系统的农业元数据标准体系,规范数据的描述、分析、审核标准。

3.3 创新服务模式,建立服务体系

要把过去侧重数据的获得和共享延伸至数据的分析和预测,充分挖掘和发挥农业科研数据的价值。

创新数据服务模式,建立数据服务体系。突破原来服务对象和模式单一的局面,开展多层次的数据服务,构成全方位的服务体系:主动参与国家科技计划和重大科研项目,体现数据对国家重要项目的支撑;加大数据的推送力度和广度,推进数据服务进高校、进院所、进农企、进农村;数据服务更加积极主动,加大农业科研数据服务“三农”的力度,多走访、调研农户的服务需求,根据需求有针对性地策划开展专题数据服务;增强与涉农企业和政府部门的合作,运用先进知识服务模式来支撑农业产业战略决策和战略执行,帮助涉农企业把握新形势下发展方向和战略重点,帮助政府决策部门提供智力支持,注重数据信息的评估和反馈工作,调查数据的利用效率,为今后数据的收集提供参考方向。

3.4 对平台发展进行战略策划,加大投入力度

农业科技平台的建设和管理是项艰巨复杂的系统工程,需要财力、人力、技术,以及国家层面的政策、法律、法规的大力支撑。加大农业信息化建设的力度,整个农业信息化建设水平决定了农业科技平台的发展水平。

加大经费的投入。整合现有的各级农业科技平台,避免铺大摊子、重复建设、同质化发展,走精品化路线,这样可集中力量支持有影响力的农业科技平台,在现有支持经费的基础上追加投入。放宽现有的科研经费开支的限制,规范合理科研经费开支,解决“花钱难”的问题,避免搞“一刀切”严重损害科研人员的积极性,对平台长远的发展形成制约。

加大人力的投入。根据平台发展的需要,合理配备知识结构相匹配的专职科研人员进行管理。

加大技术的投入。借鉴其他先进行业经验和发达国家的经验,加大技术的投入,在PB、EB级的大规模数据储存技术、关联数据技术、数据传感网络的建设、数据分析模型的构建、数据的价值萃取技术等方面取得突破。

大数据传输的核心和要害问题是传输的“时效性”和“完整性”[4],大力发展农业遥感数据获取和传感网络建设,实现数据的实时记录和采集。

增强对外交流,特别是与国际先进平台之间的学术交流,扩大视野,学习借鉴国外先进平台的经验,跟国际先进农业科技平台的发展水平接轨。

[1]李道亮.中国农村信息化阶段化发展战略 [J].中国信息界,2007(23):37-43.

[2]李瑾,崔利国.我国农业信息化发展阶段研究 [J].广东农业科学,2014(20):227-232.

[3]蔡彦虹,刘平,李仕宝.我国农业科研机构科技条件平台建设的作用与效果分析 [J].农业科技管理,2012,31(4):18-21.

[4]王成红,陈伟能,张军,等.大数据技术与应用中的挑战性科学问题 [J].中国科学基金,2014(2):92-97.

[5]张先恩.国家科学数据共享工程 [J].科学中国人,2004(9):11-13.

[6]李建萍,刘建安.加强农业科技条件平台建设的实践与思考[J].农业科技管理,2008,27(5):48-50.

[7]郑小六,李英杰.对省级重点实验室管理的几点建议——以河北省农林科学院为例 [J].河北农业科学,2009,13(7):137-138.

[8]刘志远,吕拓,唐守伟,等.我国农业科研院所科技平台管理存在的问题及对策研究 [J].农业科技管理,2013(5):51-63.

[9]刘润达,赵辉,李大玲.科学数据共享平台之数据联盟模式初探 [J].中国基础科学,2010(6):27-31.

猜你喜欢

数据服务科学科技
地理空间大数据服务自然资源调查监测的方向分析
科学大爆炸
科技助我来看云
科技在线
如何运用税收大数据服务供给侧结构性改革
科学
基于频繁子图挖掘的数据服务Mashup推荐
科技在线
科技在线
科学拔牙