农业大数据研究中心的建设、研究与实践
2015-11-25宋长青牟少敏赵秀艳
宋长青 牟少敏 周 虎 赵秀艳 路 峰
山东农业大学 山东泰安 271018
农业大数据研究中心的建设、研究与实践
宋长青 牟少敏 周 虎 赵秀艳 路 峰
山东农业大学 山东泰安 271018
2013年是我国大数据元年,大数据相关研究日益受到企业、政府、高校、科研院所的广泛重视。许多高校设置了数据科学专业,着力培养数据科学方面的专业人才,同时设立专门机构,开展大数据方面的研究工作。我国是一个农业大国,无论是种植业,还是养殖业,无论是农业的产前、产中,还是产后等诸环节及其相关要素,都产生了相当可观的数据。如何建立一种机制,搭建一种平台,借助大数据的研究手段和方法,使已有的农业历史数据和正在发生的现实数据“活起来”,发现其内在产生的规律,预测发展趋势,在指导生产中产生价值,值得研究与探索。
农业大数据实践;中心建设;研究
关于大数据研究,发达国家已启动大数据布局,跨国IT企业先后进入大数据领域,大数据技术发展迅猛,数据科学研究不断壮大。2012年3月,美国政府发布《大数据研究和发展倡议》,投资2亿美元发展大数据,用以强化国土安全、转变教育学习模式、加速科学和工程领域的创新速度与水平;2012年7月,日本提出以电子政务、电子医疗、防灾等为中心制定新ICT(信息通讯技术)战略,重点关注大数据研究和应用;2013年1月,英国政府宣布将在对地观测、医疗卫生等大数据和节能计算机技术方面投资1.89亿英镑。
在我国,政府和科研机构开始高度关注大数据,数据价值链和产业链初见端倪,数据产业园区建设逐步展开。2013年科技部将大数据列入“973计划”(国家重点基础研究发展计划),在2013年度国家自然基金指南中,管理学部、信息学部和数理学部将大数据列入其中。从2012年开始,广东、重庆、上海、贵州等省市先后启动并实施了大数据战略工作方案;此外,中国科学院、复旦大学等高校和科研单位相继成立了从事数据科学研究的专门机构。
我校较早地认识到大数据对现代农业发展带来的机遇和挑战,于2013年5月成立山东农业大学农业大数据研究中心,研究制定农业大数据发展规划,开展农业大数据的建设和研究工作。现就农业大数据研究中心的建设、研究与实践做一探讨,以期推动农业大数据事业的健康发展。
1 农业大数据研究中心建设
1.1 成立“农业大数据产业技术创新战略联盟”
2013年6月由我校牵头,联合政府、高校、科研单位和企业等23家单位,成立了国内第一个农业大数据研究和应用推广机构——“农业大数据产业技术创新战略联盟”。联盟成员单位依托自身的资源优势,以社会需求为导向,坚持面向市场、平等互利、优势互补、资源共享、合作共赢的原则,促进产业共性技术的研发与应用,建立多样化、多层次的自主研发与开放并存的创新模式,构建政、产、学、研、用相结合的技术创新和服务体系。联盟成员单位通过加强对农业相关信息采集、分析、挖掘,为政府决策、产业发展提供更多的服务和支持,实现了农业大数据研究与应用无缝结合。
1.2 组建农业大数据研究中心
2013年5月,我校组建了“山东农业大学农业大数据研究中心”,集成校内多学科和专业领域的教师组建了协同创新研究团队,引进了大数据技术,聘请了生物信息技术留美博士,健全研究队伍结构,联合联盟成员单位,针对粮食安全、食品安全、农产品价格趋势、新农村建设等重大问题,进行协同攻关。同时投资500余万元,建成了涉农的11个数据库和数据平台;购置了高性能服务器和分析软件,搭建了50 TB的云计算平台,为研究人员进行数据存储、数据运算等提供保障条件。农业大数据研究需要采集影响农作物生长相关的若干因子,为保障数据来源的准确性、可靠性、科学性,与地方政府合作,在研究的核心示范区建立了3个田间数据采集定位站,采取物联网自动采集、历史数据收集和人工采集相结合等方式,采集田间数据,用于分析指导农业生产。目前,已结合多个课题研究,在项目区规划布设物联网采集点200余个,实时采集田间影响农作物生长的关键因子数据,结合化验分析等方法,对课题研究的27个示范点的苗情、土壤、气象、土地分级等数据进行了、收集采集,为相关课题研究提供了宝贵的第一手数据资料,为精准指导农业生产发挥了重要作用。
2 农业大数据研究中心的管理与运行
2.1 做好中心顶层管理设计
中心实行学校领导小组领导下的主任负责制。“中心”依托学校,归口科技处管理,相对独立运行。中心主任负责拟定中心发展建设规划,协调各方面资源及宏观管理工作,定期召开主任会和主任联席会讨论决定重大事项;常务副主任主持中心的日常工作,负责中心的管理工作和内外协调工作。
2.2 建立平台开放运行管理机制
中心是学校开展农业大数据研究的平台,面向全校开放,实行“机构开放、人员流动、学术自由”的管理机制。研究人员自愿提出申请,由科技处和中心研究审核,并经专家(含农业大数据产业技术创新战略联盟专家技术委员会成员)论证后择优选择相关人员进入“中心”开展科研工作。进入中心工作的科研人员必须遵守有关数据保密协议和中心有关管理规定。
2.3 建立中心运行驱动机制
中心实行科研项目驱动机制,以项目研究促进中心的建设与发展。实行科研项目首席专家负责制,根据项目需要成立由数据平台建立、数据采集分析、数据模型分析、发展规划建议等科研团队,负责项目的申报、研究与实施。建立“以项目养中心、促发展”的良性循环机制,按照《山东农业大学农业大数据研究中心科研与服务管理办法》的有关经费管理规定执行。
2.4 做好中心日常运行管理
中心设立主任办公会议事制度,并使之常态化。中心主任负责定期召开主任办公会,吸收相关人员参加。落实学校领导小组的相关决策部署;研究中心科研攻关的重大事宜;督促调度检查科研项目进展情况;研究提交中心落实的有关事项等。
3 农业大数据研究中心建设成效
3.1 开展农业大数据研究与应用
一年来,中心承担省级科研项目5项,到位资金460万元;自筹资金50多万元,开展农业大数据研究自选项目23项,涉及农学、资源环境、植保、园艺、畜牧等多个学科;申报山东省农业重大应用专项2项,各150万元;发表论文20余篇;获得软件著作权5件。
“基于大数据的科技投入贡献度分析研究”项目借助大数据研究手段,研究高新区构建创新型园区的动态监测平台及其关键技术。通过数据挖掘,找出科技投入与经济增长的关联关系,生成评价贡献度的指标体系,为高新区引进企业、评价企业、企业投入、产业布局等提供决策支持。该项目研究成果已获得国家专利,分析平台建设将在规模较大的国家级高新技术示范园区进行滚动研究,待研究成果成熟后,面向山东乃至全国高新区进行推广应用。
“渤海粮仓增产增效的大数据支撑研究”课题利用大数据手段和方法对山东项目区27个示范点的苗情、土壤、病虫害、气象等数据进行了处理分析,取得了初步成果,提出了指导农业生产的意见和建议。在进行该项目研究的同时,为解决粮食生产田间数据实时采集等问题,山东省科技厅立项基于物联网的数据采集布设方案和大数据平台建设取得重大成效,建立的“渤海粮仓科技示范工程大数据平台”有效地指导项目区的农业生产,促进了粮食的增产增效,受到国家有关部委的高度重视与支持。
“基于大数据的山东省小麦、玉米主要虫害特征数据采集与预警平台建设”项目,得到了联盟成员单位农业厅植保总站以及各试点地市农业局数据资源的有力支持。数据正在挖掘分析建模中,相信通过主要农作物的虫害历史数据、现实数据的分析,预判虫害发生的规律与趋势,将对有效地抵御与降低因虫害发生影响农作物产量,实现对虫害的短期、中期及长期监测预警,为相关虫害的治理提供科学依据。
“山东西部隆起带主要粮食作物的数据采集、共享机制以及示范工程”项目,课题组成员分别到济宁邹城、枣庄滕州、泰安东平、聊城阳谷、临沂莒南5个县市的农业局开展了调研,走访了一批农业合作社、农场和种粮大户,收集了大量数据。基于大数据技术对该区域内的主要粮食作物的数据,通过采集、整合、分析、挖掘,建立针对农业技术人员和农业生产者应用的数据发布、共享平台。
3.2 加强学术交流与合作研究
一年来,中心邀请国内外专家来校开展学术交流二十多次,同时派出青年教师参加学术会议二十多次,并组织到有关高校与院所进行考察学习。其中与复旦大学、台湾铭传大学、中关村大数据产业联盟签署了战略合作框架协议。先后与复旦大学、上海市数据科学重点实验室、台湾铭传大学、无棣县人民政府等政府、高校和科研院所签署了联合培养硕士研究生、短期培训青年教师、联合申报课题、数据综合采集试验站等框架协议。在山东龙口市联合举办了“农业大数据论坛”,与会专家以及科技部、农业部、国家基金委、国土资源部等相关部委,就今后农业大数据的发展达成了“龙口共识”。
3.3 农业大数据研究的相关问题初步探讨
3.3.1 数据价值评估与分类
鉴于农业大数据是一个宽泛的领域,涉及农业的若干方面,其价值评估主要从活性、颗粒度、关联性、多维度、规模五个方面进行。活性依据不同作物来制定,如小麦数据频率为一个月,玉米为半个月;颗粒度一般细化到社区或乡镇,对示范区细化到合作社、公司或农户;多维度为作物生长期的关键节点、影响生长的环境因素、地力条件、人为干预等。就数据分类而言,在农业大数据平台基础上,建立若干数据库,进行分类管理,通过云平台实现数据资源共享。
3.3.2 数据的采集、存储、挖掘、应用
数据采集,利用4种手段进行:一是利用各类人脉资源,到相关的厅局、县市采集历史数据;二是到科研涉及的试验点进行人工采集、汇聚;三是利用物联网设备在相关试验站进行实时数据的采集;四是动用学校各学科的科研力量,对采集的科研数据进行汇聚。
学校投资,购置服务器,搭建了农业大数据云平台,对科研用的数据进行分类管理、存储;教师拥有的服务器、数据库也可以托管到学校网络中心进行专门存储与应用。
数据挖掘与应用,根据各个课题的需求与应用,学校提供平台,个性化的分析软件由课题主持人自行确定,分析结果,数据呈现,应用服务,通过数据平台统一审核,通过多种媒体手段适时发布,及时提供决策,指导农业生产。
3.3.3 农业大数据云基础平台架构
4 中心建设、研究存在的共性问题
农业大数据研究在我校刚刚起步,联盟也仅成立一年。因此,无论从研究的顶层设计、研究的理念、研究的知识储备,还是研究的手段、方法等方面都需要不断地补充、完善、提高。存在的问题主要表现在以下几方面。一是农业大数据采集的数据量不足,采集的途径不畅,政府、企事业单位、科研院所信息“孤岛”现象普遍存在,这给研究工作造成很大困难;二是农业大数据平台建设不完善,农业大数据资源的汇聚、整合、共享不足,数据标准不统一;三是专门从事数据科学与应用研究的人才紧缺,大数据人才的招募、培养、使用是农业大数据研究面临的最大挑战;四是研究平台建设和农业大数据研究经费比较紧张,需要进一步拓宽筹资渠道;五是对农业大数据在农业产业发展、决策、服务方面的作用认识、宣传等不到位。因此,今后必须采取针对性措施,疏通数据资源采集渠道,建立数据资源共享机制,加大人才引进和资金筹措力度,提高思想认识,推动农业大数据的研究与创新,为农业经济发展服务。
5 中心今后建设、发展的对策
发展思路:以山东农业大数据建设为基础,以“渤海粮仓科技示范工程建设”的大数据应用为突破点,开展农业大数据建设、研究和应用工作,探索大数据时代的现代农业发展,针对国家粮食安全、食品安全、新农村建设等重点、难点、热点问题,开展联合攻关研究,为政府当好参谋和智库,为区域经济建设服务。
5.1 加快农业大数据研究步伐
联合农业大数据的研究力量,加快研究步伐,具体是:整合联盟成员单位的数据资源和人才资源,联合山东大数据力量,开展协同研究;定期交流研讨农业大数据学术问题、技术问题和应用问题;落实与复旦大学上海市数据科学重点实验室、上海市大数据产业技术战略联盟、中关村大数据产业技术战略联盟、郑州商品期货交易所的战略合作。
5.2 加强农业大数据平台建设
在农业大数据产业技术创新战略联盟、农业大数据研究中心、上海市数据科学重点实验室的基础上,建设山东省农业大数据中心,联合申报国家级农业大数据研究和应用机构,逐步建设成国家级的大数据平台,为政府决策、企业生产、科学研究提供更全面、更准确、更科学、更有效地服务。
5.3 加速农业大数据产业应用
申报筹建中国农业大数据产业技术创新战略联盟,在政、产、学、研、用之间建立起农业大数据应用的机制,发挥农业大数据在农业政策制定、农产品生产和流通方面的作用,并促进现代农业发展。
[1] 温孚江.农业大数据研究的战略意义与协同机制[J].高等农业教育,2013(11):3-5.
[2] 赵国栋.大数据时代的历史机遇[M].北京:清华大学出版社,2013.
[3] 维克托·迈尔·舍恩伯格.大数据时代[M].杭州:浙江人民出版社,2013.
[4] 李新玲. 大数据2014年面临几道关[N].中国青年报,2014-01-02.
[5] 周一平.为农业现代化插上科技翅膀[N].中国科学报,2014-02-24.
Research on the Construction of Agricultural Research Center, Large Data and Practice
Song Changqing, Mu Shaomin, Zhou Hu, Zhao Xiuyan, Lu Feng
Shandong Agricultural University, Tai'an, 271018, China
2013 is the first year of large data in China, the research about big datahas received more and more attention of government, enterprises, universities,scientific research institutes. Many colleges and universities set up professionalfocus on the cultivation of scientific data, data science professionals, at the same time, the establishment of specialized agencies, to carry out research work oflarge data aspects. China is a large agricultural country, whether it is farming, oraquaculture, both the agricultural production in the prenatal postpartum, or other various links and factors, have produced considerable data. How to build a mechanism, build a platform, with the aid of the research means and method for large data, make agricultural history data and the ongoing reality data "live it up" to find out the inherent law of produce,predict the development trend, have a value in guiding production, worthy of study and exploration.
practice of agricultural large data; center construction; research
2014-09-22
宋长青,硕士,高级实验师,副主任。