大数据时代林业研究进展
2017-01-03董茜
董茜
[提要] 随着大数据时代的来临,数据的处理必将对林业的经营管理及研究产生重大而深远的影响。本文在对大数据分析基础上,分析国内外在大数据背景下的林业研究进展,分析目前国内林业相关大数据,并指出大数据分析在林业运用上的问题。
关键词:大数据;林业;研究进展
中图分类号:F32 文献标识码:A
原标题:试谈大数据时代下的林业研究进展
收录日期:2016年11月9日
以2013年8月“第三届全国林业信息化工作会议”召开和《中国智慧林业发展指导意见》发布为标志,中国林业信息化由数字林业跨入智慧林业的新阶段。智慧林业的实现,必将带来林业生产力的又一次深刻变革,林业信息化也将迎来一个新的大数据时代。大数据具有数据量大、处理速度快、数据类型多、结构复杂、价值大、精度高的六大特征。近年来,随着大数据时代的来临,就如何合理运用大数据也将成为林业研究的热门主题。
一、什么是大数据
大数据是由数据量巨大、结构复杂、类型众多数据构成的数据基于云极端的数据处理与应用模式,通过数据的整合共享,交叉服用形成的智力资源和知识服务能力。通常要处理的数据量太大,增长太快,而业务需求和竞争压力对数据处理的实时性、有效性又提出了更高要求,传统的常规技术手段无法应付。互联网数据中心(Internet Data Center)简称IDC定义了大数据的四大特征:海量的数据规模、快速的数据流转和攻台的数据体系、多样的数据类型、巨大的数据价值。维克托·迈尔·舍恩伯格提出:“大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。”
二、国内外林业研究进展
(一)国内研究进展。第七次全国森林资源清查暴露的问题令人警惕,清查五年间隔期内,林地转为非林地的面积数字有所上升,形势十分严峻,但这些逆转的林地主要发生在哪些地区?数据大、复杂性是林业各个岗位上难以完成的严峻工作。但《全国林地保护利用规划纲要(2010-2020年)》提出了大数据分析应用于林业生态统计,是林业有史以来可及时动态监测、及时决策的最全面、最细致、最先进的一项措施。大数据统计了全国林地,归类成为了一张简单的分布地图,是高分辨率的遥感影像,全国林地落界数据、二类调查资料,基础地理信息等多源数据集合,以林地界线为核心内容,构建的全国统一的林地资源管理系统。为国家林业局各业务司局提供数据支撑服务,将推进在森林经营、工程建设、森林防火等业务上的应用提供了便利。
以2013年8月“第三届全国林业信息化工作会议”召开和《中国智慧林业发展指导意见》发布为标志,中国林业信息化由数字林业跨入智慧林业的新阶段。
2014年郭建斌等在大数据深入分析的基础上,指出了大数据时代林业科普信息化的现状及不足,探索性地提出了林业科普信息化发展的对策与建议。郭建斌等认为面对大数据时代科普工作发展的趋势,林业科普应以在全社会范围内组织建设新型科技传播与交流渠道为发展方向,建立基于信息技术不同形态的科技信息传播与交流平台,开发公众渗透度高的科普渠道,加大民生科普、应急科普的传播渠道建设力度,丰富大数据时代背景下的科普内容,加大科普信息辐射的强度和广度,提高科普宣传能力。
2015年6月蓝学、韦绪、覃德文等基于大数据发展动态,大数据的性质和趋势、林业部门的大数据应用三个方面,对大数据、云计算、物联网等进行系统讲解,深入分析当前信息化前沿技术的发展现状与趋势,结合生态林业民生林业的建设目标,阐述如何利用大数据为林业现代化服务。蓝学等认为林业资源大数据分析的理论核心就是数据挖掘算法,各种林业资源数据挖掘的算法基于不同的物种数据类型和格式才能更加科学地呈现出数据本身具备的特点。也正是因为林业资源变更数据被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,才能体现大数据分析的便利。
(二)国外研究进展。近年来,由于生成大量的数据以及存储数据的巨大增量,大数据的应用日益成为国外人们关注的焦点。美国联邦政府、麦肯锡全球研究院和各大信息技术企业等纷纷发布有关大数据的倡议、计划和报告,将大数据推到前所未有的高度。2012年2月《纽约》提出,“大数据”时代已经降临,未来在商业及其他领域中,我们将基于数据和分析,而非经验和直觉做出决策决策。
Del Río和Sara分析了几种用于处理不平衡数据集的方法,在大数据的背景下,使用随机森林分类的性能。通过采样,采样已经适应了使用Map Reduce,使这些技术的大数据能够管理数据集,并且正确识别不同类别。进行了实验研究,评估不同的算法的性能。
同时,国外在森林资源共享、大数据应用方面已经建立了比较完善的机制,共享的数据资源也非常丰富。数据共享对林业科技发展的作用已十分明显。
三、我国林业相关大数据
大数据处理需要建立数据库,就我国林业而言,需要的数据库包括:林业档案、林业年鉴、自然资源和地理空间数据库、林业发展报告库,等等。中国林业数字图书馆的建立,为中国林业大数据研究创建了条件。中国林业数字图书馆依托国家林业局内外网平台建设,将为林业行业提供丰富的图书、期刊、论文等信息资源。而中国国家卫星林业遥感数据应用平台也为中国林业大数据的研究做出了贡献。作为林业行业提供遥感基础数据、数据处理平台、数据产品发布平台将大幅提高林业遥感应用水平。
四、大数据在林业上的应用
大数据在林业上的应用,目前主要的问题就是数据的提取,其理论核心为数据的挖掘。各种林业资源数据挖掘的算法基于不同的物种数据类型和格式才能更加科学地呈现出数据本身具备的特点,也正是因为林业资源变更数据被全世界统计学家所公认的各种统计方法才能深入数据内部,才能体现大数据分析的便利。第一部分是大数据林业内涵与重要意义,包括大数据林业内涵特征、产生背景、关系分析、关键技术、新观念分析;第二部分是大数据林业总体发展思路,包括大数据林业战略定位、基本思路、基本原则、建设目标、总体架构;第三部分是大数据林业的主要任务与重点工程,包括加快建设大数据林业立体感知体系、大力提升智大数据林业管理协同水平、有效构建大数据林业生态价值体系、全面完善大数据林业民生服务体系、大力构建大数据林业标准及综合管理体系;第四部分是大数据林业推进策略,包括大数据林业推进路线图、保障措施。要进行大数据的新题提取,必须具备单个方面的内容:(1)理论。理论是认知的必经途径,也是被广泛认同和传播的基线。从大数据的特征定义理解林业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。(2)技术。技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。(3)实践。实践是大数据的最终价值体现。我将分别从互联网的大数据、政府的大数据、企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
数据化是大数据的基础。在生态林业资源动态变化中,数字化和数据化大相径庭。“数字化”指的是将生态林业资源变动中产生的信息、森林演替所产生的资源或环境变化的轨迹转换成电子数据存入数据库的过程;而“数据化”则是指在数字化的基础上,利用数据来对森林变更进行描述,使之能同时被人和计算机所理解的结果。生态林业资源信息大量数据来自于不同来源、数量庞大的结构化与非结构化数据群,大部分都不能直接用于预测和分析。而通过对数据有效的组织,能将大量来自不同源的异构数据量化组合,形成森林资源数据化、森林类别数据化、生态资源使用量的数据化、森林属性数据化等在信息化服务中管理者比较关心的数据化形式。数据化是将数据从无序到有序的加工阶段,数据化的最终成果是将森林数据对象属性量化,构建数据挖掘和服务的基本对象,简化数据分析和利用过程。
五、大数据在林业运用上的特点
大数据分析要求林业工作人员在进行研究的过程中,改变思路,同时改变对数据来源的态度。相比之前的数据研究工作,大数据的主要特点是数据量大、数据种类繁多,这给林业工作人员带来很多困扰,要求林业工作人员在繁杂的数据中,准确找到适合的可用数据。同时,在大数据分析时,主要研究数据之间的规律,从大量数据中找到能够提取的信息,在提取过程中,经常会出现不精确数据,要求林业工作者及时摈弃数据或者在可接受范围内允许少量的不精确数据出现。在多数情况下,数据来源于网络。在大数据分析时,明确数据来源,分析数据的可靠性,就数据的相关性进行分析,而不是研究数据产生的原因。研究人员可以收集和分析大量相关数据的信息,找出可能有助于预测未来事件发生的规律。
中国林业大数据处理需要建立完整的数据库整合和新建了林业政策法规库、历年统计数据库、林业年鉴库、林业发展报告库、自然资源和地理空间库、林业档案库等多个专题数据库,内容丰富、查询便捷,是信息化服务林业的又一重要成果。中国林业数字图书馆依托国家林业局内外网平台建设,将为林业行业提供丰富的图书、期刊、论文等信息资源,为林业职工和广大公众提供更好的服务。国家卫星林业遥感数据应用平台作为林业行业提供遥感基础数据、数据处理平台、数据产品发布平台将大幅提高林业遥感应用水平。林业综合办公系统群将把国家林业局机关和直属单位纳入统一的办公平台中,真正实现办公一体化。
六、展望
在研究过程中,大数据作为一种资源也作为一种工具。他可以预测未来可能会发生的事情,但就对已经发生的事情没有进行解释,需要研究人员进一步分析。我们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳这种技术。大数据在林业上的研究,就是林业在数字林业的基础上,运用大数据、云计算、互联网等信息技术,使林业实现智慧感知、智慧管理、智慧服务。通过大数据林业建设,形成信息基础条件国际领先、生态管理与民生服务质量明显提高、林业产业结构与创新能力优化发展的现代化模式。
主要参考文献:
[1]李世东.大数据时代中国智慧林业门户网站建设[J].电子政务,2014.3.
[2]覃德文,云朝光,秦武明等.PCR技术发展状况研究[J].林业实用技术,2013.6.
[3]蓝学,韦绪,覃德文.浅谈大数据分析在生态林业上的运用[J].经济研究导刊,2015.6.
[4]郭建斌,秦向华,万志红,李平.大数据时代林业科普信息化发展研究[J].经济师,2014.9.
[5]张婷婷,赵睿涛.大数据对竞争情报研究的影响分析[J].竞争情报,2013.2.
[6]Del Río,Sara.On the use of Map Reduce for imbalanced big data using Random Forest.Information sciences,2014.285.
[7]维克托·迈尔·舍恩伯格.大数据时代:生活、工作与思维的大变革[M].浙江:浙江人民出版社,2013.