APP下载

地理信息科学专业R 语言实践教学探索

2021-07-29熊立伟刘芬良

科技视界 2021年19期
关键词:空间数据可视化函数

席 振 熊立伟 刘芬良

(湖南城市学院市政与测绘工程学院,湖南 益阳 413000)

0 引言

与起源于贝尔实验室的S 语言相似,R 是一种统计计算和绘图的语言和环境。 R 有很多独有的特征:完全免费,制图功能十分强大,囊括了其他软件所不可用的、与时俱进的统计计算程序[1]。 在很多高等院校多种专业都开设了R 语言相关的课程。

1 地理信息科学专业设置《R 语言》的意义

地理信息科学专业旨在培养学生适应信息时代发展和“互联网+”社会需求,掌握宽厚的地理信息科学与地图学的基本理论、基本知识和基本技术。 具备数据采集、编辑、处理和分析以及地理信息系统应用开发能力,能在城市规划、国土资源以及测绘和地理信息行业的企事业单位和政府相关部门从事数据采集、处理、分析以及应用开发等工作。

R 语言在以下3 个方面与地理信息科学专业紧密关联:基于地理位置的可视化;空间统计分析;大数据与机器学习。 机器学习是研究计算机模拟或实现人类的学习行为,以获取新的知识和技能,重新组织已有的知识结构不断改善自身性能。 设计多学科知识,如统计学、概率论、算法复杂度理论等,是当前和今后一段时间持续的一个研究热点。 R 语言中的机器学习函数包从古典的判别分析、 贝叶斯方法到神经网络、深度学习等,覆盖全面,更新以周为单位。 在地理信息科学中,对空间数据的分析、模拟和再现是地理信息科学重要的一环。 当前,GIS 自我学习的能力还不足,自我检验与验证是各类地学数据分析的重要研究内容之一。 基于机器学习的空间数据分析技术与应用包含数据的建模与分析、空间优化、智能主体模拟等,可以充分地与R 语言中机器学习算法函数包相结合,以提高效率,提高精度[2-3]。

2 实践教学过程中存在的问题

目前地理信息科学专业的《R 语言》课程主要基于数据挖掘的方向进行课程设计,实践内容以R 的基础入门、基础数据处理、数据分析建模为主,数据模型实践课程包括回归分析、聚类分析以及基础数据可视化。 实践教学中主要存3 个问题:(1)基础统计分析方法实践内容设置较多。 (2)数据分析模型所用数据及函数包存在滞后性,R 中函数扩展包的更新是以周为单位,每次更新会有新的函数包加入,也会有部分函数包剔除出R 的官方扩展库中。R 的版本更新较为频繁,函数包在R 更新过程中,如果函数包作者维护不及时会出现函数包在新版本R 中无法加载使用的情况,需要安装并转换不同版本的R 软件,需要及时更新R 的扩展函数包。 如实践课程可视化的课程设置中,交互式地图的函数包leafletR 是由Christian Graul等人开发和维护的leaflets 的R 语言接口, 其提供基本的在线地图 (如 Google Map、OpenStreetMap) 可视化,支持瓦片地图、矢量数据、GeoJSON 等数据的地图交互式操作,是与地理信息科学专业结合很重要的一个函数包,但随着R 版本的更新,leafletR 与leaflets 加载发生冲突,可视化中函数已无法使用,亟须作者对这两个函数包进行合并、修改并发布出来[4]。 (3)缺少地理信息科学专业的实验数据和内容。 如对空间数据在R 中的数据结构与空间可视化、与WebGIS 结合的交互式空间数据表达、空间数据探索性分析等内容均没有教好的数据支撑实践课程设置。

3 实践教学内容探索

GIS 专业设置的《R 语言》课程中理论内容包括基础可视化与空间数据表达、 空间数据处理与分析、简单的大数据挖掘模型。 围绕这4 块内容,16 个课时的实践课程设置为:数据结构与基础编程语法(2 课时);基础数据读写与数据处理(2 课时);统计数据可视化(2 课时)。与GIS 专业紧密结合的实践课程设计:空间数据结构与数据分析(2 课时);空间数据可视化与交互式可视化(2 课时);线性回归与空间数据探索性分析(2 课时);选址与预测综合分析(4 课时)。

其中,空间数据结构与分析,以常用的矢量数据空间分析为主,如缓冲区分析、叠置分析等。 以函数包sp 和 rgeos 为主,sp 定义空间数据在 R 中的基本结构,rgeos 提供大量空间分析的函数, 基本涵盖Arcgis软件中空间分析的绝大部分功能。

空间数据交互式可视化中结合在线地图,利用R在地图可视化方面大量优秀的函数包进行可视化。 如GISTools 包提供多个常用的地图制图和空间数据处理工具, 具有完善的综合制图功能。 recharts 包是基于Echarts 接口的交互式可视化二次开发地图可视化包。leaflet 包提供基本的在线地图 (如 Google Map、OpenStreetMap)可视化功能,支持地图的交互式操作,支持不同来源地学信息的叠加可视化。

空间数据探索性分析实践包括空间自相关和地理加权回归模型,是课程的特色内容。 R 作为专业的统计软件,在数据分析中,可以快速一键式的完成定性分析到定量分析。 空间地学数据除了具有一般数据的数学特征外, 还具有空间地理特征的属性,R 语言有许多可以一键式快速分析空间数据的空间统计分析函数工具包。 另外,R 语言由于语言的特性,对处理数据的规模大小不敏感,这是显著优于其他的空间统计软件。如spdep 是空间决定性工具包,包括空间权重矩阵计算、空间自相关分析、空间滤波模型等空间统计分析数据,功能十分强大。 GWmodel 包是空间关系异质性地理加权技术函数包,囊括了地理加权相关的回归、主成分分析、汇总统计、判别分析等地理加权建模技术,是当前地理学中研究热点和研究难点之一[4]。

四个课时的选址选择与预测综合分析根据不同学期提出不同的实验内容。 相同的是都尽量引导学生接触较新的相关算法, 紧随人工智能技术的发展现状。 相关算法可能当前在地理学中的应用不多,成功的案例相对难以寻找,指导教师可以通过阅读查找多本教材及参考文献,总结一些最新的应用案例,与经典算法相互比较, 将这些内容融入R 语言实践教学中。 如在林业数据信息的深度挖掘分析中,深度学习算法自主学习多元高维复杂数据执行分类、预测和模式识别等任务中如何发挥作用[5]。 如在当前使用频率较高的Sentinel-2 号数据中, 对影像数据进行土地利用分类识别,可以使用面向对象结合随机森林模型的方法提高识别准确率与效率。 因此,指导教师需要时刻关注新算法在地理信息科学中的使用动态,总结最新的内容并将其融入R 语言实践中,提升学生今后在工作中自主学习的能力。

4 结语

基于R 语言在统计学、可视化及强大的扩展性方面的性能,在地理信息科学专业开设R 语言的课程十分必要。 我校从2019 年在地理信息科学专业开设R语言课程,一直在探索中对这门课程的讲授内容与实践内容进行改革,教学内容以引导性为主,启发学生利用R 语言解决地理空间大数据方面的问题,引导学生从不同方向跟随自己的兴趣对R 语言进行探索。为锻炼本科学生使用R 语言动手解决地理信息科学中所遇到的实际问题的能力, 提高本科教育教学质量,本文针对GIS 专业《R 语言》教学内容,着力增加与空间数据处理有关的实践课程内容,并设置一定的新型算法实践内容, 添加空间数据与机器学习相结合实践,有效解决地理信息科学专业背景下《R 语言》课程脱离专业实际存在的问题。

猜你喜欢

空间数据可视化函数
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
二次函数
二次函数
函数备考精讲
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
元数据驱动的多中心空间数据同步方法研究
基于文件系统的分布式海量空间数据高效存储与组织研究
客户端空间数据缓存策略