园林植物优选系统的应用分析
2018-10-22夏繁茂
夏繁茂
肖钟秀
1 研究背景
进入21世纪以来,信息技术获得了飞速的发展,其在园林中的应用也日益广泛而深入。信息技术的应用涵盖了计算机硬件和软件,网络和通信技术等。数据挖掘技术、物联网技术、云计算技术和大数据分析都是信息技术在目前研究比较活跃的领域。
信息技术在园林上的应用一般集中在以下三大领域:景观的数字模拟、风景园林分析评价和参数化设计、数字景观教育[1]。2007年之前多集中在景观的建模和景观数据的可视化,很少涉及专业的分析。2007年之后,信息化技术与园林的结合逐步向多领域、纵深发展,在景观可视化发展的同时,景观数据的分析逐步深入,从而推动了园林设计逐步向科学化、参数化和数字化方向发展。
景观信息模型(Landscape Information Modeling, LIM)和地理设计(Geodesign)的概念依次提出[2]。这说明在信息技术发展的同时,园林技术的发展也逐步与之融合发展,数字景观技术概念逐渐提出并获得了广泛的认同。数字景观技术是以相关软件为支撑的,园林设计领域一些广为熟知的软件在开始阶段多以单机版的桌面程序呈现,随着互联网技术的发展,也提供了一些网络功能。如WebGIS技术、虚拟现实模拟语言(Virtual Reality Modeling Language,VRML)。一些GIS软件如ArcView、ERDAS Virtual GIS存在生成生成VRML的功能。目前这些网络应用功能是初级的,没有桌面程序的功能强大,一些设计与分析的主要工作,也只能在桌面应用程序中才能完成。但是随着云计算技术的不断发展,基于网络的参数化设计和协同设计办公将成为今后数字景观技术发展的一个方向。如果能将各种计量模型和空间分析模型通过(B/S)的架构加以实现,实现基于网络的园林数据挖掘分析,则是数字景观技术发展的一个美好愿景。
基于网络的园林数据挖掘开发,首先的任务是进行数据的整理、清洗,并组建相应的数据库。该工作涉及内容较多,但都是基础性的,园林植物的数据挖掘便是其中之一。正是在此背景下,本文作者开发出了园林植物的优选系统,进行了初步的尝试。
图1 基于互联网的园林植物优选系统(作者绘)
2 园林植物优选系统的开发
2.1 三级模糊综合评判模型
本模型执行的是三级模糊综合评判。一级评判因素共有36项,二级评判因素分成措施项和生态项2类,三级评判因素分为建植和维护2项,是在二级评判因素上的综合评判。当然这样划分对于数目庞大的园林植物并不能包括维护和建植的全部项目,但基本上涵盖了绝大部分,则皆为对最终评价结果有重要影响的因素。评语集是对评价项目进行评定的词句[3-4],共有4个等级,其一般模式为“好”“临界”“坏”和“较坏”。
2.2 桌面应用程序的开发
选用基于T-SQL语言编写的存储过程来执行模糊综合评判,然后将存储过程放入SQLServer数据库管理系统创建的数据库中,利用Visual C++ 6.0编写程序的界面,在界面中调用存储过程完成模糊综合评判过程。从而基于该模型开发出园林植物的优选系统。
此桌面应用程序虽然运行速度快、计算迅速,但服务范围较窄,需要开发基于网络的云计算平台。
2.3 网络应用程序的开发
将后台数据库改成开源的PostgreSQL数据库,将执行三级模糊综合评判的存储过程用PL/pgSQL语言进行改写。采用传统的JSP+Servlet+JavaBean的开发模式。进而开发出基于互联网的园林植物优选系统(图1)。
3 系统的应用分析
3.1 与等级参数评判法结合的综合评判值计算
由于模糊综合评判时仅利用的最大的bj所对应的评语vj作为评判结果,仅利用了bj(j=1, 2, …, n)中的最大者信息,没有充分利用评语模糊子集B的综合信息,因而反映的结果是不全面的。如节约性评价中,在模糊评价集中的节约性指数、临界节约指数、浪费指数、较浪费指数之中,节约性指数的值大于其他三者,则评语定为“节约”,从而忽略了其他三者带来的信息。因而可以根据实际情况给各种评语(等级)规定某些参数,然后与评判结果B进行加权平均计算,使得评判结果更加符合实际。
具体计算公式如下:
由上述公式计算出园林中常见322种植物的3类指数。
图2 分析变量的相对重要性(作者绘)
3.2 不同分类3种指数的平均值
将园林植物按优选系统分析的便利性分为园林树木、越冬花卉及草坪植物、不越冬花卉及草坪植物3类。应用类别、观赏部位为多项分类变量,是否耐阴、是否大乔、是否常绿皆为二项分类变量,从应用类别及其之后的这几个分类变量皆按园林植物的常用分类方法进行了分类。
利用该系统以济宁地区为基础,对常见的322种园林植物进行节约性指数、生态适应性指数、选择性指数的计算,并求出不同分类模式3种指数的平均值。
3.3 指数差异显著性的T检验
对计算获得的数据按照不同的分类依据进行分析。对于对立特性分类的数据应用R语言中的Rattle包来进行T检验[5],以检测其指数的差异显著性,这些分类包括是否耐阴、是否大乔、是否常绿。
经过分析,对于对立特性的T检验,可以观察到是否大乔的节约性指数差异显著,其余皆不显著,在园林中提高大乔的比例可以提高植物整体的节约性水平,有利于降低植物建植及维护的成本。不耐阴植物的生态适应性指数高于耐阴植物,大乔的生态适应指数也高于非大乔的园林树木。而选择性指数在这3个分类面前皆为显著,因而是否耐阴、是否大乔、是否常绿对于植物的选择比有较强影响。
3.4 指数差异的多重比较
而对于有多个不同特征值的分类则采用SAS中方差分析功能的GLM过程来实现,通过应用Fisher's LSD方法进行不同类型的多重比较,这些分类按照应用类型、分析类型、观赏特点来进行划分。其中应用类型分类包含草坪草、灌木、灌木绿篱、花卉、乔木、藤本和竹类7项;分析类型分类包含花卉及草坪不越冬、花卉及草坪越冬、园林树木3项;观赏特点分类包含草坪、观果、观花、观形、观叶、观枝、色叶、庭荫和枝叶共9项。
对于按不同应用类型、不同观赏特点的分类仅列出类型对比差异显著的项,而其余不显著的项则未列出。
3.4.1 节约指数的差异显著性分析
花卉和竹类、藤本、乔木、灌木绿篱、草坪草、灌木之间在节约性指数方面差异显著。除草坪草之外,花卉的大量应用往往会降低园林植物的节约性指数,从而使园林植物的建植与养护成本增加。
在不同分析类型方面,园林树木、花卉及草坪越冬对比花卉及草坪不越冬的差异显著,因而不越冬的花卉及草坪比较浪费,增加了成本费用,可以考虑多应用一些宿根性花卉及地被植物进行相应的替换。
在不同观赏特点分类方面,枝叶-色叶、枝叶-草坪、枝叶-观花、枝叶-观叶、庭荫-观花皆差异显著,其余皆不显著。基本可以看出观赏价值越高的植物,则成本费用增加越大。
3.4.2 生态适应性指数的差异显著性分析
在不同应用类型分类中可以看出竹类、草坪草生态适应性指数较低,因而园林中如果增加这2类植物的栽种面积或者种类,则需要周密考虑,不应盲目引种,而应该选择生态适应性指数高的相应植物。乔木对比灌木或灌木绿篱,皆差异显著,乔木和后两者相比,生态适应性指数会高一些,生长状况较好,因而适当地增加乔木的比例,尤其是乔灌草复层结构的应用,对提高园林植物的生态适应性指数具有重要意义[6]。不越冬的花卉及草坪植物相比于越冬的花卉及草坪植物或园林树木皆差异显著,因而对于北方园林来说,越冬状况是影响生态适应性指数的重要因素,引种植物必需首先考虑植物的越冬性状况,这是决定植物引种成功与否的关键。
从不同观赏特点分类的比较看出,色叶、草坪、观叶类植物的生态适应性指数较低,而观枝、庭荫、观果、观花的生态适应性指数略高,并相较前几类差异显著。园林植物中的变色、变型等的变异种虽然提高了园林植物的观赏价值,但是以生态适应性指数的降低为代价的,因而在园林中应用应妥善考虑。
3.4.3 选择性指数的差异显著性分析
选择性指数是基于节约性指数和生态应用性指数产生的,在不同应用类型分类方面,乔木-灌木、乔木-草坪草差异显著,乔木相较于后两者,可供选择的程度与范围较大,因而园林中选择灌木、草坪草的难度较选择乔木大,需要考虑的因素较多,因而需要周密考虑。选择性指数在不同分析类型方面皆差异不显著。因而不同分析类型对植物选择性的影响较小。
在不同观赏特点分类方面,观枝、庭荫、枝叶、乔木、花卉、藤本的选择性指数较高,而色叶、草坪、观叶的选择性指数较低,因而在对色叶、草坪、观叶这3类植物选择时需要慎重考虑多方面因素。
4 系统的应用实例
济宁市人民公园建于20世纪新中国成立初期,采用中国古典式园林的设计风格,是济宁市建立时间较早的园林。因位于济宁市中心区,人气较旺,公园利用率较高。该公园曾于2000年进行了改造,将原先位于园内的动物园迁出。由于该公园设计合理,整个公园山水相依,绿树环绕,生态效益、社会效益良好,具有一定的典型性,因而选取该公园作为分析对象。
4.1 计算工具的选取
计算工具选用最新的R语言版本3.4.1,Rattle的版本也升级到5.1.0。
Rattle是一个用于数据挖掘的R语言的图形交互界面(GUI),可用于快捷地处理常见的数据挖掘问题。从数据的整理到模型的评价,Rattle给出了完整的解决方案。Rattle和R平台良好的交互性,又为用户使用R语言解决复杂问题开启了方便之门。
随机森林是一种比较新的机器学习模型,利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终结果[7]。随机森林在运算量没有显著提高的前提下提高了预测精度。随机森林对多元共线性不敏感,结果对缺失数据和非平衡的数据比较稳健,可以很好地预测多达几千个解释变量的作用,被誉为当前最好的算法之一。
随机森林在生物生态、经济金融等多个领域都有应用[8-9]。本实例通过Rattle的Forest按钮实现随机森林建模,它是基于随机森林算法包中的Random Forest函数实现。
4.2 分析变量重要性分析
以322种植物算出的指数为主要输入数据集,应用随机森林算法进行数据建模。建模时假设该公园植物的选择已经非常合理,在322种植物中以济宁市人民公园是否选用作为预测变量,而其余5个分类变量为:观赏部位、应用类别、是否常绿、是否耐阴、是否大乔。3个数字变量为:选择性指数、生态适应性指数、节约性指数。将上述5个分类变量和3个数字变量作为输入变量,后经过随机森林算法执行数据建模分析,得出变量重要性分布图(图2)。
由图可以看出在Mean Decrease Accurac排序中,分类变量中以应用类别、观赏部位较为重要,因而在对济宁人民公园植物的优化选择分析方面这2个变量是优先要考虑的变量。
4.3 模型评估
在计算中不断调整决策树的数量和变量的个数这2个参数,从而使OOB的估计误差率最小化,并逐步稳定在35%左右,从而使随机森林算法进一步调优[10]。
在rattle中执行随机森林算法给出基于OOB(Out Of Bag)的混淆矩阵,其中误差率的OOB估计(OOB estimate of error rate)是35.56%,即它的准确率是64.44%,这个模型基本可以。
4.4 济宁人民公园植物的优化
根据植物配置方式的不同,将济宁人民公园的植物配置类型分为草坪、垂直绿化、灌草、灌木绿篱、花带、花坛、乔草、乔灌草、疏林草坪、密林、水生植物、硬质地面绿化共12类。在此基础上根据植物配置类型及其地形特点将全园划分为82个小区,在ArcGIS中据此绘制植物配置图,然后根据植物的种类输入相应的选择性指数、节约性指数、生态适应性指数,并计算各配置小区的指数均值。在此基础上绘制相应的指数分级地图,颜色越绿表示节约性指数越高,颜色越红表示节约性指数越低,从而在ArcGIS中对各小区的指数高低进行了可视化展现。然后对配置小区相应的指数均值进行降序操作,选取排名后10位的小区,蓝色线圈出的部分为节约性指数排名后10位的小区,需要进行改良。其余生态适应性分级图和选择性分级图的绘制方法与之类似[11]。在图上找出节约性需要优化的小区,对这些需要优化改进的小区进行分析,找出影响节约性指数较大的10种植物如下:彩叶草、矮牵牛、草地早熟禾、万寿菊、百日草、石菖蒲、白车轴草、香樟、重阳木和月季。
在对植物进行优化时,以应用类别作为首先考虑的因素,观赏部位作为第二重要考虑的因素,在此基础上选取节约性指数较高的植物以替换上述节约性指数较低的植物。节约性优化选取的20种植物如下:金边阔叶麦冬、金叶番薯、马蔺、石竹、吉祥草、沿阶草、八宝景天、黄菖蒲、松果菊、紫露草、芦苇、蒲苇、马蹄金、狗牙根、北美枫香、紫叶李、臭椿、杜仲、紫穗槐和迎春。
同理找出影响生态适应性指数较大的10种植物和影响选择性指数较大的10种植物并进行相应的优化。
在植物的替代优化选择上还应考虑植物要符合园林的整体设计风格、各配置小区的设计风格,从而在不降低园林观赏特色的前提下,提升园林植物的节约性指数、生态适应性指数,进而提高选择适合性指数。从而达到园林植物优化的目标。
5 结语
园林植物是园林中有生命的个体,具有植物学属性、成本属性、观赏属性等多种属性。园林中所有植物个体的属性数据的组合就构成了园林植物的大数据。
目前大数据的最初来源多集中在人的行为数据,及基于此的各种传感器数据。因而大数据的应用多集中在一些商业应用领域。但是园林植物的大数据收集并不容易,因而园林植物的大数据应用分析目前只是处于起步阶段。
大数据的分析不同于传统的统计分析领域,但大数据的优势是通过计算机技术,利用机器深度学习,以数据挖掘作为大数据的核心工作,将大量数据进行清洗、加工,挖掘出有价值的部分,用于对决策提供技术支撑[12]。这对今后园林植物的优化配置和选择具有重要意义。
园林植物的设计除了满足植物的生态习性和景观效果外,还应将建植及维护成本最小化,这样才能形成人与自然和谐的系统景观,才能使园林景观具有可持续性[13]。
园林植物优选系统侧重于节约性和生态性的评价,采用随机森林算法计算出分析变量的相对重要性,可以看出节约性指数、生态适应性指数、选择性指数的重要性皆靠前。说明该优选系统对于园林规划设计中植物的选样具有一定的指导意义。但是该系统功能单一,对于植物的景观美学价值没能涉及。如何构建功能完备而又稳健的园林植物网络应用分析平台是今后不断努力的方向。