基于MaxEnt 和GIS 预测四川省杉木良种在湖北省同一适宜引种生态区
2022-06-16胡超于静
胡超 ,于静
1.湖北省林业局林木种苗管理总站,湖北 武汉 430079;2.岭南生态文旅股份有限公司,湖北 武汉 430062
林木良种是有适宜生态区域要求的,如果自然条件不适宜,再好的良种也达不到丰产、稳产。因林木良种不适应引种区自然条件而造成巨大损失的教训是深刻的:20 世纪70 年代,各地在油茶(Camellia oleiferaAbel.)生产发展过程中调购种子比较随意,较多地方因为超地理区域引种造林,引种前没有进行科学预判,盲目性的引种,导致幼林生长不良、成林产量很低,在人力、物力等方面都造成了较大的损失[1]。
传统的林木良种引种适宜生态区凭主观经验判断较多,如,宜林范围内每个按水平分布的气候带和垂直气候带都分布着特有类型的森林植被。经纬度由北向南,由西向东调运范围大于相反方向的范围,海拔高度不超过300~500 m,但是,1958 年,湖北引种广东、福建马尾松(Pinus massonianaLamb.)种子成功,用事实改变了过去专家认为“马尾松南种北移的幅度不能超过2~3°”的定论[2]。1979 年李传志论证马尾松一次北移6~7°育苗是可以成功的[2]。所以,温度、降水、土壤等主要环境因子相似,即为林木良种同一适宜引种生态区。
杉木(Cunninghamia lanceolata)是湖北省主要造林树种之一。传统的杉木良种引种适宜生态区也是凭主观经验判断较多。杉木良种数量较多,且生长周期长,像农作物良种一样,对所有杉木良种都进行引种试验的可行性不大。基于MaxEnt 和ARCGIS 分析杉木良种同一适宜引种生态区[3,4,5],对四川省盆周山区杉木产区现有审定杉木良种,以100 m×100 m(即1 hm2)为单元,用34 个环境因子划分四川省盆周山区杉木良种在湖北省同一适宜引种生态区,提高预测精度,为湖北省杉木良种造林工作能够“适地适树”,经营管理上“经济、合理”,杉木生产达到“速生、丰产、优质”奠定基础。
1 数据与方法
1.1 基本信息来源
四川省林木良种审定委员会审定通过了5 个无性系种子园良种。这些良种具有生长速度快、抗性强等优点。四川省盆周山区审定杉木良种信息来源于湖北省林业局林木种苗管理总站(见表1)。
表1 四川省盆周山区杉木产区审定杉木良种Tab.1 Approved superior Cunninghamia lanceolata varieties selected form Cunninghamia lanceolata production area in the mountainous regions surrounding Sichuan basin
34 个环境因子数据获取于中国气象科学数据共享服务网、中国科学院资源环境科学数据中心、国家青藏高原科学数据中心、中国西部环境与生态科学数据中心(见表2)。
表2 四川省盆周山区杉木良种在湖北省同一适宜引种生态区环境因子Tab.2 Environmental factors of the identical suitable introduction ecological distribution of the superior Cunninghamia lanceolata varieties in Hubei province introduced from the mountainous region surrounding Sichuan basin
(续表 2)
中国行政区划数据、中国海拔高度(DEM)数据获取于中国科学院资源环境科学数据中心和湖北省林业调查规划院。
1.2 信息数据处理
1.2.1 分布数据处理
为避免样点数据在某个地理空间上过度聚集,在四川省盆周山区杉木适生范围内,用Arcgis10 的Create fishnet 工具生成空间为30 行x30 列的格网数据,以1 个格网作为1 个采样单元对杉木良种的分布数据进行采样(见图1)[6]。根据选育单位确定的杉木良种适宜的自然地理环境条件范围,如,适宜海拔范围为400~1500 m,在Excel 表中,剔除高程小于400 m、高程大于1500 m、土壤厚度小于30 cm和异常值的采样点,全部采样分布记录共301 条。按照MaxEnt 软件的“Samples”的要求整理数据,将分布点以“物种+经度+纬度(西经、南纬的值为负,经纬度为十进制小数格式。)”另存为CSV 格式文件。
图1 四川省盆周山区杉木产区采样点分布示意图Fig.1 Distribution of sampling points in Cunninghamia lanceolata production areas of the mountainous region surrounding Sichuan basin
1.2.2 环境因子处理
地形因子(经度、纬度、高度)与环境因子有较好的回归关系,利用中国2 160 个基本、基准地面气象观测站的观测数据,推算模拟无测站区域的环境资源分布情况。建立Bio1~Bio10、Bio13~Bio21、Bio24~Bio27 等23 个环境因子的空间分布模型,其表达式为:
式中,Y为环境因子要素;λ为经度;φ为纬度;h为海拔高度(m);函数f(λ,φ,h)为气候学方程;ε为残差项,可视为小地形因子(坡度、坡向等)及下垫面对环境的影响。将f(λ,φ,h)展成三维二次趋势面方程[7]。
式中,b0~b9为待定系数,利用SAS9.4 建立逐步回归优化回归模型,模拟23 个环境因子的宏观趋势项,分别建立23 个环境因子的小网格推算模型(见表3)。
表3 环境因子的小网格推算模型Tab.3 Small grid calculation model of regionalization indexes of environmental factors
在中国海拔高度(DEM)数据支持下,在ArcGIS10 里,用23 个环境因子的小网格推算模型,将环境因子Bio1~Bio10、Bio13~Bio21、Bio24~Bio27分别插值为100 m×100 m 网格的基础数据[8,9]。用IDW 法分别插值其残差项为100 m×100 m 网格的修正数据。用Spatial Analyst 工具→数学→逻辑→加,将每个环境因子的基础数据和修正数据叠加相加为环境因子栅格数据。23 个环境因子栅格数据用投影栅格工具统一为地理坐标系D_WGS_1984。以湖北省和四川省矢量边界为掩膜,裁剪出这23 个环境因子栅格数据图层。最后,用栅格转ASCII 工具将这23 个环境因子栅格数据转换保存为MaxEnt 所需要的ASCII 格式文件。
在ArcGIS10 里,将下载的Bio11、Bio12、Bio22、Bio23、Bio28~Bio34 等11 个环境因子数据通过重采样工具使其像元大小与Bio1~Bio10、Bio13~Bio21、Bio24~Bio27 等23 个环境因子一致[10]。11 个环境因子数据统一为地理坐标系D_WGS_1984。以湖北省和四川省矢量边界为掩膜,裁剪出这11 个环境因子栅格数据图层。最后,用栅格转ASCII 工具将这11 个环境因子栅格数据转换保存为MaxEnt 所需要的ASCII 格式文件。
1.3 模型构建
1.3.1 MaxEnt 软件建模
(1)物种数据:将之前导出的杉木良种分布数据(csv 格式)的文件,通过Browse 加载到MaxEnt软件“Samples”模块。
(2)环境数据:把ASCII 格式文件的34 个环境数据加载到MaxEnt 软件“Environmental layers”模块。
(3)参数设置:使用auto features 选项,根据自动特征规则进行计算,所有的要素类型都将用到。结果以comulative 类型和ASCII 格式输出,并定义其输出位置。设置界面的选择 settings 里‘Random test percentage’设置为25,随机选取75%的样本点数据作为训练数据[11],settings 中replicates 本试验选择3 次重复作为平行试验,最大迭代次数设为500 次,收敛阈值设为0.000 01,取值范围0-100[12]。选择‘Do jackknife to measure variable importance ’衡量所有变量的重要性,MaxEnt 软件分别对每一个环境影响因子进行刀切图绘出。
1.3.2 ROC 曲线绘制
绘制响应曲线(Response curves)评价模型精度。ROC 曲线以真阳性率为纵坐标(敏感性,实际存在且被预测为存在的比率),以假阳性率(1-特异性,实际不存在但被预测为存在的比率)为横坐标,AUC 值指 ROC 曲线与横坐标围成的面积值,值域为0~1。AUC 值越大表示与随机分布相距越远,环境因子变量与预测的杉木良种同一适宜引种生态区之间的相关性越大,即模型预测效果越好,反之说明模型预测效果越差。AUC 值在 0.5~0.6,0.6~0.7,0.7~0.8,0.8~0.9,0.9~1 分别表示模拟效果失败、较差、一般、好、非常好[4,8]。34 个环境因子预测模型的训练样本和测试样本的AUC 值达到0.921 和0.902(见图2),AUC 均值在0.9~1 之间,说明模型预测效果非常好。
图2 初始模型的ROC 曲线分析及AUC 值Fig.2 ROC curve analysis and AUC value for the initial model
1.4 模型优化
在使用MaxEnt 模型进行较大空间范围的杉木良种同一适宜引种生态区预测时,如果环境因子变量过多、变量空间共线性过强,将导致模型的复杂性增加,随机误差增大。所以,过多低贡献率的环境因子变量会导致模型运行结果的准确性降低。因此,需要对环境因子进行筛选或降维[13]。
1.4.1 筛选贡献率高的环境因子变量
在34 个环境因子中,对于杉木良种同一适宜引种生态区分布贡献较大的环境因子变量有:Bio2、Bio7、Bio8、Bio12~Bio14、Bio18、Bio25、Bio27、Bio28,累计贡献率为95.8%。Bio1、Bio3~Bio6、Bio9~Bio11、Bio15~Bio17、Bio19~Bio24、Bio26、Bio29~Bio34 等24 个环境变量的贡献率都小于1%(见表4),对杉木的种植分布影响有限,对这24 个环境因子变量进行剔除[14]。
表4 各环境因子变量的贡献率Tab.4 Contribution rate of each environmental factor variable
1.4.2 筛选正规化训练增益高的环境因子变量
刀切法(jackknife test)测定各环境因子变量权重。刀切法就是每次都忽略一个环境因子变量,然后基于剩下的环境因子变量来对杉木良种同一适宜引种生态区进行预测,然后MaxEnt 软件自带程序画出柱形图作为依据评估环境因子变量的重要性。红色条带代表所有变量的贡献;深蓝色的条带越长,说明该变量越重要;浅蓝色的条带长度代表除该变量以外,其他所有变量组合的贡献。Bio2、Bio7、Bio8、Bio12~ Bio14、Bio18、Bio25、Bio27、Bio28 对应的深蓝色条带都大于0.1(见图3),说明它们本身的增益值较大,表明它们对预测杉木良种同一适宜引种生态区是重要环境因子变量,所以,保留这10 个环境因子变量。
图3 刀切法的环境因子变量重要性分析Fig.3 Importance analysis of the environmental factors variables in the Jackknife method
1.4.3 筛选多重共线的环境因子变量
用GIS 软件的值提取至点工具提取有效分布点的环境因子变量数值,用SPSS 软件对贡献较大的Bio2、Bio7、Bio8、Bio12~Bio14、Bio18、Bio25、Bio27、Bio28 等10 个主导环境因子进行Spearman相关分析(见表5),检验环境因子变量之间的多重共线性。Bio2 分别与Bio7、Bio8、Bio13 的相关系数|r|≥0.8,对比初始模型中二者的贡献率,Bio7、Bio8、Bio13 贡献率较小,所以,剔除贡献率较小的变量Bio7、Bio8、Bio13,提高模型模拟的精度[14]。
表5 关键环境因子变量的相关系数Tab.5 Correlation coefficient of key environmental factor variables
2 结果与分析
2.1 模型的有效性
用剩余的Bio2、Bio12、Bio14、Bio18、Bio25、Bio27、Bio28 等7 个主导环境因子变量重新建模,重建模型的训练样本和测试样本的AUC 值达到0.902 和0.890(见 图4),AUC 均值在0.8~0.9 之间,表明重建模型适用性及模拟精度均好,与主导环境因子变量之间的相关性大,预测同一适宜引种生态区的结果好,可以据此进行引种推广。
图4 重建模型的ROC 曲线分析及AUC 值Fig.4 ROC curve analysis and AUC value of the reconstruction model
2.2 杉木良种同一适宜引种生态区预测及适生等级划分
MaxEnt 进行3 次重复试验,选取重复试验中,AUC 值最高的图层导人ArcGIS 软件进行适宜等级划分和可视化表达(见图5)。MaxEnt 模型输出的数据为ASCⅡ格式,用ArcGIS 的ASCII to Raster 功能,输出数据类型选FLOAT,使该结果可在 ArcGIS中显示[14]。利用“Reclassify”功能,划分分布值等级及相应分布范围,并使用不同颜色表示,划分标准为:存在概率<0.05 为不适生区;0.05≤存在概率<0.33 为低适生区;0.33≤存在概率<0.66 为中适生区;存在概率≥0.66 为高适生区[4,8]。整体来看,四川省盆周山区杉木产区的杉木良种在湖北省的低适生区面积为5 204 295 hm2,主要分布在:鄂中的随县、东宝区、掇刀区、沙洋县、荆州区、沙市区、江陵县、松滋市、公安县和石首市;鄂西的宜昌市、恩施市、襄阳市、十堰市和神农架。低适宜区域在引种杉木良种时,需要选择适宜的小生境。
图5 四川省盆周山区杉木良种在湖北省同一适宜引种生态区分布图Fig.5 Distribution of the identical suitable introduction ecological distribution of superior Cunninghamia lanceolata varieties in Hubei province introduced from the mountainous regions surrounding Sichuan basin
2.3 杉木良种地理分布与生物气候变量的关系
用刀切法(Jackknife Test)检测7 个主导环境因子变量对于分布增益的贡献,结果(见表6)表明:太阳辐射日均值(Bio2)对杉木分布的增益最大,当太阳辐射日均值为115~119 w·m-2,分布值随太阳辐射日均值的升高而增大;当太阳辐射日均值为119~170 w·m-2,分布值随太阳辐射日均值的升高而减小(见图6)。≥10℃积温(Bio25)也对杉木分布的影响较大,当≥10℃积温为0~50 000℃,分布值随≥10℃积温的升高而减小(见图7)。
图6 太阳辐射日均值(Bio2)反馈曲线Fig.6 Daily average solar radiation (Bio2) feedback curve
图7 ≥10℃积温(Bio12)反馈曲线Fig.7 Accumulated temperature ≥10℃ (Bio12) feedback curve
表6 主导环境因子变量的贡献率Tab.6 Contribution rate of dominant environmental factor variables
3 讨论
基于MaxEnt 生态位模型的同一适宜生态区研究中,环境因子数据常来自世界气候-全球气候数据库网站,仅19 个环境因子,空间分辨率仅为5arcmin[5,6,10,14-17]。研究选取34 个重要环境因子,用中国2 160 个基准地面气象观测站的观测数据,推算模拟无测站区域的环境资源分布情况,提高了四川省盆周山区杉木良种在湖北省同一适宜引种生态区预测精度。
传统的杉木良种引种同一适宜生态区以乡镇、县、市、省等行政单位为单元。然而,影响杉木成活生长的光、热、水、气等环境因子,受太阳辐射、大气环流的影响,在地面上呈地带性的分布。由于山体起伏,垂直森林地带在实际上并不都是连续的,而是由断断续续地呈孤岛状分布的地块组成。为了获得精准的引种效果,100 m×100 m 为单元,进一步提高预测精度。
传统的林木引种是以单个树种划出同一适宜生态区。然而,随着自然条件演变和科学技术的发展,转抗性基因育种、种间和远缘杂交育种等遗传
改良工作在广泛开展,每年都有新的林木良种通过审定。在相同的立地条件下,同一树种,不同良种之间的生长好坏是有显著差异的。为了获得精准的引种效果,本研究是以单个良种划出同一适宜生态区,精准预测四川省盆周山区杉木良种在湖北省同一适宜生态区。
通过运用MaxEnt 生态位模型对四川省盆周山区杉木良种在湖北省同一适宜引种生态区进行分析,证明了MaxEnt 模型在林木良种引种应用方面的可行性以及可信度,同时结合刀切法探讨对杉木良种生长影响最显著的环境因子,这对四川省盆周山区杉木良种适生性分析提供了更进一步的技术支撑。