基于MaxEnt模型的阿勒泰金莲花潜在适生区预测
2021-05-06古丽米拉·克孜尔别克邱琴海拉提·克孜尔别克
古丽米拉·克孜尔别克 邱琴 海拉提·克孜尔别克
摘要:利用最大熵模型(MaxEnt)预测阿勒泰金莲花潜在适生区能够为新疆阿勒泰金莲花的科学规范种植提供有效的理论指导和依据。以12个实际分布数据及42个环境因子为依据,采用MaxEnt模型结合GIS(地理信息系统)空间分析技术预测阿勒泰金莲花潜在适生区,用聚类分析法划分适生区等级,使用百分比贡献率分析其主要环境因子及生态位参数。结果表明:(1)ROC(受试者工作特征)曲线评价显示MaxEnt模型预测阿勒泰金莲花潜在适生区的训练数据集和测试数据集的AUC(ROC下的面积)值分别为0.943和0.994,表明模拟效果优秀。(2)影响阿勒泰金莲花生长的主要环境因子百分比贡献率是日照时数(24.63%)、4月降水量(24.29%)、年平均最高气温(22.89%)和11月降水量(17.91%);阿勒泰金莲花适宜生长在日照时数≥2868h、4月降水量≤21mm、年平均最高气温≤9.1℃和11月降水量≤14.8mm的环境中。(3)阿勒泰金莲花潜在适生区总面积为46042.45km2,其中最适生区面积7536.71km2,主要分布于阿勒泰市、布尔津县、富蕴县和哈巴河县的北部。阿勒泰金莲花潜在适生区呈北高南低的空间分布格局,降水、日照和气温是影响其分布的主要环境因子。
关键词:阿勒泰金莲花;潜在适生区;最大熵模型;环境因子;AUC值
中图分类号:S126文献标志码:A
文章编号:1002-1302(2021)04-0082-05
作者简介:古丽米拉·克孜尔别克(1969—),女,新疆昌吉人,副教授,主要从事农业信息化、计算机应用方面的研究。E-mail:942010075@qq.com。
阿勒泰金莲花为毛莨科多年生草本植物,是一种很重要的非木质资源。阿勒泰金莲花是坝上优良茶品,具有较高的观赏价值和良好的药用价值,以其花入药,具有清热解毒、抗菌消炎、止血止咳、明目等功效[1],对扁桃腺炎、中耳炎、结膜炎、目赤肿痛等症疗效显著[2]。金莲花资源分布广,但由于人类过度采摘、开荒耕作及旅游业的发展使其生境不断减少,资源蕴藏量逐年下降,加之金莲花较高的经济价值和药用价值深受人们青睐,与日俱增的市场需求,导致野生金莲花面临资源枯竭的局面。当下关于金莲花的研究主要集中于其化学成分、药理作用、临床应用等方面[3-5]。索风梅等运用不同方式对金莲花在全国的适宜性区划进行分析,对合理发展金莲花引种栽培具有重要意义[6-8]。但关于新疆地区阿勒泰金莲花潜在适生区方面的研究鲜有报道,难以有效改善新疆野生金莲花资源匮乏的现状。因此,使用科学合理的方法研究生长环境因子对阿勒泰金莲花分布区域的影响,选择金莲花适宜生长地区进行引种和人工栽培,以期为阿勒泰野生金莲花的资源开发和物种多样性保护提供理论依据,也为阿勒泰金莲花药材种植落实扶贫政策提供有利保障。
数字模型在物种潜在适生区的研究中越来越被广泛应用,选择合适的模型不仅能够科学准确地判断物种实际生长环境需求,还能为保护濒危物种的生物多样性提供强有力的支持。目前,应用于物种潜在适生区预测的生态位模型有多种,如规则集遗传算法模型(geneticalgorithmforrulesetprediction,简称GARP)、广义线性模型(generalizedlinearmodel,简称GLM)、生物气候模型(bioclimaticpredictionsystem,简称Bioclim)、区域环境模型(domainmodel,简称Domain)、CLIMEX(climatechangeexperiment)和最大熵模型(maximumentropymodel,简称MaxEnt)[9]。根据研究表明,MaxEnt与其他模型相比,运行更稳定[10]、运算速度更快、预测精度更高[11],且在物种分布点匮乏的情况下,也可以得到较好的预测结果。因此,MaxEnt模型已成为物种地理分布预测的首选模型[12]。1957年MaxEnt模型被提出,该模型通过计算一定生态位约束条件下熵值最大的概率分布,根据熵最大时的状态参数获取物种与环境的关系,进而估计物种的分布,具有较高的预测准确度[13]。MaxEnt模型已被应用于包括沙生柽柳[14]、白栎[15]、胡杨[16]等多个物种的适生区研究,并取得了良好的研究成果。本研究采用多种方式获取阿勒泰金莲花的分布信息和环境变量数据,基于MaxEnt模型预测阿勒泰金莲花的潜在适生区,利用ArcGIS科学地对其潜在分布进行适宜等级划分,进而分析影响阿勒泰金莲花的关键环境因子及其最佳适宜性区间,旨在为阿勒泰金莲花的科学规范种植提供理论依据和工具支持,以期为保护阿勒泰金莲花资源提供有益参考。
1材料与方法
1.1样本信息
查阅《中国植物志》和中国数字植物标本馆(http://ww.cvh.org.cn./cms)资料,明确阿勒泰金莲花的大致生长环境及分布区域,于2018、2019年6—7月实地调查,共获得12个样本点,并记录各样本点的经纬度、海拔和面积,总体反映了阿勒泰地区范围内各种类型地形中金莲花的分布状况。采用Excel使分布点数据按物种名、分布点經纬度顺序导出并转换为csv格式文件,作为MaxEnt软件阿勒泰金莲花的实际分布输入数据。
1.2环境变量数据获取
本研究采用的环境数据含有42个环境因子:(1)气候数据,主要包括与气温和降水相关的39个气候因子,其中20个气候因子数据来源于中国气象数据网阿勒泰6个气象站1995—2018年的逐日地面观测数据,经统计整理后利用ANUSPLIN插值软件处理后所得,包括年平均最低气温、年平均最高气温、年极端最低气温、年极端最高气温、0℃积温、日照时数、1—12月降水量、日降水量≥0.1mm日数、平均相对湿度等。同时增加了来源于世界气候数据库(WorldClim,http://www.worldeclim.org)空间分辨率为30″的19个生物气候因子。(2)地形数据,包含高程、坡度和坡向,高程数据从地理空间数据云(http://www.scloud.cn)获取,并将高程数据在ArcGIS中利用空间分析工具得到坡度数据和坡向数据。利用ARCGIS软件将所有环境变量的图层进行重采样操作,统一像元大小,使用提取工具统一边界,并统一地理坐标系为GCS-WGS-1984,最后将各图层转换为asc格式文件,作为MaxEnt软件的环境变量输入数据。(3)阿勒泰地区数据,来源于国家基础地理信息系统网站(http://nfgis.nsdi.gov.cn/)1∶400万中国行政区划矢量地图。
1.3MaxEnt模型的构建
将阿勒泰金莲花分布点和环境变量数据导入MaxEnt3.4.1软件(http://www.cs.princeton.edu/~schapire/maxent),设置刀切法、响应曲线,并输出预测结果,选取25%分布点作为测试集,剩余的75%分布点作为训练集,以ASCII格式输出,模型的其他参数均为默认值。通过刀切法测定各环境因子的权重,进而识别影像阿勒泰金莲花空间分布的主要环境因子,以受试者工作特征曲线(receiveroperatingcharacteristiccurve,简称ROC)下的面积(即AUC值)来评估模型预测的准确性,对响应曲线进行分析,得到各环境因子的适宜性阈值。
1.4环境因子筛选
将处理后的12份阿勒泰金莲花分布点及42个环境数据导入MaxEnt模型软件进行迭代运算,挑选出运算结果中贡献率为0的环境因子予以剔除,再次运算,经多次运算筛选直至所有环境因子均有贡献率,以提高模型的模拟准确度。其中贡献率大、权重高的为影响阿勒泰金莲花分布适宜性的主导环境因子。
1.5潜在适生区划分
将MaxEnt模型输出的结果导入ArcGIS软件中进行适生区分析,首先通过ArcGIS转换工具(ConversionTools)将ASCII格式文件转换为Raster格式,并对其进行重分类(Reclassify)操作,划分阿勒泰金莲花潜在分布区的适宜度等级,共分成4个等级:非适生区、低适生区、较适生区以及最适生区,绘制金莲花在阿勒泰地区的适生区分布,最后运用ArcGIS的字段计算器计算各类适生区的面积,并统计出面积百分比。
2结果与分析
2.1模型预测效果评价
MaxEnt模型采用受试者评价特征(receiveroperatingcharacteristiccurve,简称ROC)曲线对适生区分析结果进行精度评估,ROC曲线以假阳性率作为横坐标,真阳性率作为纵坐标,曲线与横坐标之间所构成的面积值为AUC(areaundercurve)。利用AUC值对模型预测的准确性进行评价,AUC值越大表示模型预测结果精度越高[17]。AUC值在0.5~0.6之间为不及格;>0.6~0.7时为较差;>0.7~0.8时为一般;>0.8~0.9时为良好;>0.9~1.0时为优秀[18]。结果表明,训练数据集和测试数据集的AUC值分别为0.943和0.994(图1),远大于随机预测的AUC值(0.5),说明模型的预测结果与实际分布区具有较高的拟合度,表明由模型预测的金莲花潜在适生区具有较好的准确度和可信度。
[FK(W10][TPGLML1.tif][FK)]
2.2主导环境因子分析
基于MaxEnt模型,采用刀切法检验可判断各环境因子对阿勒泰金莲花适生区分布增益的贡献率及权重,进而可分析影响物种分布的主要环境因子。结果显示(表1),影响阿勒泰金莲花分布的降水因子贡献率为45.89%,日照时数贡献率为24.63%,气温贡献率为22.89%,19个生物气候变量因子的贡献率为5.15%,地形因子贡献率为0.83%,相对湿度贡献率为0.61%,表明降水、日照时数和气温是影响阿勒泰金莲花分布的主要因子。其中日照时数、4月降水量、年平均最高气温和11月降水量的贡献率分别为24.63%、24.29%、22.89%和17.91%,累积贡献率达89.72%,是影响阿勒泰金莲花生长区分布最关键的环境因子。地形数据中坡度的贡献率仅为0.83%,表明地形数据对阿勒泰金莲花的整体分布范围基本无影响。
使用MaxEnt模型生成的响应曲线(responsecurve),分析各主导环境变量在研究区域内分布的适宜取值范围(图2)。响应曲线的横坐标表示环境变量作用区间范围,纵坐标表示对应的环境变量与分布率的自然对数,纵坐标值与目标物种在该环境变量下的适宜性成正比趋势。以潜在分布概率阈值0.41提取阿勒泰金莲花主要环境因子变化范围。由图2-a可知,日照时数≥2868h适合阿勒泰金莲花的生长,随着日照时数的增加,阿勒泰金莲花的存在概率不断增大,其最适区间为3340~3350h。在图2-b中,随着4月降水量的增加,阿勒泰金莲花的存在概率急剧下降,4[KG*8]月降水量[KG*8]≤21[KG*3]mm[KG*8]为阿勒泰金莲花出现的阈值区间,其中在7.7~58.0mm区间里,阿勒泰金莲花的分布概率出现了明显的下降,在0.0~7.6mm范围内保持较平稳,为最适宜生长的区间。在图2-c中,阿勒泰金莲花的存在概率为年平均最高气温≤9.1℃,其中-5.8~2.1℃区间是最适宜区间,存在概率最高,2.2~15.3℃存在概率緩慢下降至最低。在图2-d中,11月降水量≤14.8mm适合阿勒泰金莲花生长,阿勒泰金莲花在11月降水量梯度上随着降水量的增大存在概率明显降低,其最适范围为0.0~4.1mm。
2.3阿勒泰金莲花潜在分布区分析
以分布概率阈值0.41对阿勒泰金莲花潜在适生分布图进行等级划分(图3):0.00~0.41为非适生区,>0.41~0.73为低适生区,>0.73~0.88为较适生区,>0.88~1.00为最适生区。分布等级图面积统计结果(表2)显示,阿勒泰金莲花潜在适生区总面积为46042.44km2,占阿勒泰总面积的38.97%。其中最适生区面积7536.71km2,主要分布于布尔津县和阿勒泰市,分别占最适生区总面积的42.55%和21.99%;较适生区总面积为14715.21km2,主要分布于阿勒泰市、富蕴县和布尔津县,分别占较适生区总面积的25.16%、23.27%、22.77%,低适生区面积为23790.52km2,主要集中于青河县和富蕴县,占低适生区总面积的31.34%和22.17%。将MaxEnt模型预测的阿勒泰金莲花适生区分布与实际分布点进行比较,发现实际分布点多集中于高适生区和较适生区内,表明该研究可信度较高。
3讨论与结论
当前有关新疆地区阿勒泰金莲花的研究相对较少。主要是由于大多数文献对新疆地区金莲花的分布区域记载不够详尽,对预测模型所需的分布坐标带来了困难。研究中所使用的分布点来自于实地调查数据,基本能够反映分布点的准确性。环境因子来源于各官网发布数据,且已被广泛应用于各物种的适生区研究中,具有较高的权威性和可靠性。因此,本研究所得模拟结果对于阿勒泰金莲花的科学开发与生产具有较高的参考价值。
本研究基于阿勒泰金莲花资源调查数据,结合最大熵模型MaxEnt和ArcGIS空间分析软件,较直观地预测了阿勒泰金莲花的潜在适生区分布,并分析了影响阿勒泰金莲花潜在适生区的主要环境因子。MaxEnt模型检测结果经ROC曲线验证显示,训练集的AUC值为0.994,测试集的AUC值为0.943,模型预测结果均达到优秀水平(0.9≤AUC<1.0),表明该模型预测结果精准度高、可靠性强。
MaxEnt模型预测结果表明,阿勒泰金莲花潜在适生区总面积为46042.45km2,约占阿勒泰总面积2/5,主要位于阿勒泰市、布尔津县、富蕴县、哈巴河和青河县的北部,整体呈北高南低的分布格局。根据潜在适生区分布统计:最适生区面积主要分布于布尔津县和阿勒泰市,同时布尔津县、阿勒泰市和富蕴县在较适生区占较高比例,低适生区面积主要在高适生区与较适生区的南部,集中于青河县和富蕴县,在哈巴河县有少量分布。以上研究结果符合阿勒泰金莲花实地调查分布信息,并与新疆植物志和索风梅等[6]研究结果基本一致,阿勒泰金莲花适宜分布在阿勒泰、布尔津等地区。
对阿勒泰金莲花潜在适生区分布进行分析发现,在阿勒泰北部集中分布,在南部较少分布,与阿勒泰地区气候密切相关。主要是由于金莲花喜光、喜湿、怕涝,分布具有一定特殊性,对光照、温度和降水量的要求较为苛刻[19]。因此,阿勒泰金莲花主要分布于山地草坡、林下或沼泽地的草丛中,在沟谷与荒坡中分布较少[20]。阿勒泰市北部海拔更高,降水较多,气温低,为阿勒泰金莲花的生长提供了适宜环境,进而分布较为广泛。阿勒泰南部地区地势低,温度高,降水量较少,使得金莲花的生长和分布范围受到一定的抑制。
本研究应用刀切法检验了各环节因子对阿勒泰金莲花潜在分布区的重要性。结果表明,日照时数、4月降水量、11月降水量和年平均最高气温4个环境因子在影响阿勒泰金莲花潜在分布的累积贡献率达89.72%,是影响阿勒泰金莲花生长区的主要环境因子,这与卢有媛等分析得出氣温和降水是影响金莲花生长分布的主要因素的结论[7]相一致。通过MaxEnt建立阿勒泰金莲花存在率与各环境因子之间的响应曲线,分析二者之间的关系,结果表明,主要环境因子适宜取值区间为日照时数≥2868h、4月降水量≤21.0mm、年平均最高气温≤9.1℃和11月降水量≤14.8mm,阿勒泰金莲花存在率随着日照时数增加而逐渐增大,随着气温和降水量的增加而明显下降。日照时数的贡献率为24.63%,在所有环境因子中排列第一,这主要是由于光照能直接影响光合作用[21],是影响植物生存和生长的主要环境因子。4月降水量和11月降水量累积贡献率为42.20%,对金莲花分布具有重要影响,是由于阿勒泰金莲花具有根系浅,怕干旱,忌水涝的特性,多雨环境不利于其生长,植株易烂根死亡。因而分布集中于地形相对平缓,起伏小,既不会大范围积水,也能维持一定的土壤湿度的区域。温度是植物生长发育必不可少的环境条件,年平均最高气温不高于9.1℃,证明阿勒泰金莲花适宜生长在低温地区,温度过高不利于阿勒泰金莲花开花、结果。
金莲花药材有较好的市场前景,已列入我国中药材产业扶贫推荐种植中药材名录[21]。由于对阿勒泰金莲花研究的数据和资料有限,本研究仅基于光照、气温、降水和地形因素对阿勒泰金莲花适生区分布进行分析,而未考虑土壤、植被、人类交通、栽培技术等其他因素对阿勒泰金莲花分布生长发挥的重要作用,这可能对阿勒泰金莲花适生区的预测结果产生一定的偏差。但通过MaxEnt模型中AUC参数评估,表明其具有较高的准确性,较好地预测了阿勒泰金莲花的潜在适生区分布,对阿勒泰金莲花的科学规范种植具有重要的参考价值和指导意义。依据阿勒泰地区天然地理的分布特点和优势,制定出科学的开发战略,为阿勒泰金莲花带来最佳的生态效益和经济效益。
参考文献:
[1]雷蓉,冯丽,刘永利,等.金莲花的研究进展[J].中药材,2015,38(5):1085-1091.
[2]杨静伟,张贵君,吴明侠,等.中药金莲花药效组分抗炎镇痛作用研究[J].中国药物评价,2013,30(4):210-213.
[3]赵波,李洪涛,李鞠,等.短瓣金莲花化学成分与抑菌活性相关性研究[J].中医药信息,2019,36(6):38-42.
[4]李海岳.金莲花颗粒联合利巴韦林治疗小儿急性上呼吸道感染的疗效及其对血清炎症标记物的影响[J].中国医药科学,2019,9(20):21-24.
[5]郑兆晔,王惠琴,胡防言,等.金莲花软胶囊治疗急性扁桃体炎(外感风热证)的多中心临床研究[J].药物评价研究,2019,42(6):1151-1155.
[6]索风梅,丁万隆,陈士林.基于TCMGIS-Ⅰ的金莲花数值区划研究[J].世界科学技术(中医药现代化),2011,13(1):109-112.
[7]卢有媛,郭盛,严辉,等.金莲花生态适宜性区划研究[J].中国中药杂志,2018,43(18):3658-3661.
[8]陈陆丹,胡菀,李单琦,等.珍稀濒危植物野生莲的适生分布区预测[J].植物科学学报,2019,37(6):731-740.
[9]徐军,曹博,白成科.基于MaxEnt濒危植物独叶草的中国潜在适生分布区预测[J].生态学杂志,2015,34(12):3354-3359.
[10]马松梅,张明理,张宏祥,等.利用最大熵模型和规则集遗传算法模型预测孑遗植物裸果木的潜在地理分布及格局[J].植物生态学报,2010,34(11):1327-1335.
[11]PhillipsSJ,MiroslavD.ModelingofspeciesdistributionswithMaxent:newextensionsandacomprehensiveevaluation[J].Ecography,2008,31(2):161-175.
[12]StockwellD.TheGARPmodellingsystem:problemsandsolutionstoautomatedspatialprediction[J].InternationalJournalofGeographicalInformationScience,1999,13(2):143-158.
[13]张佳琦,徐振朋,宛涛,等.未来气候条件下裸果木在中国的潜在分布区研究[J].植物资源与环境学报,2019,28(3):51-57.
[14]阿爾曼·解思斯,努尔巴依·阿布都沙力克,迈迪娜·吐尔逊,等.基于最大熵模型(Maxent)预测沙生柽柳潜在地理分布及格局[J].江苏农业科学,2019,47(2):91-94.
[15]刘瑞斌,姜小龙,戴锡玲,等.铁橡栎的潜在分布区及其对气候变化的响应[J].植物资源与环境学报,2019,28(1):85-95.
[16]厉静文,郭浩,王雨生,等.基于MaxEnt模型的胡杨潜在适生区预测[J].林业科学,2019,55(12):133-139.
[17]王运生,谢丙炎,万方浩.ROC曲线分析在评价入侵物种分布模型中的应用[J].生物多样性,2007,15(4):365–372.
[18]赵力,朱耿平,李敏,等.入侵害虫西部喙缘蝽和红肩美姬缘蝽在中国的潜在分布[J].天津师范大学学报(自然科学版),2015,35(1):75–78.
[19]李永宁,程旭,于泊,等.冀北山地金莲花生境类型与分布特征研究[J].河北林果研究,2009,24(1):51-52.
[20]吴能表,谈锋,肖文娟,等.光强因子对少花桂幼苗形态和生理指标及精油含量的影响[J].生态学报,2005,25(5):1159-1164.
[21]黄璐琦,苏钢强,张小波,等.中药材产业扶贫重点优先区域划分和推荐种植中药材名录整理[J].中国中药杂志,2017,42(22):4319-4328.