基于最大熵模型预测太白贝母的潜在分布
2021-10-13邹萌蒋瑞平李佳伦段淇洋廖海周嘉裕
邹萌,蒋瑞平,李佳伦,段淇洋,廖海,周嘉裕
西南交通大学生命科学与工程学院,四川 成都 610031
太白贝母Fritillaria taipaiensisP.Y.Li 为百合科贝母属植物,是川贝母药材的基原植物之一,以鳞茎入药[1]。太白贝母含有生物碱成分,具有润肺止咳、化痰平喘等功效,临床广泛应用于肺热燥咳、肺阴 虚等。由于人为大量采挖和生态环境的破坏,太白贝母的野生资源受到严重破坏,已濒临枯竭[2]。鉴于太白贝母野生资源所面临的严峻形势,《陕西省中药材保护和发展实施方案(2016-2020)》(陕政办发〔2016〕9 号)已将太白贝母列入中药材重点保护品种目录。为缓解太白贝母需求与野生资源匮乏的矛盾,对太白贝母开展引种与人工栽培是一种可行的替代方法。
有关太白贝母的栽培报道,始载于清光绪《大宁县志》“贝母,银厂坪所产为佳”。“大宁县”指今重庆市巫溪县地区,说明从清代起,当地已成为太白贝母的栽培区。其后,陕西、甘肃、重庆与四川等地也陆续有太白贝母的野生资源及栽培区的报道[3],但盲目引种及扩大栽培区会严重影响太白贝母生产的合理布局,甚至破坏太白贝母的道地性,导致药材品质下降。因此,开展太白贝母生态环境适应性研究具有重大现实意义。
本课题组通过2019 年6 月-2020 年9 月野外实地勘查、查询相关文献与网络数据库信息,整理出太白贝母在中国的地理分布区资料,利用最大熵(MaxEnt)模型和地理信息系统ArcGIS 软件分析影响太白贝母地理分布的主要环境因子及其影响程度,并以此为依据分类预测太白贝母不同程度适生区划图,分析其潜在地理分布格局,以期为太白贝母资源的可持续利用提供参考。
1 数据来源与方法
1.1 太白贝母分布数据
太白贝母的分布数据主要来源于3 个部分:①实验室人员野外实地考察,以及中国数字植物标本馆(http://www.cvh.org.cv/)标本植物的分布地经纬度信息;②通过查阅文献中的分布区数据整理得到经纬度信息,其中对仅有物种名及物种详细分布地名称的,通过地球在线(https://www.earthol.com/)查找具体分布点并记录;③通过全球生物多样性信息平台(https://www.gbif.org/)整理太白贝母在中国范围内分布点,并找到相应的经纬度信息。最终整理得到中国境内115 份包含20 个地点的分布点数据,将各分布点数据统一转换为十进制并以.csv 格式保存。详见表1。
表1 太白贝母分布数据
1.2 环境变量
从世界气象数据(https://www.worldclim.org/)下载32 个环境变量因子,涵盖19 个基础生物气候变量(bio1~19),以及1、5、6、7 月的最低温度(tmin1、tmin5、tmin6、tmin7)、最高温度(tmax1、tmax5、tmax6、tmax7)、平均温度(tavg1、tavg5、tavg6、tavg7)和海拔(alt)。采用ChinaMap 中4p 格式的1∶400 万中华人民共和国地图和中华人民共和国行政区划图(https://www.csdn.net/)作为底图得到太白贝母在中国境内的分布点。详见图1。
图1 太白贝母分布点
1.3 数据处理
1.3.1 环境因子选取
由于环境因子间有一定的相关性,所以本研究对32 个环境因子进行相关性检验后用于MaxEnt 模型。利用ArcGIS12.0 软件提取各采样点的点插值,以SPSS20.0 软件Spearman 相关系数查验相关性,选取相关性<0.8 的环境因子,若2 个因子相关性≥0.8,只选择任意1 个因子运行模型。
1.3.2 最大熵模型预测
运行MaxEnt3.4.1 软件,在样本栏(samples)添加上述.csv 文件,在环境图层栏(environmental layers)添加所选取的低相关性环境因子,采用刀切法(jackknife)预测各环境因子的贡献率,制作响应曲线(response curve)并生成初步适生区预测图像。预测模型的准确性是利用受试者工作特征(ROC)曲线下方面积(AUC)值判定,其值越接近1,说明与随机分布相距越远,且环境因子与预测的物种地理分布之间的相关性越大,即MaxEnt 模型预测的结果越准确。
本研究采用Roberto、Natural breaks 等研究方法,选取25%分布点作为测试集与75%分布点作为训练集,模型运算次数设定为500 次,重复运算设定为10 次,其余参数均为默认模型的自动设置。
1.4 适应性分布区划分
将MaxEnt 模型运行得到的结果导入ArcGIS12.0软件,利用重分类进行叠加分析和地图制作,采用人工分级方法划分出太白贝母适应性分布等级,得到主要生态因子影响下的适应性区划图。根据MaxEnt 模型运行结果中各环境因子的响应曲线得出主要因子适宜值范围及太白贝母适生区的生态特征。
2 结果与分析
2.1 预测的有效性
近年来,ROC 曲线分析法在预测物种潜在适生区模型评价中应用广泛[4]。该方法是对曲线下方面积进行计算,即得到AUC 值,由此判断模型模拟的精准度。一般认为,AUC<0.6 时判断价值较低,AUC>0.8 时判断价值较高,AUC=1 时为理想分布[5]。本研究在对各环境因子重复运行10 次后得到训练数据集AUC=0.958,说明MaxEnt 模型对太白贝母潜在分布区的预测结果较好,可信度非常高。见图2。
图2 太白贝母分布MaxEnt 模型ROC 曲线及AUC 值
2.2 环境因子贡献率
jackknife 是在预测物种潜在分布的适生区和分析环境因子对所预测结果的影响程度大小,以及通过运算确定对物种分布贡献率最大的环境因子过程中最常用的方法。本研究根据jackknife 分析得到的预测结果显示,各环境因子在对太白贝母适应度的影响所占的权重不同。见图3。
图3 环境因子在MaxEnt 模型中预测太白贝母分布刀切图
通过模型筛选得到对太白贝母潜在分布贡献率>0 的环境因子有6 个,即昼夜温差均值(41.21%)、海拔(26.42%)、年降水量(18.32%)、温度季节性变化的标准差(13.43%)、最湿月降水量(0.63%)、6月最低气温(0.12%)。其中昼夜温差均值和海拔的贡献率最高,温度、海拔与降水是影响太白贝母分布区的重要环境因素,见表2。
表2 对太白贝母潜在分布贡献率>0 的6 个环境因子
2.3 主要环境因子
通过运行MaxEnt 模型可以得到所选取各环境因子的单变量响应曲线,从而分析其最适区间值。为明确主要环境因子的参数值与太白贝母存在概率之间的关系,本研究在MaxEnt 模型运行结果基础上绘制仅包含单一环境因子的响应曲线,其中包含bio2、alt、bio12 与bio4。结果表明,太白贝母的潜在分布概率随环境的改变波动值较大。选择存在概率>0.2 的区间作为其适生区范围。
昼夜温差均值和海拔影响最大,其中当昼夜温差均值约为8.1 ℃时太白贝母适生概率最大,达到66.28%,昼夜温差2.7~11.9 ℃为其适生区范围。当海拔为241 m 时达到太白贝母适生范围;241 m<海拔<1 318 m时呈增长趋势;1 318 m时到达最适概率,约为65.7%;1 318 m<海拔<3 828 m 时适生概率逐渐降低。因此,在昼夜温差约为8.1 ℃及海拔约为1 318 m 时,最适宜太白贝母生长。详见图4、图5。
图4 太白贝母昼夜温差均值响应曲线
图5 太白贝母海拔响应曲线
2.4 太白贝母的适应性划分
将MaxEnt 模型的预测结果导入ArcGIS 软件中运行,对总体适生区进行重分类,确定把适生等级分为4 类:0<适应指数≤0.06 为非适生区;0.06<适应指数≤0.23 为低适生区,主要分布于四川、甘肃南部、云南南部、浙江南部,在青海东南部、新疆北部和西藏西部有零星分布;0.23<适应指数≤0.51 为适生区,主要分布于甘肃南部、贵州西北部、四川中部及东北部、重庆南部、陕西南部及湖北西部;0.51<适生指数<0.86 为高适生区,主要分布于甘肃南部、贵州西北部、四川中部及东北部、重庆南部、陕西南部及湖北西部等地区。见图6。潜在分布区在各省(区)的分布面积统计情况见表3。
图6 太白贝母潜在分布核心区域
表3 太白贝母潜在分布区域面积
3 讨论
利用生态位模型的运行对物种的潜在分布区进行预测,进而对物种建立保护区及规划人工栽培地域是目前广泛应用的方法。MaxEnt 模型运行简单,预测结果的准确性高且可信度较强,已被广泛用于物种的潜在分布区预测及适应性评价[6]。
本研究结合MaxEnt 模型和ArcGIS,采用的分布点数据涵盖了太白贝母的现有分布区,结果发现太白贝母主要集中在陕西、甘肃、重庆及四川等地,与陈士林等[7]关于太白贝母最大生境区域的研究结果一致。
基于收集分布点的32 个环境因子数据,本研究对太白贝母的潜在分布区进行预测及适应性等级划分。结果MaxEnt 模型ROC 曲线训练集AUC=0.958,表示该模型预测准确度达到较高水平,可用于太白贝母潜在分布区的预测。较之现有分布区[8],潜在分布区增加了贵州、湖南及湖北的部分地区,其中贵州尤其值得关注,不仅与重庆接壤,且其总面积的76%可作为太白贝母的潜在分布区,表明贵州极有可能成为未来太白贝母产业的重点发展区域,需提前开展合理布局与规划。潜在分布区中,高适生区是太白贝母生长与繁殖的最适区域,主要分布于甘肃南部、贵州西北部、四川中部和东北部、重庆南部、陕西南部及湖北西部等地区。这些区域集中了太白贝母的一些传统产区,如陕西太白县昼夜温差大,气候较寒冷,一直是太白贝母种植最适宜的地区[9],印证了本研究预测结果的准确性。太白贝母的潜在核心分布区与川贝母Fritillaria cirrhosaD.Don、暗紫贝母Fritillaria unibracteataP.K.Hsiao &K.C.Hsia 和甘肃贝母Fritillaria przewalskiiMaxim.ex Batal 等品种的分布区有一定范围的重叠,其中在甘肃南部与甘肃贝母Fritillaria przewalskiiMaxim.ex Batal 有重叠,在四川省与暗紫贝母Fritillaria unibracteataP.K.Hsiao &K.C.Hsia 和川贝母Fritillaria cirrhosaD.Don 重叠,在湖北西部和重庆市与湖北贝母Fritillaria hupehensisHsiao et K.C.Hsia 有重叠。这些重叠区的存在,一方面体现出不同品种贝母所需的生态环境因子高度相似,另一方面也表明这些区域拥有较好的生态优越性,尽管出现了不同贝母的空间生态位重叠,但彼此间却不产生生存竞争。
在影响太白贝母分布的主导环境因子中,气候因子对太白贝母的影响大于土壤与地形因子。昼夜温差均值是影响太白贝母分布的最重要环境因子,当昼夜温差均值为8.1 ℃时,最有利于太白贝母生长过程中营养物质的累积,并促进太白贝母鳞茎的生长。有报道,等温性是影响川贝母Fritillaria cirrhosaD.Don分布的最重要环境因子[10]。太白贝母与川贝母Fritillaria cirrhosaD.Don 具有不同的最重要环境因子,推测其原因可能在于太白贝母属于川贝母类群中较为独立的品种。太白贝母的独立性也体现在DNA上,其ITS2 等条形码序列与其他品种川贝母有较大差别[11],在进化树上处于不同分支,表明太白贝母较早从川贝母类群中分化出来,导致其DNA 与所处环境与其他川贝母品种产生较大差别。由此,我们推测植物的生长环境适应性可能作为植物系统进化研究的一个参数,但有待于进一步验证。
本研究显示,海拔是影响太白贝母分布的第2 个重要因素,最适海拔为1 318 m。研究显示,不同海拔高度影响药材品质,海拔梯度造成的水分、温度及土壤肥力等环境差异性会对植物生长发育产生极大的影响,进而导致植物生理和生态适应性的变化[12],如生长在海拔1 500 m 的重庆产桔梗药材质量最优[13]。由于暗紫贝母等其余川贝母品种的最低海拔在3 000 m 左右[14],因此同一地区不同海拔可种植不同类型的川贝母品种,如低处种植太白贝母,高处种植川贝母,如此则能有效利用生境资源,实现空间利用最大化。
目前川贝母的野生资源不容乐观,而栽培技术已较为成熟,所以对太白贝母的适生区进行预测并以此指导进行合理种植与栽培十分必要。相较其他品种,太白贝母有望成为低海拔地区川贝母栽培的优良候选品种。在合理规划前提下建立太白贝母中药材生产质量管理规范(GAP)生产基地,对太白贝母资源的可持续利用有重要意义。