基于灰色预测的死亡长江江豚数量分析*
2020-07-26王伟萍王庆萍陶毅力王海华
吴 斌 王伟萍 王庆萍 陶毅力 王海华
(江西省水产科学研究所 江西南昌 330039)
长江江豚(Neophocaena asiaeorientalis)是江豚的3 个亚种之一,也是最濒危的一个亚种,仅生活在长江中下游和大型通江湖泊鄱阳湖和洞庭湖中。基于江豚种群基因组学最新研究结果显示,极度濒危的长江江豚种群应被作为一个独立的物种[1]。长江江豚不仅是全世界唯一一种生存于淡水环境的鼠海豚科动物,也是长江流域极可能唯一现存的的水生哺乳动物(2007年白鱀豚功能性灭绝)。自20世纪90年代以来,长江江豚的数量呈现出持续性的衰减趋势[2-5],2018年7月正式发布的《2017 长江江豚生态科学考察报告》是目前最新的长江江豚科考成果。江豚种群数量大幅下降的趋势得到遏制,估算长江江豚数量约为1 012 头,考虑其严峻的受威胁程度,长江江豚已被按照国家一级保护动物进行保护[6]。2018年,中国科学院深海所海洋哺乳动物研究团队对长江江豚进行了全基因组测序,组装得到了2.22 Gb的基因组草图,为江豚基因组的研究奠定了基础[7]。本研究通过查阅微信公众号“水野保护者”发布的全长江流域已登记死亡长江江豚统计数据,分析其年际周期性变动规律,以期为长江江豚精准保护提供基础数据支撑。
1 材料与方法
1.1 数据来源与指标选取 研究所用数据来源于微信公众号“水野保护者”发布的统计数据。2008—2018年,全长江流域已登记死亡长江江豚数量为329 头,年均死亡数量为29.9 头。每年3、4、10、11月是长江江豚的生产、哺乳的高峰期,而这一时间段同样也是死亡的高峰期。灰色预测模型的原理是离散累加求导[8],在数据量较少时进行中、短期预测精度更高,因此,本研究中灰色预测部分选用聚类分群数据及连续5年的数据对未来1年的数据进行预测,并通过历史数据评估模型的有效性及2 种数据选取的相对误差大小,同时采用近5年的数据对2019—2020年,全长江流域已登记死亡长江江豚数量进行预测。
1.2 模型选取 考虑到影响长江江豚死亡的因子多而复杂,且全长江流域死亡长江江豚数量相对较少,是灰色系统理论中典型的灰因白果律事件,因此本研究采用灰色模型GM(1,1)对全长江流域死亡长江江豚进行短期预测。GM(1,1)是我国学者邓聚龙首次提出的,指的是以灰色系统理论为基础建立(行为)时轴上现在与未来的定量关系从而预测事物的发展,以微分拟合法建立模型,将离散数据视为连续变量在其变化过程中所取的离散值,从而利用微分方程处理数据,具有少数据预测、允许对灰因果律事件进行预测和可检验性的特点[8-9]。
2 结果与分析
2.1 全长江流域已登记死亡长江江豚数量 Kmean 是聚类算法的一种,其目的是找到样本数据潜在的类别。该方法的基本思想是:首先,随机选取k个聚类中心,并计算各个样本点与k个聚类中心的距离,确定各样本的分群c;然后,根据类书并计算新的聚类中心,重复前一步骤直至收敛为止,并最终确定各样本的类别。将2008—2018年全长江流域已登记死亡长江江豚数量(表1),通过聚类分析,不难发现,可分成2 类,聚类中心之间绝对差值大致为40(表2)。
表1 2008—2018年全长江流域已登记死亡长江江豚数量(单位:头)
表2 全长江流域已登记死亡长江江豚数量(头)聚类分析(二类)结果
2.2 全长江流域已登记死亡长江江豚数量2008—2018年全长江流域已登记死亡长江江豚数量(头)结果,分群类别为1 和2,样本个数分别为2 个和9 个,因此推测,长江江豚死亡数量存在“峰谷”的年际周期性变动,为此,选取其中4 个时间段进行预测,分别代表谷+谷+谷+谷+峰、谷+谷+峰+谷+谷、峰+谷+谷+谷+谷、谷+谷+谷+谷+谷 即2008—2012年、2010—2014年、2012—2016年、2013—2017年4 组数据,分别预测2013年、2015年、2017年、2018年;同时,用前10年 数据进行2018年(高峰年)灰色预测(表3)。
表3 全长江流域死亡长江江豚数量灰色预测结果
3 结论与建议
聚类分析被用作描述数据,衡量不同数据源间的相似性,以及将数据源分类到不同的簇中。本研究对2008—2018年全长江流域已登记死亡长江江豚数量数据进行聚类分析,发现全长江流域已登记死亡长江江豚数量存在“峰谷”的年际周期性变动,即2012年和2018年为长江江豚死亡高峰年,因此,聚类分析是探讨长江江豚死亡年际周期性变动,研判未来发展趋势的可靠方法。本研究揭示:全长江流域死亡长江江豚数量可能存在以6年为一个周期的变动规律。已有文献表明,长江江豚与鱼群分布有显著相关性,长江江豚可能具有随鱼群迁徙的行为特征。而鱼类的生命周期一般在3~4年,中华鲟等物种则要17 或18年。因此推测,饵料鱼类等生境因子的规律性波动可能导致死亡长江江豚数量年际周期性变动。
灰色理论认为数据是复杂的,但是有序且有整体功能的。同时,灰色理论建立的是生成数据模型,不是原始数据模型,因此,灰色预测的数据是通过生成数据的GM(1,1)模型所得到的预测值的逆处理结果。本研究结合聚类分析,对全长江流域死亡长江江豚数量灰色预测相对误差进行了理论探讨,不难发现,全长江流域死亡长江江豚数量“高峰年”作为灰色预测原始数据起始年份或末端年份,无法进行有效预测或效果相对较差,而全长江流域死亡长江江豚数量“高峰年”作为灰色预测原始数据中间年份,则预测效果相对较理想,但也存在10%左右的误差。该结果提示,影响全长江流域死亡长江江豚数量变动的原因多样且相对较复杂,亟需全面准确长期系统收集相关资料。本研究以期为长江江豚精准保护提供基础数据支撑。在聚类分析的基础上,灰色预测模型可相对较好地对全长江流域死亡长江江豚数量进行预测,但对于其年际周期性变动的判断是重要基础,对于“高峰年”处于起始年份或末端年份的预测需采取审慎的态度。