2021-2022年鄱阳湖10种珍稀候鸟定点观测数据集
2022-10-08沈陆平方朝阳肖昕蔡振饶
沈陆平,方朝阳,2*,肖昕,2,蔡振饶,2
1.江西师范大学,地理与环境学院,南昌 330022
2.江西师范大学,鄱阳湖湿地与流域研究教育部重点实验室,南昌 330022
引 言
鄱阳湖(115°47"E~116°45"E,28°11"N~29°51"N)位于长江以南,江西省北部,是中国最大的淡水湖,也是长江中下游地区仅有的两个通江湖泊之一[1]。鄱阳湖处在东亚—澳大利亚候鸟迁徙路线上,是众多候鸟迁飞的必经之路,也是中国最重要的候鸟越冬地之一[2]。据相关统计,最少有14种濒危候鸟在此越冬,占其全球种群数目达1%及以上的越冬候鸟至少有27种,其中白鹤(Grus leucogeranus)作为IUCN极危物种、国家一级重点保护野生动物,每年来此越冬的数量超过其全球种群数目的 98%[3]。水鸟是湿地健康的晴雨表,是湿地生态系统中不可或缺的一部分,也是湿地健康评价的重要指标[4]。湿地是水鸟关键的栖息地和重要的觅食地,随着城市不断扩张和人为因素的干扰,鄱阳湖湿地水鸟生境面临着巨大的退化压力。因此,对鸟类进行监测与保护刻不容缓。
传统的鸟类种群监测方法依赖个人的经验来识别鸟类,虽然在一定程度上来说识别精度较高,但会耗费大量人力和时间,工作效率较低[5]。因此,精确、可靠、高效、低廉地对鸟类进行观测识别,具有重要的研究价值。这些年来随着人工智能技术的发展,计算机视觉在不同领域取得了长足进步,这为鸟类图像识别提供了技术支撑[6-7]。
当下,众多研究人员已在鸟类图像识别方面开展了相关研究工作。潘语豪等基于YOLOv3提出了一种针对农田鸟类的目标检测算法[8];石贵民针对武夷山九曲溪湿地鸟类构建了一个人机协同监测及识别系统[9];林菡等基于BP神经网络对闽江口湿地开展了鸟类物种识别研究[10];张晓伟等以湖北远安沮河湿地为例探讨了计算机视觉技术在鸟类监测识别系统中的应用[11]。但是,现有研究多是由作者来整理汇总鸟类图片,当前较为缺乏公共的鸟类数据集,特别是当前还没有鄱阳湖地区的珍稀鸟类数据集,这在很大程度上影响了鄱阳湖地区的鸟类保护工作。
现有的公开鸟类数据集例如CUB-200-2011,仅有鸟类图片信息,而没有与鸟类多样性相关的环境信息,本数据集对此进行了改进。针对当前鄱阳湖地区缺少可用于鸟类目标检测公共数据集的问题,本文依托鄱阳湖湿地生态综合数据库云平台,从候鸟珍稀程度和区域代表性这两个角度出发,以白鹤、鸿雁(Anser cygnoid)和小天鹅(Cygnus columbianus)等10种珍稀候鸟为研究对象,制作了一个包含23个字段的珍稀候鸟定点观测数据集,以期为研究人员开展鸟类目标监测与鸟类保护工作提供助益。
1 数据采集和处理方法
1.1 数据来源
鄱阳湖10种珍稀候鸟定点观测数据来源于由江西省林业局主导建立的“鄱阳湖湿地生态综合数据库云平台”(以下简称平台),数据起止时间为2021年12月7日至2022年3月5日,地理区域涉及3个地级市、7个县区、6个保护区。表1为部分监测点位名称及相关信息。
表1 部分监测点位基本信息Table 1 Basic information of some monitoring points
序号 监测点位名称 所属行政区 所属保护区 经纬度9 五星白鹤保护小区可见光 南昌市南昌县 五星白鹤保护小区 116°3176"E,28°7577"N 10 下山口 上饶市鄱阳县 无 116°4317"E,29°1084"N 11 大沔池 九江市都昌县 无 116°2521"E,29°2458"N 12 芦潭 九江市庐山市 无 115°9859"E,29°1848"N 13 插旗洲 上饶市余干县 无 116°4570"E,28°8346"N
1.2 数据采集方法
2021年12月7日至2022年3月5日,笔者对鄱阳湖湿地进行了为期88天的调查,在此期间随机选取时间对各个监测点位的画面进行截取,获取了白额雁(Anser albifrons)、白鹤、白琵鹭(Platalea leucorodia)、白头鹤(Grus monacha)、白枕鹤(Grus vipio)、东方白鹳(Ciconia boyciana)、黑鹳(Ciconia nigra)、鸿雁、灰鹤(Grus grus)、小天鹅等十种珍稀鸟类6 278张图片。各项环境数据由平台部署的监测站收集。表2为监测传感器主要参数。
表2 监测传感器主要参数Table 2 Main parameters of monitoring sensors
监测指标 监测传感器主要参数总磷测定原理:钼酸铵分光光度法量程:0~2 mg/L,可调零点漂移:±5%量程漂移:±10%直线性:±10%重复性:±10%检出限:≤0.01 mg/L MTBF ≥720 h/次实际水样比对试验:±10%氨氮测定原理:吸收光谱法波长范围:200~850 nm监测频率:可自定义监测频率,最高监测能力3分钟/次。检出限:0.1 mg/L零点漂移:±2% FS量程漂移:±2% FS重复性:±1% FS与标准方法的实际水样比对:±20%pH值测定原理:玻璃电极法量程:pH 0~14(0~40 ℃),可调漂移(pH=4、7、9):±0.1 pH重复性:±0.1 pH响应时间:≤30 s温度补偿精度:±0.1 pH MTBF:≥720 h/次叶绿素a量程范围:0~400 ug/L或0~100 RFU分辨率:0.1 ug/L防护等级:IP68最深深度:水下10米温度范围:0~50℃溶解氧测量范围:0~20 mg/L;0~60 ℃分辨率:0.01 mg/L;0.1 ℃精度:±0.5% FS;±0.3 ℃温补范围:自动0~60 ℃
1.3 数据处理方法
本数据集从4个角度设置了23个字段,包括图片、中文名、拉丁学名、国内保护级别、IUCN濒危等级等基本属性字段,监测点位名称、经纬度、摄制时间、所属保护区名称、保护区级别、所属行政区等时空属性字段,行为、是否成年等自身属性字段,及生境、气温、气压、水温、总氮、总磷、氨氮、pH值、叶绿素a、溶解氧等环境属性字段。在本数据集中,各个物种的中文名和拉丁学名的使用参考《世界鸟类分类与分布名录》[12]和《国家重点保护野生动物名录》[13]等著作,国内保护级别参考《国家重点保护野生动物名录》,IUCN濒危等级参考IUCN红色名录[14],时空属性字段数据均取自平台,行为包括觅食、游走、休憩、理羽、警戒、飞行等,是否成年参考各类著作及相关论文[15],生境类型包括湖泊、浅滩、草洲、泥滩、泛滥地、裸地等天然生境以及池塘、灌溉地等人工生境,其余环境属性字段数据均取自平台。
2 数据样本描述
2021-2022年鄱阳湖10种珍稀候鸟定点观测数据集数据包括6 278条记录,包括基本属性、时空属性、自身属性、环境属性4类属性。每种鸟类搜集的数据量如图1所示,其中东方白鹳数据量最多,黑鹳数据量最少。基本属性包括图片、中文名、拉丁学名、国内保护级别、IUCN濒危等级5个字段,时空属性包括监测点位名称、经纬度、摄制时间、所属保护区名称、保护区级别、所属行政区6个字段,自身属性包括行为、是否成年2个字段,环境属性包括生境、气温、气压、水温、总氮、总磷、氨氮、pH值、叶绿素a、溶解氧10个字段,总计23个字段。
表3-表6为按照这4类属性划分的5条样例数据(白鹤、东方白鹳、白枕鹤、小天鹅、鸿雁)。
图1 各鸟类数据量图Figure 1 Data size diagram of the 10 bird
表3 基本属性样例数据Table 3 Sample data of basic attributes
序号 图片 中文名 拉丁学名 国内保护级别 IUCN濒危等级2东方白鹳 Ciconia boyciana 一级 濒危(EN)3白枕鹤 Grus vipio 一级 易危(VU)4小天鹅 Cygnus columbianus 二级 无危(LC)5鸿雁 Anser cygnoid 二级 易危(VU)images/BZ_329_520_360_784_583.pngimages/BZ_329_517_636_781_897.pngimages/BZ_329_520_936_784_1121.pngimages/BZ_329_520_1130_784_1322.png
表4 时空属性样例数据Table 4 Sample data of spatio-temporal attributes
表5 自身属性样例数据Table 5 Sample data of selfood attributes
表6 环境属性样例数据Table 6 Sample data of ambient attributes
3 数据质量控制和评估
在数据收集阶段,我们对所有的原始数据进行了保存,便于后期的数据核对。我们邀请生物学专家进行了相关鸟类物种鉴别的培训,所有数据收集人员均在培训合格后再开始数据的收集工作,收集完毕后再由2位专业人员进行数据核对。在数据处置阶段,所有鸟类物种的鉴别严格参考了各类著作及相关论文上的分类特征描述,一切存疑的鉴别均由专家确认。在本数据集中,所有的环境数据均采自平台部署的监测站,在监测阶段,由长期在各个保护区工作的专业人员对监测仪器设备进行使用和维护。本文通过以上方式来确保数据的准确性。
4 数据价值
本数据集的价值体现在:一是针对当前鄱阳湖地区缺少公共的可用于鸟类识别的数据集的问题,构建了一个包括6 278条记录的鄱阳湖10种珍稀鸟类数据集,有利于促进鄱阳湖地区开展鸟类目标检测工作,改善鸟类保护工作;二是兼顾了部分学者对鸟类行为数据的需要[16],针对当下没有公共的鸟类行为数据集的问题,进行了鸟类行为的分类,有助于学者开展鸟类行为识别研究;三是参考相关论文[17-19]补充了与水鸟有关的环境数据,有益于学者开展水鸟多样性与环境因子的相关性研究,为水鸟多样性保护及湿地生态修复提供科学依据。本数据集可为从事上述研究的学者提供基础数据支撑,亦可为鸟类爱好者与管理人员提供珍稀鸟类频繁出没的地点信息,便于观察和保护。