春玉米根系图像语义分割最佳分辨率和概率阈值研究
2023-07-11赵先丽李荣平王笑影谢艳兵温日红贾庆宇
赵先丽 蔡 福 李荣平 王笑影 谢艳兵 温日红 贾庆宇
(中国气象局沈阳大气环境研究所,辽宁 沈阳 110166)
根系作为作物的重要组成器官,是作物与土壤之间物质循环和能量交换的关键因子[1]。根系形态结构体现了作物生长发育的状态和对外界环境的适应性,可以直接反映根系的生长状态,间接反映作物对水分和养分的吸收情况,最终决定作物产量[2]。因此,根系形态结构研究有助于阐明作物地下生物量的分配和养分循环过程,在一定尺度可以反映气候、土壤和生物的总体特征[3],对提高作物生产潜力、养分和水分吸收利用效率意义重大[4-7]。
微根管法可以无损和原位观测根系的生长发育、形态、物候及整个生长过程,为根系形态参数、生物量、碳循环等方面的研究提供了便利[7-9]。观测获得根系图像的识别包括根对象的阈值化和对象量化两部分,主要通过不同方法手动、半自动或自动提取根系的信息[10],常用的根系图像识别软件,如WinRhizo、SmartRoot、RootGraph、Image J 和Adobe Photoshop 及网络根系分析平台等[11-12],在识别根系时主要以人眼识别和手描轮廓为主,可精确测量根系参数但工作量较大,尤其是对根系进行精细分级存在很大困难[11,13]。前人关于玉米(ZeamaysL.)根系的研究大多采用WinRhizo 软件进行分析,主要开展了根系分布[14-19]、构型[20-25]和形态参数[6,19,26-27]等方面的研究,但有关图像分割和根系统架构分析等研究较为薄弱[11]。
深度学习(deep learning,DL)方法已广泛应用于根系研究中,作为图像分割领域的重要分支,深度学习语义分割的出现为高分辨率图像分割提供了新方向[28]。U-net 语义分割是一种基于全卷积网络(fully convolutional networks,FCN)扩展的图像分割算法,是FCN 方法的改进,可精确分割图像中的根系[29]。根系图像分割时需提取根系与背景土壤的特征差异,此过程需对阈值进行有效选取,明确图像中像素点属于根系或背景土壤,从而形成二值图像,因此阈值对图像分割结果的影响较大[30]。图像分辨率对根系识别影响也较大,高精度数据和批量处理提高工作效率所需的分辨率不同,应根据不同作物和实际情况进行设定[31-33]。
已有研究多采用软件识别根系形态参数,而关于图像识别获得根系参数的可靠性和结果检验,以及作物各生育期根系形态特征指标的变化和不同级别根系数据分类提取的相关研究较少[31]。因此,本研究利用iRoot⁃V02 根系软件自动识别春玉米抽雄期总的和分级根系形态参数,探讨不同概率阈值和分辨率对根系形态参数的影响,旨在为进一步定量分析春玉米根系形态特征随生育进程的变化提供参考。
1 材料与方法
1.1 研究区概况
根系观测试验在辽宁省锦州玉米农田野外科学试验站(121°12′E,41°49′N,平均海拔17.0 m)进行,该地区属于典型的温带季风气候,年平均气温9.5 ℃,1 月平均气温-8.0 ℃,7 月平均气温24.4 ℃,年降水量565.9 mm,主要作物春玉米的生育期为5—9 月,土壤为典型棕壤[17-18]。
图1 大型根系观测系统地上作物种植区和地下根系观测室Fig.1 The crop planting areas and underground root observation rooms of large root observation system
1.2 试验设计
2018 年在种植小区播种春玉米中晚熟品种先玉335(国审玉2006026,行距40 cm,株距30 cm),生育期为128 d;利用CI-600 根系生长监测系统(CID Bio-Science Inc.,美国)进行观测,根系观测图像原始分辨率为300 dpi(460 pix×2 040 pix),根系观测日期和对应发育期见表1。
1.3 试验方法
1.3.1 根系图像处理流程 将根系图像输入基于U-net 神经网络模型[29,34-37]训练得到的根系图像处理模型中,模型将输入的根系图像分割成多个子图像,加入噪声,判断每个像素点是否为根系,分割后的子图像进入编解码器,经过多次融合过程,获得多个增强根系特征的子图像,再将多个子图像拼接成与根系图像大小相同的根系特征图像。根系特征图像即为根系概率分布图,图中每个像素值表示预测为根系的概率,像素值范围为0~255,值越大表示预测为根系的概率越大,反之越小。根据设定的根系概率阈值对根系概率分布图进行二值化处理,得到根系二值化图,如设定根系概率阈值为5,则将根系特征图像中像素值大于等于5的点作为根系像素点二值化为255,像素值小于5的点作为土壤像素点二值化为0,白色部分代表根系,黑色部分代表土壤。基于根系二值化图统计根系像素点数量,计算投影面积;对二值化图进行骨架抽取得到根系骨架图,基于根系骨架图提取根长、根直径和根尖数,根据根长和根直径计算根表面积和体积,并根据选取的根系直径分级指标再进行分级根系形态参数的计算(图2)[34]。
图2 基于深度学习的语义分割方法根系图像处理流程Fig.2 Flow chart of the root image semantic segmentation method based on deep learning
由于玉米根系主要集中分布在0~60 cm 深度土层中[38],因此本研究切割根系图像清晰部分进行分析,大小为4.07 cm×18.34 cm(300 dpi),主要探讨春玉米根系旺盛生长阶段抽雄期40 cm 深度的根总长、根总表面积、根总体积、根平均直径、根尖数及分级根长、分级根表面积、分级根体积等根系形态参数的变化。
1.3.2 不同概率阈值影响分析 采用Origin 软件对根系形态参数原值进行分析得到不同概率阈值曲线的拐点,作为春玉米根系图像适宜概率阈值选取的参考[39],先利用软件计算根系形态参数的一阶和二阶导数,并绘制原值曲线、一阶导数曲线和二阶导数曲线,然后利用纵向坐标读取工具选取y值一阶导数峰值和二阶导数最接近0的点即为曲线的拐点。
概率阈值设置见表2,采用根系形态参数原值和相邻两个概率阈值数据之差相对概率阈值5 的变化率来分析不同概率阈值对根系形态参数的影响,如概率阈值10与5变化率=(阈值10-阈值5)/阈值5×100.0%,概率阈值15 与10 变化率=(阈值15-阈值10)/阈值5×100.0%,以此类推。
表2 春玉米根系图像概率阈值和分辨率设置Table 2 Setting of probability thresholds and resolutions of the root image of spring maize
1.3.3 不同分辨率影响分析 根系图像原始分辨率为300 dpi,本研究通过降分辨率方法模拟扫描仪设置3种不同分辨率,分析4种分辨率根系图像对根系形态参数识别的影响(表2)。
1.3.4 根系分级方法 通常将植物根系以2.0 mm直径为界划分为细根和粗根,前人研究表明玉米以1.0 mm直径以下根系为主[11]。因此本研究采用根系软件识别根系图像时,选取0.1 mm 作为根系直径分级指标,然后将0.1 mm 直径分级数据采用0.5 mm、1.0 mm 和2.0 mm 等3个等级汇总数据进行分析。即:0.5 mm 等级,0.0~0.5 mm =0.0~0.1 mm+0.1~0.2 mm+…+0.4~0.5 mm,以此类推;1.0 mm 等级,0.0~1.0 mm=0.0~0.1 mm+0.1~0.2 mm+…+0.9~1.0 mm,以此类推;2.0 mm等级,0.0~2.0 mm=0.0~0.1 mm+0.1~0.2 mm+…+1.9~2.0 mm,以此类推。
面对现代科学的飞速发展,预防医学专业学生的学习不应局限于教科书中的书面知识,而是应该运用现代科学技术展开科研实验,探索环境卫生学中涉及到广大人类健康的问题[12]。以教师为中心的教学模式不能够从学生的主体性和独创性思维特征出发,不利于科研能力的培养与提高,不能满足社会对于多层次科研人才的需要。因此,在环境卫生学的实验教学中,以学生为中心的教学模式对本科生科研能力的培养至关重要。
采用分级根系占总根系的百分比进行分级根系数据分析,利用两个相邻阈值之间的百分比差值(如概率阈值10与5占总根系百分比的差值,概率阈值15与10占总根系百分比的差值,以此类推)分析不同概率阈值对根系形态参数的影响。结果表明,分级根长、分级根表面积、分级根体积占总根系形态参数百分比的变化趋势基本一致,因此本研究以根长为例进行分析。
1.4 数据处理
采用Microsoft Excel 2016 软件进行数据处理和作图,采用DPS 19.05 软件进行数据统计分析和相关分析,采用Duncan 法进行多重比较(P<0.01),采用iRoot-V02 根系自动识别软件识别根系形态参数和绘制根系二值化图,采用Origin 2019 软件进行曲线拐点分析。
2 结果与分析
2.1 不同概率阈值对根系形态参数的影响
2.1.1 总根系形态参数 由图3 可知,不同概率阈值对总根系形态参数原值的影响表现为:根总长、根总表面积、根总体积和根平均直径随概率阈值的增大均呈逐渐减小的趋势,根尖数则呈波动减小的变化趋势。总根系形态参数的变化率随概率阈值增大呈减小的变化趋势,其中根尖数波动幅度较大,根总长、根平均直径、根总表面积和根总体积分别在概率阈值20、25、30和35 之后变化趋于稳定,变化率在±1.0%以内,根尖数变化率则总体在±6.0%之间。
图3 春玉米抽雄期不同概率阈值总根系形态参数原值及其变化率Fig.3 Observed values and variation rates of the total root morphological parameters under different probability thresholds during the tasseling period of spring maize
概率阈值100 与5 之间总根系形态参数变化率表现为:根总体积变化率最大,达-86.5%,根总表面积变化率次之,为-72.7%,根平均直径、根总长和根尖数变化率分别为-48.9%、-46.6%和-24.4%(图4)。可见,概率阈值对春玉米根总体积影响最大,其次为根总表面积。
图4 春玉米抽雄期概率阈值100与5之间总根系形态参数变化率Fig.4 Variation rates of the total root morphological parameters between probability threshold 100 and 5 during the tasseling period of spring maize
将根系图像不同概率阈值二值化图与原图进行对比可见(图5),不同概率阈值之间根系形态参数存在明显差别。随着概率阈值的增大,根系数量逐渐减少,根系直径明显变细,与原图对比粗略可见,概率阈值20、30时的根系数量和粗细与原图较接近。
图5 春玉米抽雄期根系原图和不同概率阈值二值化图Fig.5 Original root image and binary images under different probability thresholds during the tasseling period of spring maize
不同概率阈值下春玉米抽雄期总根系形态参数(总根长、总根表面积、总根体积、平均直径和根尖数)原值和变化率的方差分析结果表明(表略),总根系形态参数在概率阈值5~20 之间较大,在概率阈值25 之后基本趋于稳定。
选取拐点较明显的春玉米拔节期、抽雄期、乳熟期和成熟期根总长变化率进行分析可见(表3),春玉米根总长变化率在概率阈值25或30处出现正负值拐点,其他根系形态参数拐点不明显(表略)。
表3 春玉米关键发育期不同概率阈值根总长变化率拐点Table 3 Inflection point of variation rates of total root length under different probability thresholds at during the key growth periods of spring maize
2.1.2 分级根系形态参数 由图6 可知,概率阈值对0.0~2.0 mm 直径不同等级根系的影响不同,对于0.5 mm 等级,相邻两个概率阈值0.0~0.5 mm 直径根长占总根长百分比的差值随概率阈值的增大而增大,在概率阈值25 或30 处较小;相邻两个概率阈值0.5~1.0、1.0~1.5 和1.5~2.0 mm 直径根长占总根长百分比的差值均随概率阈值增大而减小,在概率阈值30 之后变化基本趋于稳定。1.0 mm 等级:相邻两个概率阈值0.0~1.0 和1.0~2.0 mm 直径根长占总根长百分比的差值均随概率阈值的增大而减小,在概率阈值30 之后变化基本趋于稳定。2.0 mm 等级:相邻两个概率阈值0.0~2.0 mm 直径根长占总根长百分比的差值随概率阈值的增大而减小,在概率阈值30 之后变化基本趋于稳定。
图6 春玉米抽雄期不同概率阈值0.5 mm等级(A)、1.0 mm等级(B)和2.0 mm(C)等级根长占根总长的百分比差值Fig.6 Percentage difference of the 0.5 mm (A),1.0 mm (B) and 2.0 mm (C) graded root length to the total root length under different probability thresholds during the tasseling period of spring maize
概率阈值100 与5 之间分级根长占总根长百分比差值的变化如图7 所示:对于0.5 mm 等级,0.0~0.5 mm 直径根长占总根长百分比的差值为23.4%,0.5~1.0 mm直径百分比的差值为30.2%,1.0~1.5 mm直径百分比的差值为-45.9%,1.5~2.0 mm 直径百分比的差值为-6.1%。1.0 mm 等级,0.0~1.0 mm 直径根长占总根长百分比的差值为53.6%,1.0~2.0 mm 直径根长占总根长百分比的差值为为-52.0%。2.0 mm等级,0.0~2.0 mm 直径根长占总根长百分比的差值为1.6%,2.0~4.0 mm 直径根长占总根长百分比的差值为-1.6%(图略)。
图7 春玉米抽雄期概率阈值100与5之间0.5(A)和1.0 mm(B)等级根长占总根长百分比差值Fig.7 Percentage difference of 0.5( A) and 1.0 mm( B) graded root length to the total root length between probability threshold 100 and 5 during the tasseling period of spring maize
2.2 不同分辨率对根系形态参数的影响
综上可知,春玉米抽雄期根系形态参数在概率阈值25或30处变化趋于稳定,因此本研究选取概率阈值30 进行不同分辨率根系图像对根系形态参数的影响分析。
2.2.1 总根系形态参数 由根系形态参数原值可知(图8),根总长和根尖数随分辨率的减小而减小,根总表面积和根总体积均随分辨率减小呈先增大再减小的变化趋势,根平均直径随分辨率减小呈明显增大的趋势。与原始分辨率(300 dpi)相比,72 dpi 分辨率根总长变化率最大,达-89.6%,其次为145 dpi,根总长变化率为-36.2%;215 和145 dpi分辨率根总表面积变化率分别为10.2%、12.1%,72 dpi 分辨率根总表面积变化率为-68.4%;215和145 dpi根总体积变化率分别为40.0%、97.1%,72 dpi 分辨率根总体积与300 dpi 分辨率相同;215、145、72 dpi 分辨率根平均直径变化率分别为27.5%、75.1%和202.0%;215、145、72 dpi分辨率根尖数变化率分别为-24.9%、-59.2%和-94.6%。
图8 春玉米抽雄期不同分辨率图像根系总形态参数原值及其变化率Fig.8 Original value and variation rates of the total root morphological parameters under different image resolutions during the tasseling period of spring maize
随着根系图像分辨率的减小,图像处理时间逐渐减少,原始图像300 dpi分辨率处理一张图像约需6~7 s,215、145、72 dpi 分辨率分别需4~5、2~3、1~2 s,与原始图像处理时间相比分别缩短了29.1%、57.8%、71.5%。春玉米各生育期根系观测图像处理时间方差分析表明,300、215、145和72 dpi分辨率图像处理时间之间存在极显著差异(P<0.01)(表略)。
2.2.2 分级根系形态参数 对于根系分级数量,以选取的0.1 mm 根系直径分级指标进行根系分级。结果表明,随着分辨率的减小,根系分级数量明显增多,春玉米抽雄期300、215、145、72 dpi 分辨率根系分级分别为25、27、31、51级。方差分析表明,72 dpi分辨率与300、215、145 dpi 分辨率根系分级存在极显著差异(P<0.01)(表略)。
春玉米根长、根表面积和根体积等分级形态参数占总根系形态参数百分比的最大值表现为:随着根系图像分辨率的减小,百分比最大值出现时的根系直径变大。以0.5 mm 等级的根长为例,300和215 dpi分辨率百分比最大值出现时,直径为0.5~1.0 mm;145 dpi分辨率百分比最大值出现时,直径为1.0~1.5 mm;72 dpi分辨率百分比最大值出现时,直径为2.0~2.5 mm,其他根系形态参数变化类似(表4)。
表4 春玉米抽雄期不同分辨率根系图像分级根系形态参数占总根系形态参数百分比最大值Table 4 The maximum percentage of grading root morphological parameters in the total root morphological parameters under different resolutions during the tasseling period of spring maize
利用10 次根系观测数据建立300 dpi 与215、145和72 dpi 分辨率总根系形态参数之间的线性方程,结果表明,215 和145 dpi 分辨率与300 dpi 分辨率图像根系形态参数存在极显著(P<0.01)正相关关系,而72与300 dpi 分辨率根系形态参数相关性较小。根系分级数量仅在145 与300 dpi 分辨率间存在显著(P<0.05)正相关关系,其次为215 与300 dpi 分辨率的相关性较大,300与72 dpi分辨率的相关性最小(表5)。
表5 春玉米不同分辨率与300 dpi分辨率总根系形态参数线性方程和相关系数Table 5 Linear equations and correlation coefficients between the total root morphological parameters of spring maize under different resolutions and 300 dpi resolution
3 讨论
3.1 不同概率阈值根系形态参数的变化
本研究发现,不同概率阈值对春玉米总的和分级根系形态参数影响较大,因此利用不同根系软件识别作物根系形态参数时设置适宜的概率阈值非常重要,这与前人研究结果一致[31,34]。对于春玉米来说,本研究结果表明设定概率阈值25 或30 进行根系分析较适宜,但目前关于阈值设定,特别是不同根系识别软件阈值设定对玉米、水稻等主要作物根系形态参数影响的研究相对较少,今后应加强该方面研究。
3.2 不同分辨率根系形态参数的变化
本研究表明,高分辨率图像可以更清晰地识别根系和土壤,但一方面造成图像扫描和处理耗时较长,另一方面造成识别时背景噪音增多,使得识别的根尖数量和根长增大,根系平均直径减小,进而影响根系体积和表面积数据的准确性,这与前人研究结果一致[32,34]。此外,不同分辨率根系图像对根系分级数量影响较大,其中,72 dpi 分辨率较原始图像(300 dpi)根系分级数量增加了26 级,同时对总的和分级根系形态参数的识别结果影响也较大。可见,进行大量根系图像识别时,选取适宜的分辨率非常重要。
综上可见,图像概率阈值和分辨率对总的和分级根系形态参数结果影响较大。春玉米以1.0 mm 以下的根系比重较大,是根系水分和营养吸收的主要区域,但本研究仅选取0.1 mm作为根系直径分级指标,下一步需对更精细分级(如选取0.05 mm、0.02 mm 直径进行根系分级)情况下根系图像的概率阈值和分辨率对根系形态参数的影响进行深入研究,以确定不同根系图像概率阈值和分辨率对春玉米细根的影响。
4 结论
春玉米抽雄期总根系形态参数和分级根系形态参数随概率阈值增大均呈减小的趋势,且在概率阈值5~20 之间变化较大,概率阈值25 之后趋于稳定。0.5、1.0、2.0 mm 等级根系形态参数原值和变化率在概率阈值25 或30 后趋于稳定。随着根系图像分辨率的减小,根总长和根尖数呈减小的趋势,根总表面积和根体积均呈先增大后减小的趋势,根平均直径呈明显增大的趋势。215和145 dpi分辨率与300 dpi分辨率总根系形态参数之间存在较好的线性关系,72 dpi 分辨率与300 dpi 分辨率总根系形态参数之间相关性较差。因此,锦州地区春玉米根系图像识别最佳概率阈值为25或30;根系图像数量较少时最佳分辨率为300 dpi,图像数量较大时最佳分辨率为245 dpi。