基于逻辑回归算法的复杂背景棉田冠层图像自适应阈值分割
2017-07-18刘立波程晓龙戴建国赖军臣
刘立波,程晓龙,戴建国,赖军臣
基于逻辑回归算法的复杂背景棉田冠层图像自适应阈值分割
刘立波1,程晓龙1,戴建国2,赖军臣3※
(1. 宁夏大学信息工程学院,银川 750021;2. 石河子大学信息科学与技术学院,石河子 832000; 3. 新疆五家渠市农业局,五家渠 831300)
棉田冠层覆盖度是监测棉田棉花长势的重要指标,针对棉田复杂环境中冠层图像难以准确分割的问题,该文提出了一种基于逻辑回归算法的复杂背景棉田冠层图像自适应阈值分割方法。首先将棉田冠层图像像素分成叶片冠层和地表背景2类,在HSV颜色空间中分别提取两类像素的H通道值,在RGB颜色空间中分别提取绿色占比值(G/(G+R+B))作为颜色特征;再利用逻辑回归算法确定出各颜色特征的分割阈值,通过H通道分割阈值实现图像的初次分割;再对初次分割结果中的低亮像素使用逻辑回归算法计算出的超绿特征阈值进行低亮像素分割,同时采用绿色占比分割阈值对图像高亮像素及低亮像素分割结果整体实现二次分割,最后采用形态学滤波方法对分割结果进行优化。为评价该分割方法,利用从新疆棉花产区采集到的320幅棉田冠层图像进行试验。结果表明,该方法可在棉田复杂自然背景下,有效分割出棉田冠层区域,平均相对目标面积误差率仅为5.46%,总体平均匹配率达到93.07%;优于超绿特征OTSU分割方法(平均相对目标面积误差率11.78%,总体平均匹配率76.43%)、四分量分割方法(平均相对目标面积误差率24.11%,总体平均匹配率71.67%)、显著性分割方法(平均相对目标面积误差率36.92%,总体平均匹配率66.92%)。该方法的平均处理时间为4.63 s,相对于超绿特征OTSU法(3.84 s)和四分量分割法(2.56 s),耗时多一些,但与显著性分割法(6.25 s)对比,花费时间要少。研究结果可为棉田自然复杂环境下机器视觉技术监测棉花覆盖度提供一种有效途径。
算法;棉花;图像分割;逻辑回归; 自适应阈值
0 引 言
棉花是中国重要的经济作物,是国家重要的战略物资。棉花在不同的生长发育阶段,根据长势动态及时采取有效的水肥和化学调控措施,是棉花获得理想产量的技术保障。目前利用卫星遥感监控棉田叶面积指数和覆盖度是行之有效的手段[1-3]。卫星遥感技术虽然可以实现宏观棉花长势的监测,但该技术受卫星轨道周期和影像分辨率的制约,获取棉花长势信息的实时性和精度受到限制,难于在生产实际中大面积推广。高效、低成本的无人监测棉田棉花长势的信息化技术,是棉田生产信息化重要组成部分。机器视觉因其具有全天候、全方位采集处理信息的能力,已广泛应用于农业领域[4-6]。
监测棉田常用的群体特征参数包括冠层覆盖度、群体叶面积指数等,其中冠层覆盖度获取技术相对简单,在棉田应用较为广泛[7]。用机器视觉获取棉花群体覆盖度,分割棉田冠层图像中冠层区域是其中的关键环节,分割的精准度直接影响到之后覆盖度计算是否准确。常用的分割方法包含阈值分割法、颜色聚类法,以及显著性分割法等[8-9]。虽然前人已经做了大量的研究,但还是没有一种能广泛适用的分割方法。因此,研究复杂环境下的自适应图像分割方法是当前图像分割领域的一项重要内容。自适应分割方法研究目前主要包含两个方面:一个是利用机器学习技术,另一个是利用视觉显著性技术[10-15]。周俊等[16]通过K均值聚类获得训练样本,利用支持向量机设计出了一种自适应阈值的分割方法,有效提高了分割过程中差异性适应的问题。Bai等[17]提出一种利用分水岭变换结合NystrÖm扩展谱聚类算法实现了玉米苗图像的分割。周强强等[18]基于水平集和视觉显著性提出了一种植物病害叶片图像分割算法,效果较好。任守纲等[19]提出了一种基于显著性检测的黄瓜叶部病害图像分割算法,有效解决了冗余分割问题。Cheng Mingming等[20]研究出一种基于视觉显著性的图像分割算法,该算法自适应性强、分割效果好,但该算法在处理效率方面不尽如人意。上述研究在各自的应用领域都取得了一定的效果,但是算法复杂度较高,实际应用较为困难。
逻辑回归算法是当前研究中比较常见的机器学习算法。该算法通过计算训练样本获取预测参数,根据预测参数和预测函数计算出数据分割超平面以实现数据的分类。作为常见的机器学习算法,由于其算法效率高,现已广泛应用于分类预测领域[21-23],但在农业图像处理领域还未见报道。本文在分析自然复杂环境条件下棉田冠层图像特点的基础上,提出一种基于逻辑回归算法的自适应棉田冠层图像分割方法,以期为后续棉花长势的自动化监测打下一定的基础。
1 图像采集
试验于2016年4月-7月在新疆第六师五家渠垦区棉花试验田进行。根据当地时间,选择天气条件良好的晴空,选取5块棉花条田,利用Canon EOS5D数码照相机在自然环境光照条件下随机拍摄不同生长时期(苗期(4月25日-5月25日)、蕾期(5月26日-6月25日)、花期(6月26日-7月15日)、花铃期(7月16日-7月31日))的棉田冠层图像共计320幅,每个生长时期80幅。数码相机安装在三脚架上,距地面约1.5 m,镜头垂直地面进行拍摄。拍摄图像分辨率为6 912×3 416像素,为降低图像处理复杂度,提高处理效率,本文中所有试验采用的图像尺寸均调整为1 728×1 152像素。
2 基于逻辑回归算法的自适应阈值分割方法
棉田群体图像的背景区域(土壤部分)与目标区域(叶片冠层)颜色对比较明显,因此本文考虑利用颜色特征对棉田冠层图像进行分割,处理流程分为两个主要步骤,如图1所示。1)阈值获取:针对现有图像中目标和背景2类像素,首先在HSV颜色空间中人为提取出2类像素的色调H分量,然后在RGB颜色空间中计算2类像素典型的绿色占比值(G/(R+G+B))值。2)图像分割:利用逻辑回归算法计算出H通道特征的分割阈值实现首次分割,接着采用超绿特征阈值对低亮区域进行分割,采用绿色占比阈值对高亮区域及上述分割结果进行二次分割,最后通过形态学方法对分割结果进行优化。
图1 棉田冠层图像阈值获取分割方法流程图
2.1 颜色特征选择
棉田冠层覆盖度是通过计算分割获得的冠层图像像素数占整个图像像素数的百分比来表示的[24]。然而棉田自然环境下获取的棉田冠层图像由于图像背景复杂、光照强度不均匀、阴影遮挡等实际情况,导致分割效果较差,对覆盖度计算的准确性造成很大影响。
为准确描述棉田自然复杂环境下的棉田冠层图像,将图像分为光照冠层,阴影冠层;光照土壤,阴影土壤4部分。在HSV颜色空间中,由于H(色调)、S(饱和度)、V(亮度)三通道相互独立,互不影响,且H分量对光照不敏感,同时棉田冠层目标像素与背景像素在H特征上有一定差距,因此引入H通道特征作为本文使用的颜色特征之一。在每一幅棉田冠层图像的H通道上,通过采样光照土壤和阴影土壤像素点各20个共计40个数据构造背景数据集;采样光照冠层和阴影冠层像素点各20个共计40个数据构造目标数据集,运用逻辑回归算法计算2个数据集的分割阈值分别为24和66.5。通过对H通道特征值进行分析,发现光照冠层像素,阴影冠层像素,部分阴影土壤包含在H高值区域,光照土壤像素,阴影土壤像素,部分阴影冠层包含在H低值区域,如图2a、图2b所示。目标图像大部分H通道值范围在24~66.5之间,而背景区域H通道值范围在0~24或者66.5~180之间,由此获得H通道值阈值范围。但是,以H通道值像素作为颜色特征虽然能实现大部分目标像素的分割,结果却并不是非常理想,还存在一定的分割误差,而且在复杂背景下也存在假目标像素的情况。主要问题集中于土壤阴影和冠层阴影这样的低亮度像素区域,因此还需要结合其他颜色特征再次分割以达到更好的效果。
关于棉田冠层图像目标低亮像素定义,前人已经进行了一定的研究。研究结果表明在RGB颜色空间中对于绿叶部分,如果像素R+G+B>=200,则为阴影叶片像素;而对于土壤部分,如果R+G+B<=250,则为阴影土壤[25]。对该部分图像像素进行研究后发现,该部分像素的图像分割可采用超绿特征完成。超绿特征(excess green,Exg)同时也是农作物图像分割中广泛使用的颜色特征[26-27],分割效果较好。但由于该特征对光照较为敏感而不适合复杂背景条件下的分割。由于之前利用H通道特征已经实现了对大部分背景像素的去除,因此本文采用超绿特征对初次分割结果中的低亮像素进行分割,优化初次分割结果,如图2c所示。
在经过上述分割操作之后,发现得到的分割结果中叶片周围还存在一些错误的分割像素。为了保证之前分割结果不被破坏,采用绿色占比(G/(R+G+B))对分割结果进一步优化,如图2d所示。
选取不同棉田、不同生长时期(苗期、蕾期、花期、花铃期)、不同覆盖度的棉田冠层图像各10幅,共计40幅重复上述步骤,颜色特征均满足上述计算结果。
2.2 逻辑回归算法
逻辑回归算法是机器学习领域中经常采用的监督学习算法。与其他监督学习算法类似,逻辑回归算法也是对经人工标记的训练数据进行学习之后再迭代优化寻找最优划分的过程。对于一个数据集的分类问题,需要计算该数据集的分割超平面。
注:人为自定义变量为利用逻辑回归算法计算单一特征分割超平面所需变量,为减少人为干扰,将该变量值设定为1。下同。
Note: Artificially defined independent variable is used to compute a single feature hyperplane by using a logistic regression algorithm. In order to reduce the human disturbance, this variable value is set to 1. Same as below.
图2 棉田冠层图像颜色特征散点图
Fig.2 Cotton canopy image color feature scatter plot
其中x为实例中的第个属性,代表第个属性对应的系数形成的矢量,代表分割超平面的偏差参数。那么对应的逻辑回归分类模型为
其中表示以和为自变量的函数值。为能获得分类效果最优的分割超平面,需要结合训练样本实例x和样本对应的类别标签y得到最优的参数,为此引入代价函数()
(3)
为求解逻辑回归问题,需要求得最优参数使得代价函数最小,对此本文采用梯度下降算法迭代计算最优参数,迭代计算公式为
其中θj等表示第j个分割超平面系数,表示梯度下降算法中的学习率。本文在使用逻辑回归算法中将颜色特征分别表示如下的形式作为训练集:x={(1, x1),(1, x2),…, (1,xn)}为样本集的形式,内容是颜色特征数值,y={y1, y2, y3,…,yn}为样本集对应类别标签的形式。将样本集和训练类别标签结合来训练计算对应颜色特征的分割超平面。其中在样本集中为了对单一特征实现分割,引入人为自变量将其值设定为1,可得到平行于坐标轴的分割超平面。本文通过计算H通道值阈值范围、超绿特征阈值以及绿色占比阈值,获得不同颜色特征的分割超平面,利用该超平面与坐标轴的交点纵坐标来获得对应特征的分割阈值,实现了图像分割的自适应阈值获取过程。选取40幅棉田冠层图像,在每幅图像中选择背景和冠层像素各20个作为训练像素点,以每个像素点的H通道高区域和低区域特征值、低亮像素超绿特征值、绿色占比特征值分别形成4个颜色特征训练集。将这4个训练集中的数据分别输入到LR(Logistic Regression)分类器中进行训练,训练后得到的分割超平面如图3所示,计算出的分割阈值为:H值高区域特征值分割阈值为66.5,H值低区域特征值分割阈值为24,超绿特征值分割阈值为15,绿色占比特征值为0.355。
2.3 数学形态学滤波
在冠层图像分割过程中,由于存在阈值误差等原因,使得分割结果图像的部分区域存在空洞、毛刺和孤立点等错误分割情况,可采用形态学滤波方法[28-29]对分割结果进行优化。本文在试验过程中采用8×8大小的椭圆形结构元素,采用先闭运算再开运算[28-29]的方法实现去除毛刺、清除孤立点、填充图像孔洞优化分割结果,最终得到目标图像。
3 试验设计与结果分析
3.1 试验环境
为了验证本文方法在棉田自然复杂环境下对不同田块、不同生长周期棉田冠层图像分割的有效性,继而将本文方法与超绿特征OTSU分割方法、四分量分割方法、显著性分割方法的分割效果进行性能对比分析来选取最佳方法,试验平台选择如下:硬件环境采用IntelCore i5-3230M处理器、2.6 GHz主频、4 GB内存的计算机。软件环境采用采用Win10操作系统,选择python2.7做为开发语言,计算机视觉开发库(OpenCV)版本号为2.4.9。
3.2 试验结果与分析
在5块棉花条田所拍摄的320幅图像中,选取苗期、蕾期、花期、花铃期4个不同生长时期、不同覆盖度的棉田冠层图像,每一个生长周期选取60幅,共计240幅图像作为试验样本,每幅图像分辨率为1 728× 1 152像素,冠层可能茂密或者稀疏,也会存在光照均匀或者不均匀的情况。试验目标为在棉田复杂自然环境下,准确有效地分割出冠层图像。
图4a表示以苗期、蕾期、花期、花铃期4个不同生长时期的典型图像作为待试验图像。图4b表示4个不同生长时期棉田冠层图像各自利用H通道阈值进行分割的结果;图4c表示各棉田冠层图像利用超绿特征和绿色占比进行二次分割的分割结果;图4d表示利用形态学滤波对分割图像优化后的结果。从图4d的分割结果可以看出基于逻辑回归算法的自适应阈值分割方法结合形态学滤波操作能够较好地从棉田复杂自然环境下分割出较完整的棉田冠层区域。
注:1,2,3,4依次为苗期、蕾期、花期和花铃期。下同。
3.3 算法评价与分析
试验选取采用超绿特征OTSU分割方法、四分量分割方法[30]、基于人类视觉注意,适用范围广泛的显著性分割方法[31-34]共计3种方法,与本文的分割方法在棉田冠层图像分割效果上进行对比。在320幅图像中选取苗期、蕾期、花期、花铃期4个不同生长时期、覆盖度不同的棉田冠层图像,每个时期选取20幅,共计80幅进行验证。在对整个验证集进行试验后,选择验证集中部分图像的部分试验进行对比分析,如图5所示。
从4种方法的分割结果可以看出,在棉田复杂自然条件下,超绿特征OTSU分割方法虽然是常用的棉田冠层图像分割方法,但当地面背景复杂,光照强度不一时,分割效果欠佳,如图5c所示;四分量分割方法虽能大体保留冠层的区域信息,但该方法对覆盖度较高的图像分割效果较差,同时有一定错误分割,无法完整分割出冠层区域,如图5d所示。显著性分割方法的适应性较差,不同图像间的分割效果差异较大,部分冠层区域没有分割出来,同时出现一定的错误分割,如图5e所示。而本文方法能够在分割过程中保证每个生长时期的冠层区域完整性,取得了较好的分割效果,为利用棉田冠层覆盖度监测棉花长势提供数据基础。
3.4 性能指标评价
为进一步客观评价本文方法的有效性,采用相对目标面积误差率(relative object area error,RAE)和平均匹配率()对分割质量进行定量评价,分别如式(5)和式(6)所示。
(6)
式中A为参考图像的目标区域面积;A是测试图像的目标区域面积,面积用目标区域像素个数来表示,为样本图像数目。参考图像是由人工通过photoshop手动获得,这两个图像分割结果评价指标的取值范围都是0~100%。其中平均面积相对误差率值越小表示分割效果越好,平均匹配率值越大表示分割效果越好,反之则效果越差。
3.5 图像分割性能评价定量结果分析
表1展示了在棉田复杂自然环境下,不同方法应用于棉田冠层图像分割的平均相对目标误差率和总体平均匹配率,每一种评价指标包含了80幅图像的平均结果。从分割性能的平均指标来看,本文方法的平均相对目标面积误差率、总体平均匹配率相较于其他方法有明显的优势。超绿特征OTSU分割方法、四分量分割方法、显著性分割方法的平均相对面积误差率分别为11.78%、24.11%、36.92%,而本文方法的平均相对目标误差率为5.46%,较其他方法有显著提高;在总体平均匹配率方面,超绿特征OTSU分割方法、四分量分割方法、显著性分割方法的总体平均匹配率为76.43%、71.67%,66.92%,而本文方法的总体平均匹配率为93.07%;
表1同时展示了参加对比试验的不同方法在80幅验证图像上的平均处理时间,从时间指标来看,超绿特征OTSU分割方法、四分量分割方法、显著性分割方法的平均处理时间分别为3.84 s、2.56 s、6.25 s,而本文方法的平均处理时间为4.63 s。本文方法比超绿特征OTSU法和四分量分割法要耗时一些,但分割效果远好于两者;比显著性分割法花费时间要少且分割效果好。综合评价,本文方法在分割性能指标和分割效果整体优于其他3种分割方法。
表1 不同方法分割棉田冠层图像的性能比较
4 结 论
为了监测自然复杂环境下棉田冠层覆盖度情况,本文进行了复杂背景棉田冠层图像分割研究。以不同棉田、苗期、蕾期、花期、花铃期4个不同生长时期、覆盖度不同的320幅棉田图像作为试验材料,利用基于逻辑回归算法的自适应阈值分割方法对复杂背景棉田冠层图像进行了分割。试验结果表明:1)本文方法能够适应不同生长时期(苗期、蕾期、花期、花铃期)棉田冠层图像的分布特点,准确分割出各个生长周期的冠层图像,环境适应性强,表现出良好的自适应性;2)本文方法能够在棉田复杂自然背景下,有效分割出棉田冠层区域,对比各分割方法的平均面积相对误差率,超绿特征OTSU分割方法(11.78%)、四分量分割方法(24.11%)、显著性分割方法(36.92%),本文方法仅为5.46%,具有良好的分割效果;3)本文方法能够适应复杂背景棉田冠层图像的分布特点,克服棉田复杂背景干扰,对比棉田冠层图像分割的总体平均匹配率,超绿特征OTSU分割方法(76.43%)、四分量分割方法(71.67%)、显著性分割方法(66.92%),本文方法为93.07%,和原图匹配率最高。从分割效果、平均面积相对误差率、总体平均匹配率、平均处理时间等综合指标来看,本文的方法最佳。
因此,本文的基于逻辑回归算法的自适应阈值棉田冠层图像分割方法能够在棉田复杂环境下,较为准确地将冠层从棉田复杂背景分割出来,可为实时监测棉花覆盖度提供一种无损有效的技术支持。
[1] 辛海强,冯志敏. 棉花种植区卫星遥感监测研究[J]. 测绘与空间地理信息,2014,37(2):26-27. Xin Haiqiang, Feng Zhimin. Satellite remote sensing monitoring research of cotton planting area[J]. Geomatics & Spatial Information Technology, 2014, 37(2): 26-27. (in Chinese with English abstract)
[2] 刘晓晨.基于Landsat8 遥感数据的棉花长势快速监测[J]. 新疆农业科技,2015,37(6):50. Liu Xiaochen. Cotton grows fast monitoring based on Landsat8 remote sensing data[J]. Xinjiang Agricultural Science and Technology, 2015, 37(6): 50. (in Chinese with English abstract)
[3] Bai J H, Li J, Li S K, et al. Monitoring the cotton growth conditions based on lai from remote sensing and expert knowledge[J]. Advanced Materials Research, 2011, 317-319: 1050-1057.
[4] 王风云,郑纪业,唐研,等.机器视觉在我国农业中的应用研究进展分析[J].山东农业科学,2016,48(4):139-144. Wang Fengyun, Zheng Jiye, Tang Yan, et al. Analysis on application and research progress of machine vision in agriculture in china[J]. Shandong Agricultural Science, 2016, 48(4): 139-144. (in Chinese with English abstract)
[5] 冯康.基于机器视觉的棉花识别与定位技术的研究[D]. 石河子:石河子大学,2015. Feng Kang. Research on the Technology of Cotton Recognition and Localization Based on Machine Vision[D]. Shihezi: Shihezi University, 2015. (in Chinese with English abstract)
[6] 王建仑.田间叶片图像分割与单幅三维重建的机器视觉算法研究[D].北京:中国农业大学,2013. Wang Jianlun. Study on Field Leaf Image Segmentation and 3d Reconstruction From a Single Image Machine Vision Algorithms[D]. Beijing: China Agricultural University, 2013. (in Chinese with English abstract)
[7] 冀高.基于数字图像处理的棉花群体特征提取[D].北京:北京邮电大学,2007. Ji Gao. Acquired Population Features of Cotton Image Based on Digital Image Processing[D]. Beijing: Beijing University of Posts and Telecommunications, 2007. (in Chinese with English abstract)
[8] 史晓楠,欧阳震.图像分割常用方法综述[J].科技视界,2014,4(33):33. Shi Xiaonan, Ouyang Zhen. Review of common methods of image segmentation[J]. Science and Technology Vision, 2014, 4(33): 33. (in Chinese with English abstract)
[9] Gurjeet K S, Rajneer K. Review on recent image segmentation techniques[J]. International on Computer Science and Engineering, 2013, 5(2): 109-112.
[10] 高理文,林小桦.基于L*a*b* 彩色空间和局域动态阈值的药用植物叶片图像分割[J].计算机应用与软件,2014,31(1):233-235. Gao Liwen, Lin Xiaohua. Segmentation of images of medicinal plant leaves based on L*a*b* color space and local dynamic threshold[J]. Computer Applications and Software, 2014, 31(1): 233-235. (in Chinese with English abstract)
[11] 王献锋,王震,王旭启,等.基于SVM和形态学的作物病班图像分割方法[J].吉林农业科学,2015,40(1):51-53,60. Wang Xianfeng, Wang Zhen, Wang Xuqi, et al. Crop spot image segmentation based on SVM and morphology[J]. Journal of Jilin Agricultural Sciences, 2015, 40(1): 51-53, 60. (in Chinese with English abstract)
[12] Yang Najuan, Wang Huiqin, Ma Zongfang. Fire detection in image type algorithm based on support vector machine[J]. Computer Application, 2010, 30(4): 1129-1131.
[13] Vandenbroucke N, Macaire L, Postaire J G, et al. Color image segmentation by pixel classification in an adapted hybrid color space: Application to soccer image analysis[J]. Computer Vision and Image Understading, 2003, 90(2): 190-216.
[14] Jaware T H, Badgujar R D, Patil P G. Corp disease detection using image segmentation[J]. World Journal of Science and Technology, 2012, 2(4): 190-194.
[15] Chen S C, Zhang D Q. Robust image segmentation using from with spatial constraints based on new kernel-induced distance measure[J]. IEEE Trans on Systems, Manand Cybernetic, 2004, 34(4): 1907-1916.
[16] 周俊,王明军,邵乔林.农田图像绿色植物自适应分割方法[J].农业工程学报,2013,29(18):163-170. Zhou Jun, Wang Mingjun, Shao Qiaolin. Adaptive segmentation of field image for green plants[J]. Transaction of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(18): 163-170. (in Chinese with English abstract)
[17] Bai X D, Cao Z G, Wang Y, et al. Crop segmentation from images by morphology modeling in the cie lab color space[J]. Computers and Electronics in Agriculture, 2013, 99: 21-34.
[18] 周强强,王志成,赵卫东.基于水平集和视觉显著性的植物病害叶片图像分割[J].同济大学学报:自然科学版,2015,43(9):1407-1413. Zhou Qiangqiang, Wang Zhicheng, Zhao Weidong. Plant disease image segmentation based on levelset and visual saliency[J]. Journal of Tongji University:Natural science, 2015, 43(9): 1407-1413. (in Chinese with English abstract)
[19] 任守刚,陆海飞,袁培森,等.基于显著性检测的黄瓜叶部病害图像分割算法[J].农业机械学报,2016,47(9):11-16. Ren Shougang, Lu Haifei, Yuan Peisen, et al. Segmentation algorithm of cucumber canopy disease image based on saliency detection[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(9): 11-16. (in Chinese with English abstract)
[20] Cheng Mingming, Lin Wenyan, Zheng Shuai, et al. Efficient salient region detection with soft image abstraction[C]// International Conference on Computer Vision Theory and Applications. IEEE, 2013: 1529-1536.
[21] 伊雯雯.基于多维组合逻辑回归模型的广告点击率预测[J]. 通信技术,2016,49(9):1221-1228. Yi Wenwen. Click through rate prediction of advertisements based on logistic regression model with multidimensional features combination[J]. Communications Technology, 2016, 49(9): 1221-1228. (in Chinese with English abstract)
[22] Lin Y, Deng X, Li X, et al. Comparison of multinomial logistic regression and logistic regression: Which is more efficient in allocating land use[J]. Frontiers of Earth Science, 2014, 8(4): 512-523.
[23] Munshi T, Zuidgeet M, Brussel M, et al. Logistic regression and cellular automata-based modeling of retail, commercial and residential development in the city of Ahmedabad India[J]. Cities, 2014, 38(2): 88-101.
[24] 贾彪,马富裕.基于机器视觉的棉花氮素营养诊断系统设计与试验[J].农业机械学报,2016,47(3):306-310. Jia Biao, Ma Fuyu. Design and experiment of nitrogen nutrition diagnosis system of cotton based on machine vision[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(3): 306-310. (in Chinese with English abstract)
[25] 贾彪.基于计算机视觉技术的棉花长势监测系统构建[D]. 石河子:石河子大学,2014. Jia Biao. Establishment of System for Monitoring Cotton Growth Based on Computer Vision Technology[D]. Shihezi: Shihezi University, 2014. (in Chinese with English abstract)
[26] 袁加红,朱德泉,孙丙宇,等.基于机器视觉的水稻秧苗图像分割[J].浙江农业学报,2016,28(6):1069-1075. Yuan Jiahong, Zhu Dequan, Sun Bingyu, et al. Machine vision based segmentation algorithm for rice seeding[J]. Acta Agriculturae Zhejiangensis, 2016, 28(6): 1069-1075. (in Chinese with English abstract)
[27] Meyer G E, Neto J C. Verification of color vegetation indices for automated crop imaging applications[J]. Computer and Electronics in Agriculture, 2008, 63(2): 282-293.
[28] 王萍,唐江丰,王博,等.基于数学形态学的植物叶片图像分割方法研究[J].浙江农业学报,2012,24(3):509-513. Wang Ping, Tang Jiangfeng, Wang Bo, et al. Image segmentation of plant leaves based on mathematical morphology[J]. Acta Agriculturae Zhejiangensis, 2012, 24(3): 509-513. (in Chinese with English abstract)
[29] Jourlin M, Laget B, Matheron G, et al. Image Analysis and Mathematical Morphology[M]. London: Academic Press, Inc, 1988.
[30] 王方永,王克如,李少昆,等.利用数字图像估测棉花叶面积指数[J].生态学报,2011,31(11):3090-3100. Wang Fangyong, Wang Keru, Li Shaokun, et al. Estimation of canopy area index of cotton using digital imaging[J]. Acta Ecologica Sinica, 2011, 31(11): 3090-3100. (in Chinese with English abstract)
[31] 李璐,温静,王文剑.基于视觉显著性的目标分割算法[J]. 计算机科学与探索,2016,10(3):398-406. Li Lu, Wen Jing, Wang Wenjian. Image segmentation algorithm based on visual saliency[J]. Journal of Frontiers of Computer Science and Technology, 2016, 10(3): 398-406. (in Chinese with English abstract)
[32] Felzenszwalb P F, Hutten locher D P. Efficient graph-based image segmentation[J]. International Journal of Computer Vision, 2004, 59(2): 167-181.
[33] Yang W Z, Li D L, Wang S L. Saliency map based color image segmentation for foreign detection[J]. Mathematical and Computer Modelling, 2013, 58(3/4): 457-468.
[34] Imamoglu N, Lin W, Fang Y. A saliency detection model using low-level features based on wavelet transform[J]. Multimedia, IEEE Transactions on, 2013, 15(1): 96-105
Adaptive threshold segmentation for cotton canopy image in complex background based on logistic regression algorithm
Liu Libo1, Cheng Xiaolong1, Dai Jianguo2, Lai Junchen3※
(1.750021,; 2.832000,; 3.831300,)
Cotton canopy coverage is an important index for monitoring cotton growing in field. It is easy but not accurate to calculate, because it is difficult to accurately segment the cotton canopy in the complex environment image of cotton field. This paper presents an adaptive threshold segmentation approach of cotton canopy image based on logistic algorithm in order to improve the segmentation precision and robustness for cotton canopy image. Firstly, the cotton canopy image is transformed into HSV (hue, saturation, value) color space. This color space is designed by humancolor description. In this color space, the color feature of the pixel can be expressed by 3 independent components i.e. H, S and VIn this paper, the logistic regression algorithm is used to compute threshold used in image segmentation. The logistic regression algorithm is often used in 2 kinds of classification problem, so our method need an artificially defined variable. This variable and a single color feature variable can form a dataset as the input of logical regression algorithm to calculate the segmentation threshold. In our paper, the proposed artificially defined variable is set to a specific value that is 1, the effect of which is to reduce the impact for computed segmentation threshold. The cotton canopy image’s pixel is divided into 2 classes: target and background.The H channel feature of 2 classes can be extracted in HSV color space, and the green ratio (G/(R+G+B)) of 2 classes can be extracted in RGB (red, green, blue) color space. Those features’ thresholds are computed by logistic regression algorithm. H channel thresholds are used to achieve the first segmentation. Secondly, the first segmentation result is divided to highlight pixels and low pixels. The highlight pixels mainly include light canopy and light soil, and the low pixels mainly include shadow canopy and shadow soil. However, it is difficult to segment cotton canopy in the low pixels. In order to solve this problem, extra-green (Exg) color feature is used as segmentation feature to get cotton canopy in the low pixels. Thirdly, the highlight pixels in the first segmentation result and the low pixels segmented by Exg threshold are segmented by green ratio threshold. This segmentation is called the second segmentation. At last, the segmentation result of cotton canopy is acquired by morphology repair operation, and it ensures the integrity of the canopy region and the independent noise removal. In order to verify the effect of the method proposed in this paper, 320 test images were captured from the cotton producing areas in Xinjiang, China from April to July 2016. The acquisition was often on sunny day, aiming at obtaining images under different lighting conditions, different positions in cotton field, and different cotton growth periods. These images were collected by the Canon EOS5D digital camera with 6 912×3 416 pixels, and zoomed into 1 728×1 152 pixels to improve segmentation effect. This algorithm programming development environment is Python 2.7, and OpenCV 2.4.9. The experimental results show that the average relative object area error (RAE) by our method is only 5.46%, the Exg feature OTSU method 11.78%, the four-component segmentation method 24.11%, and the saliency segmentation method 36.92%. The overall average matching rate by our method is 93.07%, the Exg feature OTSU method 76.43%, the four-component segmentation method 71.67%, and the saliency segmentation method 66.92%. The average processing time of this paper proposed method was 4.63 s, which was much more time-consuming than the super-green characteristic OTSU method (3.84 s) and the four-component segmentation method (2.56 s), but this time less than that of the segmentation method (6.25 s). Therefore the proposed method in our paper has better performance than other methods in cotton canopy segmentation task, and is effective to segment the cotton canopy in the complicated background and different cotton growth periods. The proposed method can provide certain basis for implementation of cotton growth condition automatic monitoring.
algorithm; cotton; image segmentation; logistic regression;adaptive threshold
10.11975/j.issn.1002-6819.2017.12.026
TP391.41
A
1002-6819(2017)-12-0201-08
2016-11-23
2017-05-31
国家自然科学基金项目(31460317)
刘立波,女,宁夏银川人,博士,教授,研究方向为人工智能及农业信息化研究。银川 宁夏大学信息工程学院,750021。Email:liulib@163.com
赖军臣,男,四川三台人,博士,高级农艺师,研究方向为作物栽培植保与作物信息科学研究。五家渠 新疆五家渠市农业局,831300。 Email:ljc-hm@163.com
刘立波,程晓龙,戴建国,赖军臣. 基于逻辑回归算法的复杂背景棉田冠层图像自适应阈值分割[J]. 农业工程学报,2017,33(12):201-208. doi:10.11975/j.issn.1002-6819.2017.12.026 http://www.tcsae.org
Liu Libo, Cheng Xiaolong, Dai Jianguo, Lai Junchen. Adaptive threshold segmentation for cotton canopy image in complex background based on logistic regression algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(12): 201-208. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2017.12.026 http://www.tcsae.org