APP下载

苹果绵蚜远程图像识别系统的开发与实现

2014-08-12希仁娜·亚森李湘吴炜

江苏农业科学 2014年6期
关键词:自动识别图像处理远程

希仁娜·亚森+李湘+吴炜

摘要:为了防止苹果绵蚜[Eriosoma lanigerum(Hausmann)]对伊犁地区苹果生产带来的威胁,同时解决昆虫鉴定专家及病虫害防治专业技术人员短缺的问题,将计算机视觉技术与计算机网络技术相结合,采集昆虫数字图像,由Internet上传到可进行自动识别图像的服务器端,实现远程识别。系统首先对苹果绵蚜提取边缘特征值,再提取HOG特征值,最后建立神经网络分类器,实现自动识别。用40张苹果绵蚜图像对图像识别系统进行训练,用33种不同昆虫图像进行测试,正确率达到90%以上。

关键词:苹果绵蚜;远程;自动识别;图像处理

中图分类号: S431.9;TP391.41文献标志码: A文章编号:1002-1302(2014)06-0375-03

收稿日期:2013-09-06

基金项目:新疆农业大学前期资助课题(编号:XJAU201011)。

作者简介:希仁娜·亚森,维吾尔族,讲师,从事计算机教学工作。E-mail:xerin0991@163.com。苹果绵蚜[Eriosoma lanigerum(Hausmann)]是检疫性害虫,对苹果生产的危害极大。新疆维吾尔自治区伊犁哈萨克自治州地区苹果种类较多,苹果种植是当地林果业的重要组成部分。苹果绵蚜在伊犁哈萨克自治州新源县、霍城县、巩留县、伊宁县等地均有分布并且危害日趋严重[1],给当地林果业生产带来严重威胁,严重阻碍林果业的高效健康发展。由于昆虫鉴定防疫专业人才短缺,苹果的产量与质量都有所下降,寻找有效的鉴定昆虫方法具有非常重要的意义。随着计算机网络的发展,可利用计算机网络解决昆虫鉴定难题。已有的远程图像识别方式包括以下几种:图像通过计算机网络传给异地专家,由异地专家鉴定图像后再返回意见;双方通过计算机网络视频对图像进行识别。这些方法虽然解决了标本寄送难题,但还是依赖专家鉴定[2]。本研究主要利用计算机网络技术与图像识别技术,开发苹果绵蚜远程图像识别系统。用户用标准方法获取图像,经由Internet浏览器界面上传给自动识别系统服务器,由服务器端对上传的图像进行实时特征提取及识别,再将识别结果传送给用户终端,在最短时间内解答农户的疑问,减少人力、物力消耗,提高工作效率,减少损失,提高经济效益。

1图像获取

获取苹果绵蚜标准图像是远程自动识别的基础。标本摆放位置、获取图像时的光照环境、采集图像设备的像素以及采集图像时的距离等,都会影响数字图像的获取。只有正确获取数字图像,才可以实现自动识别。本系统以苹果绵蚜的形态数据作为模式特征值。为了尽可能清晰地获取苹果绵蚜的外部轮廓特征,将苹果绵蚜放在白纸上或白底的培养皿中,用数码体视显微镜取像。取像时为了防止标本乱动而造成图像模糊,事先在标本上滴1~2滴70%乙醇。另外为了防止提取特征值时产生误差,没有使用大头针来固定标本。

2系统实现

系统分为客户端与服务器端。用户通过客户端向服务器端发送图像,服务器端通过图像识别算法对用户发过来的图像数据进行自动识别,并将识别结果发送回客户端。为了给用户提供简单易用的客户端,本系统采用浏览器/服务器(B/S)模式。

2.1客户端开发

采用浏览器/服务器模式的优点在于不用安装客户端。只要用户计算机接入Internet便可与服务器端进行交互,用户通过浏览器程序访问系统主页。主页应简单、易用,无须设计太多的菜单及控件,用户只要将要识别的图像文件提交到服务器端。用户提交图像时,系统会自动截获提交时间并存入数据库。提交图像文件后,系统反馈提交结果。如果提交正确,系统会显示提交的图像及图像名称;如果提交错误,系统会要求用户重新提交图像。当图像提交成功后,用户可以通过页面上的图像识别控件,启动服务器端自动识别图像程序识别图像并返回识别结果。

2.2服务器端开发

服务器端分为2个模块。一是图像信息存储模块,二是图像自动识别模块。图像上传成功后并不直接交给图像自动识别模块进行处理,而是先提交到信息存储模块,信息存储模块通过数据库、文件夹实现。因为图像文件的数据信息不能存储到数据库中,所以用户在提交图像文件时,其实是将图像文件的文件名及提交时间上传到数据库中,将图像文件提交到文件夹中。数据库根据图像文件提交的顺序为每条记录自动产生唯一的编号。图像自动识别模块根据数据库中图像文件的文件名从文件夹中提取图像文件,图像自动识别模块对提取的图像文件进行识别并将结果返回到数据库中,由返回值生成反馈页面,告知用户识别结果。图像文件的远程传输及识别过程如图1所示。

3.1图像预处理

对图像文件进行识别之前,需要对图像进行预处理。

像预处理的目的是去除噪声,加强有用信息。图像采集过程中,由于光照等原因,得到的图像都存在一定程度的噪声与干扰,应当对图像进行预处理[3]。常用的预处理操作有图像格式转化、图像去噪、图像增强等。本系统采用的预处理是将苹果绵蚜 RGB 真彩色图转化为灰度图,一般情况下灰度图可以表现目标的大部分信息。

3.2边缘检测

边缘检测主要是对图像灰度变化进行度量、检测、定位。人眼识别一个物体,是通过追踪未知物体的轮廓来扫视该物体,该物体的轮廓是由边缘片段组成的。如果能够得到图像的边缘,图像分析就会大大简化,图像识别工作就会容易得多[4]。边缘检测方法主要有Roberts算子、Sobel算子、Canny算子等。由于苹果绵蚜背部有白色絮状物,边缘检测时絮状物会产生一定的噪声。Roberts算子定位比较精确,但由于不包括平滑,所以对噪声比较敏感。Sobel算子是一阶微分算子且是加权平均滤波,检测的图像边缘可能大于2个像素,对灰度渐变低噪声的图像检测效果较好。本系统采用Sobel边缘检测算子提取苹果绵蚜的边缘特征。Sobel算子在以f(i,j)为中心的3×3 邻域上计算x与y方向的偏导数。

Δxf =[f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)];(1)

Δyf =[f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)]。(2)

梯度的实际大小为:

G=(Δxf)2+(Δyf)2。(3)

常采用它的近似计算式:

|G|=|Δx f |+|Δyf|。(4)

几种边缘检测算子比较如图2所示。填充边缘内的空洞,得到1张二值图像,其中最大的联通区域是虫子。本系统实现了苹果绵蚜无翅成虫的图像识别,在提取边缘特征的基础上再提取HOG(梯度方向直方图)特征。

3.3HOG特征的提取

HOG主要通过对图像局部区域梯度方向出现次数统计生成的。这种方法与边缘方向直方图非常类似,二者区别在于HOG将图像分为密集的网格,针对每个网格进行统计,并采用重叠的局部对比归一化来提高准确率。

3.4算法实现

3.4.1梯度计算HOG提取的第一步是计算梯度值。最常用的方法是分别对竖直以及水平方向用一维离线点的导数模板([-1,0,1]和[-1,0,1]T)进行滤波。

3.4.2梯度方向计算上一步滤波可以分别得到每个像素点的水平梯度与竖直梯度,竖直梯度与水平梯度的反正切函数即是梯度方向。

θ(x,y)=arctan[L(x,y+1)-L(x,y-1)]/[L(x+1,y)-L(x-1,y)]。(5)

式中:L(x,y)是(x,y)坐标上的像素值,θ(x,y)是该点的梯度方向。

3.4.3方向分级统计将图像分为20×20像素大小的小格,将每个小格沿着0°~180°的梯度方向划分为9份进行直方图统计,每个像素的投票权值可以由梯度幅度或者梯度幅度的函数决定。

3.4.4归一化为了消除亮度以及对比度变化的影响,所得直方图需要局部归一化。首先将小格连接起来,形成更大的块,每个块的特征由所包含的小格直方图连接而成。通常1个块由2×2或者3×3小格组成,并且这些块是重叠的,这表示每个小格对特征贡献不止1次。有学者提出了4种归一化方法。令v为1个给定块的特征向量,‖v‖k表示向量的k-模,k=1,2。ε为1个小常量,4种归一化方式可以表示为:

L2-norm:

f=v‖v‖22+e2。(6)

L2-hys:对L2-norm之后的结果进行剪裁(最大值限制为0.2),再次进行 L2-norm。

L1-norm:

f=v(‖v‖1+e)。(7)

L1-sqrt:

f=v(‖v‖1+e)。(8)

本系统选用L2-norm进行归一化,最后将所有分块的归一化结果结合起来,得到梯度方向直方图特征。

3.5训练神经网络

人工神经网络由通过数学或计算模型联系在一起的一组人工神经元构成。由图3可知,1个典型的前向神经网络由3层组成:输入层、隐含层、输出层。其中,输入层LI含有n个人工神经元,以接受输入信号。隐含层LH有p个单元。输出层LO包含q个单元,用于输出分类结果。

本系统设计了1个基于边缘特征的神经网络分类器。利用Sobel及HOG得到的特征矩阵设计神经网络输入层结点数为特征维数,隐含层为100,输出层为2。对神经网络分类器进行训练,得到分类器的参数,之后自动识别系统利用分类器参数对识别请求给予自动鉴定。图像自动识别流程如图4所示。

4结论

本系统将计算机视觉技术与计算机网络技术相结合,实现了苹果绵蚜的远程图像识别。用户将昆虫数字图像通过系统客户端上传到服务器,服务器通过自动识别模块对图像进行鉴别,确定是否是苹果绵蚜。本系统利用40张苹果绵蚜图像对神经网络进行训练,用33种不同的昆虫样本图像进行测试,正确率达90%以上。本系统有利于降低防治成本,提高防治效果。

参考文献:

[1]玛依拉·吐拉甫. 新疆伊犁河谷苹果绵蚜种群生态学与控制技术研究[D]. 乌鲁木齐:新疆农业大学,2010.

[2]杨红珍,张建伟,李湘涛,等. 基于图像的昆虫远程自动识别系统的研究[J]. 农业工程学报,2008,24(1):188-192.

[3]郝中华,倪远平. 昆虫图像分割方法的研究及应用[J]. 云南大学学报:自然科学版,2009,31(增刊):67-72.

[4]周红,王宏坡. 基于Visual C++ .NET的昆虫图像自动识别系统的研究[J]. 天津农学院学报,2005,12(2):39-41,53

Δxf =[f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)];(1)

Δyf =[f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)]。(2)

梯度的实际大小为:

G=(Δxf)2+(Δyf)2。(3)

常采用它的近似计算式:

|G|=|Δx f |+|Δyf|。(4)

几种边缘检测算子比较如图2所示。填充边缘内的空洞,得到1张二值图像,其中最大的联通区域是虫子。本系统实现了苹果绵蚜无翅成虫的图像识别,在提取边缘特征的基础上再提取HOG(梯度方向直方图)特征。

3.3HOG特征的提取

HOG主要通过对图像局部区域梯度方向出现次数统计生成的。这种方法与边缘方向直方图非常类似,二者区别在于HOG将图像分为密集的网格,针对每个网格进行统计,并采用重叠的局部对比归一化来提高准确率。

3.4算法实现

3.4.1梯度计算HOG提取的第一步是计算梯度值。最常用的方法是分别对竖直以及水平方向用一维离线点的导数模板([-1,0,1]和[-1,0,1]T)进行滤波。

3.4.2梯度方向计算上一步滤波可以分别得到每个像素点的水平梯度与竖直梯度,竖直梯度与水平梯度的反正切函数即是梯度方向。

θ(x,y)=arctan[L(x,y+1)-L(x,y-1)]/[L(x+1,y)-L(x-1,y)]。(5)

式中:L(x,y)是(x,y)坐标上的像素值,θ(x,y)是该点的梯度方向。

3.4.3方向分级统计将图像分为20×20像素大小的小格,将每个小格沿着0°~180°的梯度方向划分为9份进行直方图统计,每个像素的投票权值可以由梯度幅度或者梯度幅度的函数决定。

3.4.4归一化为了消除亮度以及对比度变化的影响,所得直方图需要局部归一化。首先将小格连接起来,形成更大的块,每个块的特征由所包含的小格直方图连接而成。通常1个块由2×2或者3×3小格组成,并且这些块是重叠的,这表示每个小格对特征贡献不止1次。有学者提出了4种归一化方法。令v为1个给定块的特征向量,‖v‖k表示向量的k-模,k=1,2。ε为1个小常量,4种归一化方式可以表示为:

L2-norm:

f=v‖v‖22+e2。(6)

L2-hys:对L2-norm之后的结果进行剪裁(最大值限制为0.2),再次进行 L2-norm。

L1-norm:

f=v(‖v‖1+e)。(7)

L1-sqrt:

f=v(‖v‖1+e)。(8)

本系统选用L2-norm进行归一化,最后将所有分块的归一化结果结合起来,得到梯度方向直方图特征。

3.5训练神经网络

人工神经网络由通过数学或计算模型联系在一起的一组人工神经元构成。由图3可知,1个典型的前向神经网络由3层组成:输入层、隐含层、输出层。其中,输入层LI含有n个人工神经元,以接受输入信号。隐含层LH有p个单元。输出层LO包含q个单元,用于输出分类结果。

本系统设计了1个基于边缘特征的神经网络分类器。利用Sobel及HOG得到的特征矩阵设计神经网络输入层结点数为特征维数,隐含层为100,输出层为2。对神经网络分类器进行训练,得到分类器的参数,之后自动识别系统利用分类器参数对识别请求给予自动鉴定。图像自动识别流程如图4所示。

4结论

本系统将计算机视觉技术与计算机网络技术相结合,实现了苹果绵蚜的远程图像识别。用户将昆虫数字图像通过系统客户端上传到服务器,服务器通过自动识别模块对图像进行鉴别,确定是否是苹果绵蚜。本系统利用40张苹果绵蚜图像对神经网络进行训练,用33种不同的昆虫样本图像进行测试,正确率达90%以上。本系统有利于降低防治成本,提高防治效果。

参考文献:

[1]玛依拉·吐拉甫. 新疆伊犁河谷苹果绵蚜种群生态学与控制技术研究[D]. 乌鲁木齐:新疆农业大学,2010.

[2]杨红珍,张建伟,李湘涛,等. 基于图像的昆虫远程自动识别系统的研究[J]. 农业工程学报,2008,24(1):188-192.

[3]郝中华,倪远平. 昆虫图像分割方法的研究及应用[J]. 云南大学学报:自然科学版,2009,31(增刊):67-72.

[4]周红,王宏坡. 基于Visual C++ .NET的昆虫图像自动识别系统的研究[J]. 天津农学院学报,2005,12(2):39-41,53

Δxf =[f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)];(1)

Δyf =[f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)]-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)]。(2)

梯度的实际大小为:

G=(Δxf)2+(Δyf)2。(3)

常采用它的近似计算式:

|G|=|Δx f |+|Δyf|。(4)

几种边缘检测算子比较如图2所示。填充边缘内的空洞,得到1张二值图像,其中最大的联通区域是虫子。本系统实现了苹果绵蚜无翅成虫的图像识别,在提取边缘特征的基础上再提取HOG(梯度方向直方图)特征。

3.3HOG特征的提取

HOG主要通过对图像局部区域梯度方向出现次数统计生成的。这种方法与边缘方向直方图非常类似,二者区别在于HOG将图像分为密集的网格,针对每个网格进行统计,并采用重叠的局部对比归一化来提高准确率。

3.4算法实现

3.4.1梯度计算HOG提取的第一步是计算梯度值。最常用的方法是分别对竖直以及水平方向用一维离线点的导数模板([-1,0,1]和[-1,0,1]T)进行滤波。

3.4.2梯度方向计算上一步滤波可以分别得到每个像素点的水平梯度与竖直梯度,竖直梯度与水平梯度的反正切函数即是梯度方向。

θ(x,y)=arctan[L(x,y+1)-L(x,y-1)]/[L(x+1,y)-L(x-1,y)]。(5)

式中:L(x,y)是(x,y)坐标上的像素值,θ(x,y)是该点的梯度方向。

3.4.3方向分级统计将图像分为20×20像素大小的小格,将每个小格沿着0°~180°的梯度方向划分为9份进行直方图统计,每个像素的投票权值可以由梯度幅度或者梯度幅度的函数决定。

3.4.4归一化为了消除亮度以及对比度变化的影响,所得直方图需要局部归一化。首先将小格连接起来,形成更大的块,每个块的特征由所包含的小格直方图连接而成。通常1个块由2×2或者3×3小格组成,并且这些块是重叠的,这表示每个小格对特征贡献不止1次。有学者提出了4种归一化方法。令v为1个给定块的特征向量,‖v‖k表示向量的k-模,k=1,2。ε为1个小常量,4种归一化方式可以表示为:

L2-norm:

f=v‖v‖22+e2。(6)

L2-hys:对L2-norm之后的结果进行剪裁(最大值限制为0.2),再次进行 L2-norm。

L1-norm:

f=v(‖v‖1+e)。(7)

L1-sqrt:

f=v(‖v‖1+e)。(8)

本系统选用L2-norm进行归一化,最后将所有分块的归一化结果结合起来,得到梯度方向直方图特征。

3.5训练神经网络

人工神经网络由通过数学或计算模型联系在一起的一组人工神经元构成。由图3可知,1个典型的前向神经网络由3层组成:输入层、隐含层、输出层。其中,输入层LI含有n个人工神经元,以接受输入信号。隐含层LH有p个单元。输出层LO包含q个单元,用于输出分类结果。

本系统设计了1个基于边缘特征的神经网络分类器。利用Sobel及HOG得到的特征矩阵设计神经网络输入层结点数为特征维数,隐含层为100,输出层为2。对神经网络分类器进行训练,得到分类器的参数,之后自动识别系统利用分类器参数对识别请求给予自动鉴定。图像自动识别流程如图4所示。

4结论

本系统将计算机视觉技术与计算机网络技术相结合,实现了苹果绵蚜的远程图像识别。用户将昆虫数字图像通过系统客户端上传到服务器,服务器通过自动识别模块对图像进行鉴别,确定是否是苹果绵蚜。本系统利用40张苹果绵蚜图像对神经网络进行训练,用33种不同的昆虫样本图像进行测试,正确率达90%以上。本系统有利于降低防治成本,提高防治效果。

参考文献:

[1]玛依拉·吐拉甫. 新疆伊犁河谷苹果绵蚜种群生态学与控制技术研究[D]. 乌鲁木齐:新疆农业大学,2010.

[2]杨红珍,张建伟,李湘涛,等. 基于图像的昆虫远程自动识别系统的研究[J]. 农业工程学报,2008,24(1):188-192.

[3]郝中华,倪远平. 昆虫图像分割方法的研究及应用[J]. 云南大学学报:自然科学版,2009,31(增刊):67-72.

[4]周红,王宏坡. 基于Visual C++ .NET的昆虫图像自动识别系统的研究[J]. 天津农学院学报,2005,12(2):39-41,53

猜你喜欢

自动识别图像处理远程
让人胆寒的“远程杀手”:弹道导弹
远程工作狂综合征
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
远程诈骗
自动识别系统
金属垃圾自动识别回收箱
基于图像处理的定位器坡度计算
基于IEC61850的配网终端自动识别技术
兰姆凹陷稳频工作点自动识别技术