机器视觉技术在现代农业生产中的研究进展*
2021-04-09杨涛李晓晓
杨涛,李晓晓
(1.成都农业科技职业学院机电信息学院,成都市,611130;2.成都大学机械工程学院,成都市,610106)
0 引言
随着人工智能(Artificial Intelligence,AI)在现代农业装备中的逐步应用,使得融合各种现代化智能技术的农业装备推动农业生产方式从机械化向自动化、智能化方向迈进。由此,涌现出依赖高新信息技术的精准农业、数字农业、智慧农业、无人农场等先进农业生产形式[1]。中国也将依托智能农机、生物技术、信息技术,能够实现信息感知、定量决策、智能控制、精准投入以及个性化服务五大功能的智慧农业列入国家智慧经济的重要组成部分,并且处于现代农业发展的高级阶段[2]。罗锡文院士也明确表示智慧农业是中国农业未来的发展方向。那么,运用现代信息技术加快智慧农业建设,助力中国从传统农业到智慧农业过渡就尤为重要。
机器视觉(Machine Vision,MV)是人工智能的重要分支,为农业装备装上了一双“眼睛”,在农业生产领域的应用研究已经有50年的历史。美国、日本、德国等发达国家集成机器视觉技术的农业装备在农业生产中的应用涉及产前、产中、产后全过程。中国机器视觉技术在农业领域的相关研究多数还处于实验室研究阶段,但在水果无损检测与分级方面已经有一定的应用[3]。此外,随着智能驾驶技术的发展,农业场景车辆视觉导航也成为了当前研究人员的研究热点,搭载视觉系统的智能农业装备在农业生产中的应用越来越多,并且,中国的农机无人驾驶系统已经能够与国外发达国家并驾齐驱[4-5]。机器视觉技术提高了现代农业装备自动化、智能化、精细化程度,为实现作物生产全程无人自主作业、作业环节自主完成、作物生产信息全程自动监测的无人农场提供了有力的技术保障。在带动产业升级、推动农业智能化发展等方面有重要意义。
本文采用文献调研、实地走访、咨询专家等方法详细阐述机器视觉技术的概念、组成、工作原理,梳理机器视觉技术在农业生产产前、产中、产后各个环节的应用情况与国内外最新研究成果,对比机器视觉技术相对人类视觉的优缺点,分析机器视觉技术亟待突破的关键瓶颈,预测未来发展的重点方向,这对于促进机器视觉技术进一步在农业生产领域的应用与产业的健康发展有着积极意义。
1 机器视觉概述
机器视觉顾名思义就是机器的视觉系统,赋予其类似人类眼睛一样的视觉功能,涉及到机械、计算机科学、图像处理技术、信号分析与检测、统计学、模式识别等诸多领域的交叉学科,是计算机视觉(Computer Vision,CV)的具体应用。图1所示的是典型的机器视觉系统,由图像采集、图像分析、智能决策与执行3个模块组成,包含硬件与软件两个部分。工作时,由图像采集模块获取三维世界目标对象的二维图像,再运用图像处理与分析系统对其进行特征量分析并输出结果,最后根据图像分析结果做出决策或执行相应的机构。
图1 典型机器视觉系统
1.1 硬件部分
机器视觉系统硬件部分指的是光源、镜头、相机、图像采集卡、处理器或PC、执行机构等。其中,相机是核心感光元件,其本质是借助CCD(Charge Coupled Device)或CMOS(Complementary Metal Oxide Semiconductor)图像传感器将光电信号转变为电信号,获取目标二维图像。2009年,微软将3D结构光技术应用在Kinect上获得了目标的三维结构,提升了Xbox用户体验。此后,开始兴起一种通过红外结构光或TOF(Time of Flight)原理测定图像中各像素与相机距离的深度相机(RGB Deeply,RGB-D)。该相机在获取传统的RGB二维图像的同时还能够生成一张与之一一对应的深度图像,以实现目标对象的三维重建。并在增强现实(Augmented Reality,AR)、智能制造、农业机器人等领域已得到应用。
1.2 软件部分
软件部分指的是图像处理与分析算法,是视觉系统的灵魂,也是研究人员研究的重点内容。包括图像处理算法、模式识别算法、深度学习算法等,在单目视觉系统的基础上逐步发展出了基于视差原理的双目立体视觉,利用成像设备从不同的位置获取目标两幅图像,再通过计算图像对应点之间的位置偏差获取目标三维几何信息的方法。该方法融合了“两只眼睛”的图像,模拟了人类双眼的视觉原理,已成为了国内外研究人员的研究热点之一。此外,为便于软件工程师快速开发具有特定功能的视觉系统,封装了图像处理、模式识别、机器学习等各类函数的视觉开发包流行了起来,“软件平台+视觉开发包”成为当前主流的开发模式。并且,OpenCV开源视觉库,美国Vision Pro、MATLAB、LabVIEW以及德国Halcon等开发包是当前使用最广泛的视觉开发包。
机器视觉识别、检测过程见图2。首先,针对应用目标构建合适的图像成像系统采集目标图像;然后,是运用图像处理技术对采集到的样本图像进行预处理,以增强图像质量;接着,将目标对象从图像背景中分割出来并运用相关特征计算方法提取特征信息,得到目标对象颜色、形态、纹理等表征能力较强的特征参数组成的特征向量;最后,为避免过多的冗余信息给系统带来较大计算量,影响系统识别精度与效率,对得到的特征向量进行筛选与优化后,再选择合适的分类器进行训练并给出识别结果。
图2 机器视觉识别、检测技术路线
该过程中图像处理效果、选取的特征、分类器的设计直接决定了系统识别效果,是机器视觉技术的核心。图像处理技术相对较成熟,常见的图像预处理过程为灰度化→几何变换(裁剪、平移、旋转等)→图像增强(滤波、平滑、锐化等);目标分割方法有阈值分割法(全局阈值、局部阈值、Otsu)、区域分割法、分水岭分割法以及K-means聚类分割等;特征提取方法有颜色(颜色矩、颜色集、颜色直方图、颜色聚合向量等)、纹理(灰度共生矩阵法、几何法、模型法、小波变换等)、形状(傅里叶变换、Hough变换、面积、周长、矩形度、似圆度、最小外接矩形长宽比、Hu不变矩等)、空间关系等;特征选择与优化方法有主成分分析(Principal Component Analysis,PCA)、线性判别分析法(Linear Discriminant Analysis,LDA)、多维尺度法(Multi-Dimensional Scaling,MDS)、流型学习法等;识别与分类方法是研究者们研究的热点,传统的统计模式识别方法有支持向量机(Support Vector Machine,SVM)、贝叶斯、判别函数等,随着机器学习(Machine Learning,ML)技术的发展,人工神经网络(Artificial Neural Network,ANN)、遗传算法、聚类算法、迁移学习等方法的应用,大幅提高了机器视觉系统的识别准确率、稳定性、鲁棒性。并且,国内外研究人员关于机器视觉的研究也集中在分类算法方面。
2 应用领域与研究进展
机器视觉技术在智能制造领域应用集中在定位导航、检测、测量、识别四个方面,在农业生产环节中应用更为广泛。美国、日本、德国等发达国家围绕农业生产的应用几乎涉及全过程[6]。在产前种子筛选与质量检验、产中作物病虫草害与生长信息监测、产后农产品性状测量与分级以及现代农业装备定位导航等领域均有一定程度的应用。而中国的研究多数还处于实验室研究阶段。
2.1 病虫草害识别与监测
作物病虫草害视觉识别从早期简单的性状特征逻辑判断发展到基于特征向量的模式识别,后又随着深度学习(Deep Learning,DL)的发展,使得卷积神经网络(Convolutional Neural Networks,CNN)及其改进算法得到有效应用,大幅提高了视觉系统的识别率与稳定性。
刘翠翠等[7]运用PCA与SVM开发了麦冬叶部黑斑病、叶枯病以及炭疽病3种病害识别系统并对其进行了有效监测与防治;王艳玲等[8]运用ImageNet图像数据集上训练成熟的Alex Net模型来识别番茄叶片病害,不但缩短了训练时间,还将平均准确率提高了5.6%;彭明霞等[9]提出了基于Faster R-CNN模型的棉花杂草识别算法,适应复杂背景下棉田杂草的识别;赵立新等[10]、Kim等[11]、Hasan等[12]分别对棉花叶部病虫害、马铃薯晚疫病、水稻病害识别展开了研究,均取得了不错的效果;Tetila等[13]使用小型无人机在植物上方2 m处采集大豆叶部病害图像,再运用简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)算法生成超像素,以分割植物叶片,并对比了Inception-v3、Resnet-50、VGG-19以及Xception4种不同参数训练的深度神经网络(Deep Neural Networks,DNN),与其他训练策略相比,基于深度学习的模型识别率达99.04%,满足农民监测大豆病害的需要。
张红涛等[14]利用单镜头反光(Single Lens Reflex,SLR)相机采集了烟草主要害虫(烟青虫、棉铃虫)虫蛹图像并提取其腹部末节有效区域纹理特征,再运用SVM分类器进行识别分类,完成了烟青虫、棉铃虫虫蛹雌雄的有效分类;Partel等[15]运用机器视觉技术与CNN开发了一套全自动亚洲柑橘木虱(Asian Citrus Psyllid,ACP)监测系统,准确率达80%;Thenmozhi等[16]使用国家农业昆虫资源局数据集提出了一个深度卷积神经网络与迁移学习的农作物害虫分类方法,并与AlexNet、ResNet、GoogLeNet和VGGNet等预训练的深层学习结构比较,表现出了绝对的优势,能够有效地对大田作物各类昆虫进行分类。
苗荣慧等[17]运用图像分块及重构技术在菠菜重叠叶片的情况下实现了杂草识别,为智能除草装备的研制提供了理论依据;广西某公司开发的智能识别引擎——“耘眼”,能够自动识别农作物病虫害并可依据已知病虫害自动推荐配药方案以及评估农药混用风险。此外,精细化物体分类技术也得到应用,微软亚洲研究院提出了一种基于递归注意力模型的卷积神经网络(Recurrent Attention Convolutional Neural Network,RA-CNN),并联合中国科学院植物研究所共同打造“微软识花”APP,收录400余种园艺花卉,识别精度达90%[18];德国某公司一直在积极探索数字化技术在农业领域的各类应用,于2017年发布XARVIO数字农业解决方案,并依托于其全球农艺植保大数据资源,建立数字化平台在中国区推出“WEEDSCOUT”杂草识别APP。未来,拜尔将继续引入“虫害监测”“病害识别”“营养评估”等一系列基于智能手机端的数字化农业应用。中国在花草树木识别方面已取得重大进展,科技公司纷纷运用机器视觉识别技术开发花草树木识别软件,涌现出一批出色的花草树木识别手机APP——“花伴侣”“形色”“识物”等;中国科学院昆明植物研究所与腾讯“识你所见”AI产品团队联合研发出了一款能够识别6 000多种花草的微信小程序——“识花君”;百度AI开放平台植物识别支持2.4万种通用植物和花卉,在识别率和线上内容储备上均超越市场上的同类功能应用。
英国《新科学家》网站报道了丹麦科学家研制出的农田智能除草机器人,使用机器视觉技术识别杂草。并且,在对糖用甜菜农田试验发现,除草剂用量可减少约70%;美国某公司研发的除草机器人直接放弃了除草剂而使用可伸缩锄头快速、准确地在生菜、西兰花、花椰菜田间自动除草;美国加利福尼亚大学Raja等[19]针对复杂自然条件下莴苣除草机器人开发了一套农作物与行内杂草实时识别系统,并能够控制搭载的微喷除草剂喷洒系统对杂草进行精准喷洒;瑞士EcoRobotix除草机器人能够逐一检查作物生长情况、辨识杂草、精准喷洒农药,并大幅减少农药使用量。纵观全球,运用机器视觉技术在作物病虫草害识别、监测、防治,甚至是除草机器人等方面已经出现了具备商业应用的产品,正逐步在全球扩散。
2.2 作物生长信息监测与产量估计
实施精准农业的前提需要实时、准确地获取作物生长与环境信息并及时将其反馈给监控系统,以便系统及时调整环境中的温度、光照强度、湿度、土壤水分、风速、CO2浓度等条件,进而,实现农业物资的合理利用与作物产量提升。现代农业中常以颜色、长度、叶面积指数(Leaf Area Index,LAI)、归一化植被指数(Normalized Difference Vegetation Index,NDVI)等信息为监测指标来反映被监测作物长势或进一步预测作物产量。作物生长信息视觉监测方法与作物病虫草害识别方法有较大的相似度,通过图像处理技术获取目标特征信息构建数学模型,再使用相应的分类或识别方法对该模型进行分析处理给出分类或识别结果。传统的作物生长信息视觉监测依托于设施农业建设,固定的采集点、采集范围,使得监测系统稳定性好,检测的性状种类较多,但规模化作业成本较大。
付豪等[20]开发了玉米幼苗叶面积视觉检测装置,以实现玉米幼苗叶面积的快速、高效、实时、无损检测,满足玉米育种研究中幼苗期叶面积检测的要求;杨斯等[21]基于RGB-D相机融合滤波与聚类分割算法,提出了基于俯视彩色三维点云数据处理方法,实现了温室育苗盘中黄瓜苗幼苗株高的测量,为苗期作物群体关键生长参数的提取提供有效的解决方案;日本学者Genno等[22]连续两年通过固定点采集了苹果树图像,人工测量了图像中苹果的半径,并基于这些图像探索出了累计最大GBVI(Green Blue Vegetation Index)叶面积可以预测苹果的可收获半径,是准确评价苹果生长信息的最有效指标,可进一步开发基于高清晰度现场监控图像的苹果生长自动评估系统;加拿大学者Chaudhury等[23]搭建了室内作物自动化信息采集系统,构建作物3D网格并据此计算作物表面积与体积,并获取了大麦、拟南芥昼夜明暗周期变换条件下营养期到生殖期的生长规律;美国普渡大学Li等[24]使用智能手机采集罗勒、生菜、西红柿和百日草图像,再通过本地计算机估算出叶面积并发现了叶面积与茎干重(Shoot Dry Weight,SDW)之间存在的线性关系,实现了准确、无损测量作物生长特性。
此外,基于无人机的作物信息监测技术刚好解决了传统视觉监测方法难以规模化的问题,并且,融合了无人机驾驶飞行器技术、空间遥感、图像实时传输等多种手段的无人机多光谱成像技术因其能够快速获取农田作物实时光谱图像,再通过图像分析了解大田作物的生长信息,已成为当下国内外学者研究的热点之一[25]。与卫星遥感监测平台相比,多传感器信息融合的无人机视觉监测技术在成本控制、规模应用等方面有一定的优势。
戴建国等[26]利用无人机获取棉花3~4叶期高分辨率遥感图像,再使用自适应阈值分割算法(Otsu)分割出目标,然后采用网格法去除杂草干扰并提取棉花的形态特征构建基于SVM的棉株计数模型,最后基于此提取棉花出苗率、冠层覆盖度以及棉花长势均匀性信息,实现了大面积棉田苗情的快速监测;陶惠林等[27]融合了无人机数字图像与高光谱数据,通过MLR(Multiple Liner Regression)和RF(Random Forest)构建了冬小麦挑旗期、开花期、灌浆期的产量估计模型,实现了冬小麦产量估计;西班牙塞维利亚大学Apolo-Apolo等[28]利用无人机获取柑橘园树木图像,构建了Faster R-CNN深度学习模型以监测果园中橘子的生长状态并估计其大小与产量,对比了实际总产量、估计总产量和专家估计总产量发现,该方法的产量估计误差约7.22%,可应用于柑橘产量估计;伊朗德黑兰大学Fathipoor等[29]以无人机采集到的玉米12叶期RGB图像为研究对象,从数字高程模型(Digital Elevation Model,DEM)中减去作物表面模型,从而创建作物高度模型(Crop Height Model,CHM),再利用植物株高与植被指数构建了偏最小二乘回归模型(Partial Least Squares Regression,PLS)实现了玉米饲草株高建模与产量预测。
2.3 果蔬识别定位与采摘
水果采摘是果园最费劳动力、最难实现机械化作业的环节,准确、可靠的水果检测是实现机器人采摘作业的前提[30]。然而,在自然光照条件下还存在着树叶遮挡、相邻水果重叠等不利因素,无疑为果蔬的自动采摘增加了难度。研究人员基于机器视觉围绕苹果、猕猴桃、葡萄、柑橘、草莓、荔枝、西红柿、圣女果、黄瓜、茄子等果蔬展开了自动识别、定位、计数等方面的研究。甚至,开发了相应的自动采摘机器人,但遗憾的是还没有成熟的商业应用案例。
陈燕等[31]设计了YOLOv3-DenseNet34荔枝串检测网络,提出了同行顺序一致性约束的荔枝串配对方法,基于双目立体视觉的三角测量原理计算荔枝串空间坐标,实现了在3 m检测距离下预定位的平均绝对误差23.007 mm,满足大视场条件下荔枝采摘机器人的视觉定位需求;澳大利亚Kang等[32]借助视觉传感器对果园环境中的苹果、树枝进行实时检测,提出了基于剩余网络架构的轻量级骨干网络,分割苹果与树枝正确率分别达86.5%、75.7%,可有效地进行果园苹果与树枝的实时检测与分割;华南农业大学Tu等[33]使用RGB-D相机获取可变光照条件和遮挡条件下百香果RGB图像与深度图像,再运用多尺度特征提取器提取其特征,然后利用改进的多尺度快速区域卷积神经网络(Multiple Scale Faster Region-Based Convolutional Neural Networks,MS-FRCNN)分别训练RGB检测器与深度检测器,融合了RGB彩色与深度信息,检测精确度达92.2%,有效地改善了小百香果的检测;英国普利茅斯大学研发的树莓采摘机器人Robocrop采用RGB-D相机与机器学习算法识别果实并在10 s内摘下果实放入托盘中并能够根据成熟度分类,正规模化推广中;斯坦福国际研究院推出的新创公司——Abundant Robotics研制的苹果采摘机器人使用机器视觉技术准确识别果树上成熟的苹果并确定其空间位置再使用类似真空吸尘器的机械前端摘取苹果,避免了传统机械臂易对水果表面造成的划痕、压伤等缺陷。
2.4 种子产前检测与果蔬分级
种子产前与农产品产后无损检测技术是其分选、分级装置的核心技术,主要有近红外光谱技术、机器视觉技术、高光谱成像检测技术、声学分析技术、电子鼻技术、核磁共振技术等[3]。机器视觉在农产品无损检测领域相对较成熟,已从早期以单一颜色、大小、形状为分类指标逐步发展出基于果实表面缺陷(机械损伤、病虫害等)、成熟度、含糖量等外观与内在品质为分级指标的分类方法,已经应用于苹果、柑橘、猕猴桃等水果自动化分级装备以及玉米、棉花等种子分选装置中。
李颀等[34]采用HSV和CLBP提取玉米种穗颜色、纹理特征,再运用匹配得分融合算法构建分类模型,借助SVM实现了玉米种穗杂色、缺粒、虫蛀、籽粒杂乱4种异常种穗;印度Bhargava等[35]使用模糊C-均值(Fuzzy C-Means)分割苹果表面缺陷区域,并考虑了统计纹理、几何、Gabor小波和离散余弦变换特征的组和特征提取,应用了K-最近邻(k-Nearest Neighbor,K-NN)、稀疏表示分类(Sparse Representation Classifier,SRC)、SVM三种不同的分类方法,对4个不同苹果数据集试验表明多种技术融合的分类算法具有更高的准确性,表现出巨大的潜能;荷兰Greefa果蔬分选设备公司将果蔬大小、颜色、重量、糖分含量等检测指标模块化,开发成独立的检测系统可安装在分选线上实现果蔬多指标快速分选,可针对不同水果快速构建视觉检测、分级系统。
2.5 农业机器人定位导航
随着机器人操作系统(Robot Operating System,ROS)向着农林业、生态种植方向拓展,农业机器人也迎来了快速发展机会[36]。现代农业机器人自动导航系统包含环境感知单元、控制单元与执行单元三部分,见图3。环境感知定位技术指的是借助各类传感器对农机周边环境进行探测以及自身实时定位;控制单元是跟踪导航路径并输出对应的控制信号;执行单元则根据接收到控制信号控制农机转向,从而是其始终沿着导航路径行走。也就是说,导航位姿信息的准确、可靠获取是路径规划、农机控制的前提[5]。那么,农机感知周围环境、自身位置、姿态就显得尤为重要。
图3 农机自动导航系统典型结构
机器视觉技术因感知周围环境信息丰富、成本低等优势在农机定位导航中占有一席之地。视觉导航系统是通过对农业场景图像中的参考目标进行检测识别,提取导航数据并将其应用于农机的路径规划。李亚军等[37]运用改进的超绿灰度化(2G-R-B)算法分割菜地绿色植物图像并基于Huber损失函数进行边界曲线拟合,实现了自然光照条件下叶菜类蔬菜图像的菜垄识别与导航基准线提取,识别率达97.5%;王侨等[38]运用机器视觉技术获得农机在地头处安全掉头转向的边界线,检测正确率大于92%,为农机在地头处的信息感知提供了准确、可靠的技术支持;关卓怀等[39]基于超红(2R-G-B)特征模型的综合阈值法进行图像分割,水平扫描获取作物线拟合关键点,再使用多段三次B样条曲线拟合法提取水稻待收获区域边界线,平均误差为9.9 mm;曾宏伟等[40]提出了基于区域生长算法的联合收割机导航线精确提取方法以适应强光条件下小麦已收割区域与未收割区域对比度低、难以获取边界线的问题,并且不易受作物生长密度和麦茬的干扰。
近年来,随着多目立体视觉、RGB-D深度相机与同步定位与地图构建技术(Simultaneous Localization and Mapping,SLAM)的发展,使得视觉SLAM(Visual SLAM,VSLAM)在缺乏环境先验信息与可靠外界辅助信息源的农业场景中得到应用并成为无人系统领域的研究焦点[41]。并且,深度学习与图像处理技术的融合为VSLAM发展带来了机会。然而,VSLAM也存在着占有计算资源大、数据更新慢、光照环境敏感等问题,难以适应农机高速运动下实时性等情况,而惯性测量单元(Inertial Measurement Unit,IMU)具有数据更新快、动态响应好、可分离角运动与线运动等优势,刚好可以弥补VSLAM的不足。因此,将IMU与视觉传感器结合构建惯性视觉SLAM(Visual Inertial SLAM,VI-SLAM)以提高动态环境下系统鲁棒性的技术成为当前VSLAM重点研究方向[42]。同时,也促进了多传感器融合的高精度导航技术在农机导航领域的应用。红外线、超声波、激光雷达等传感器与视觉传感器组合使用的导航定位技术已经广泛应用于农业机器人、农业无人机(Unmanned Aerial Vehicle,UAV)自主定位导航与避障等领域。
Sanchez-Rodriguez等[43]运用RGB-D相机获取周围环境图像,再通过超像素分割、平面提取、实时映射以及RRT(Rapidly Exploring Random Tree)路径规划算法构建3D地图,在微型飞行器(Micro Aerial Vehicles,MAVs)未知环境测试中成功地感知并避免其路径上的潜在障碍;北京某公司联合北航、清华、浙大、哈工大等多所著名高校飞行控制实验室建立了高校无人机教学实验室并基于机器视觉开发了无人平台自主SLAM导航避障系统,具有立体视觉、运动估计、路径规划、自主避障等功能,让科研团队专注于SLAM导航算法的研究;广州某公司开发的“天目”无人机视觉系统(XAIRCRAFT “XCope” UAV Vision System)融合了双目避障与地形视觉模块,不但具有了感知环境位置的能力,还能够脱离GPS信号获取位置与飞行信息,实现无人机全自主飞行控制,彻底解放用户双手,大幅提升操作体验;大疆农业植保无人机T20搭载360°全向数字雷达与实时图像监控系统及夜间探照灯,能够全天候感知农田环境。
此外,以中国北斗卫星导航系统(BeiDou Navigation Satellite System,BDS)、美国GPS、俄罗斯GLONASS、欧盟Galileo为代表的全球导航卫星系统(Global Navigation Satellite System,GNSS)为现代农业装备实时定位、路径规划提供了有力的保障[44]。并且,实时动态载波相位差分(Real-Time Kinematic,RTK)技术由基准站通过数据链将载波观测值与基站坐标及时传送到流动站,而流动站同时接收卫星与基站的载波相位,经过差分处理消除了接收机误差与卫星信号延迟误差的影响,使得基于RTK的定位系统精度可达厘米级,在与视觉传感器融合的农机导航系统中应用广泛[45]。
王东等[46]设计了GNSS与视觉导航融合的山地果园无人机植保航迹控制系统,采用线性组合算法提取目标行作业区域,再运用最小二乘法对作业区域中心点进行拟合,得到果树行趋势线,进而获取视觉导航偏航角以实现无人机作业航迹控制,在山地苹果园试验表明系统误差约9 cm,满足山地果园植保作业要求;李云伍等[47]运用RTK-GNSS采集路网信息并对路口区域实时定位,利用机器视觉识别、提取田间道路路径跟踪线,为非路口区域导航,在直线路径、多曲率复杂路径以及地形起伏路径测试中自主行驶轨迹与实际道路中线的平均偏差分别为3.1 cm、6.9 cm、9.2 cm,满足丘陵山区转运车自主行驶的安全要求。
3 机器视觉技术亟待突破的关键瓶颈
与人类视觉相比,机器视觉具有较宽的光谱响应范围,还能够长时间稳定作测量、分析、识别等任务。在精确度、速度、适应性、客观性、重复性、可靠性、效率等方面均具有一定的优势,见表1。
表1 人类视觉与机器视觉优劣对比
然而,机器视觉也受到硬件设备性能、图像分析算法准确度与效率以及网络传输速率的限制使得系统实时性、稳定性难以保证。同时,还面临着应用对象复杂多样,难以开发通用视觉系统使得每一类目标都需要单独开发视觉系统,造成成本居高不下等问题。此外,农业场景视觉系统在稳定性、鲁棒性、计算能力、理论创新等方面还存在较大的局限性,已成为阻碍机器视觉在农业生产中应用的关键瓶颈。
3.1 视觉系统准确性、实时性、鲁棒性、稳定性、可靠性亟待提高
农业场景光照不均、风速变化大、自然光照强度随时间变化大且色温不可控与道路坑洼带来的机械振动等因素都将导致视觉系统成像质量下降,进而影响了视觉系统的准确性、鲁棒性、稳定性。此外,视觉系统通常要求实时反馈识别、检测结果,以便执行机构及时做出相应的执行动作。然而,当前视觉检测设备的采集速度、处理速度较慢,加之深度学习类算法增大了计算量,使得系统难以胜任复杂场景对系统实时性的要求。总而言之,视觉系统在准确性、实时性、鲁棒性、稳定性、可靠性等方面还难以适应复杂多变的农业户外场景。
3.2 计算能力与算法仍未取得根本性突破
支持机器视觉发展的核心基础是硬件设备的计算能力与软件的关键算法。计算能力方面,当前嵌入式视觉系统存在芯片计算能力不足、运行速度较慢、存储空间有限等问题,并不能满足大规模矩阵运算、神经网络迭代运算等较大运算量的算法。虽然,国际机器视觉市场已经形成了以基恩士、康耐视、海克斯康、达尔萨等为代表的核心部件制造商,以基恩士、欧姆龙、松下、NI等为代表的核心部件与系统集成商的全产业链格局。但是,要突破硬件设备性能限制,涉及到材料、半导体、集成电路、传感器等行业的创新突破,短期内难以有较大的研究进展。
算法方面,得益于深度学习的出现,进一步推动了机器视觉快速发展。但是,深度学习是建立在大数据、大规模计算资源驱动下的基础理论技术突破,而不是理论方法上的突破。并且,深度学习过度依赖大量的标注数据,耗费了研究人员大量的时间,自身也遇到了发展瓶颈。并且,计算机视觉奠基人Alan L.Yuille认为深度学习在打破机器视觉的发展面临瓶颈中起到的作用有限,需要找到新的突破口。
由此可见,不论是硬件设备计算能力方面,还是在软件核心算法方面,机器视觉或均已经面临发展的瓶颈。
3.3 中国企业技术同质化现象严重,行业创新能力不足
机器视觉项目相较于其他AI领域的项目更容易落地,曾掀起一场创业热潮。国际机器视觉品牌已经超过200个,产业链也可以清楚的分为元器件生产商、底层开发商、二次开发商、产品代理商以及应用客户5个部分。而中国机器视觉企业多集中在产业中下游,且体量偏小。虽然在细分领域已经涌现出中国“CV四小龙”,同时,国产视觉核心部件正在快速崛起;中游系统集成与整机装备商也有100多家,能够为各行业提供视觉方案。但是,从整体表现来看,在产业链上游国内企业竞争力较弱,工业相机以欧美进口为主;高端工业镜头主要依赖于德国、日本、美国等企业;中游系统集成与装备制造企业多直接采购视觉软件、传感器、驱动控制系统等核心零件再进行二次开发与组装;核心底层系统开发基本被欧美、日本等企业垄断。
此外,与美国、日本、德国等发达国家相比,中国在技术掌握能力、产品应用程度、专业人才储备以及高水平学者集中的研究机构数量等方面还存在较大的差距。中国企业大多数是从高校实验室发展起来的,核心技术集中在几个热门研究领域,进而导致创业后业务线也有很大一部分的重合。加之,机器视觉技术的人才流动,导致了各公司核心技术同质化现象严重、创新能力不足。并且,AI龙头企业“CV四小龙”“海大宇”等传统巨头以及百度、阿里巴巴、腾讯等互联网巨头纷纷布局安防、汽车、金融、手机、新零售、无人工厂、智慧农业等场景,使得各公司业务高度重叠,核心技术同质化现象严重,视觉系统市场已成为一片红海。
3.4 高水平研究机构与高端工程应用人才严重匮乏
据清华—中国工程院知识智能联合研究中心与清华大学人工智能研究院调研人工智能学科20个子领域(计算机视觉、机器人、自然语言处理、语音识别、知识工程、机器学习等)全球最具影响力学者与高被引学者数量集中的研究机构发现:中国在高水平学者数量上仅次于美国,但是在高水平学者集中的研究机构方面仅清华大学上榜,其余均为美国机构(Google、Microsoft、MIT、Facebook、Carnegie Mellon University、University of California Berkeley、University of Washington、Stanford University、Intel),这在一定程度上也限制了机器视觉在中国的发展。
4 未来研究方向
机器视觉市场还在不断扩大,新标准、新技术也正在以前所未有的速度发布,智慧农业、无人农场、跨行业协作、高光谱应用都将促进机器视觉技术的进一步应用。未来,在农业生产领域还是将集中在关键技术突破、多传感器融合、3D视觉应用以及与5G移动通信技术深度融合方面。
4.1 3D视觉技术助力农业生产转型升级、创新、革命
3D视觉技术指的是获取或重构目标三维图像的方法,通常分为基于RGB-D深度相机(结构光或TOF)与基于三角定位原理的双目立体视觉两类。将传统的二维图像升级到了具有更多信息的三维图像或许是机器视觉突破发展瓶颈的重要方向。3D图像带来的信息颠覆了2D图像感知世界的方式,使得获取的图像具备更丰富的信息,且消除了外交环境与复杂光线的影响。不但稳定性较好,还能提升用户体验与系统安全性。在智能安防、工业测量、汽车电子、新零售、智慧农业等领域发挥着重要作用,堪称赋能产业创新的最大推力。2D到3D的转变或将成为继黑白到彩色、低分辨率到高分辨率、静态图像到动态影像后的第四次革命。
中国3D视觉独角兽奥比中光是国内唯一实现量产的结构光3D传感器摄像头企业,与苹果、微软等全球巨头并驾齐驱。其3D视觉模组、算法、配套的解决方案可广泛适配于多品牌、多形态的智能终端,正逐步发展开拓农业机器人自主导航、无人机、AR/VR、植物生长信息监测、农产品检测等领域,势必会助力农业生产方式的转型升级,为农业生产带来一场以3D视觉为核心技术的农业生产革命。
4.2 与5G通信技术深度融合,助力智慧农业建设全面提速
5G移动通信技术解决了机器视觉实时性问题,使得高清图像实时传输、多机协同集群作业、高清视频处理成为了可能。2019年9月,海尔联合华为、中国移动、荟萃视觉共同发布全球首个5G+机器视觉解决方案并在海尔冰箱互联工厂率先落地应用。抢先实现5G机器视觉云化、5G智能设备管控、5G+AR远程运维指导等创新应用。2020年3月,华为发布了视觉计划,将“华为安防”更名为“华为机器视觉”,布局了5G在机器视觉领域的应用。5G与机器视觉深度融合解决了视觉系统海量数据实时传输,满足多相机、多场地协同作业的要求。赋能智能制造、智能物流、无人超市、无人农场等行业,同时也赋予了我们更多的想象力。
在智慧农业方面,融合5G移动通信技术的视觉系统具备实时通信、实时数据传输的功能,使得农业装备远程作业、协同作业、实时监测等现代农业作业方式得到进一步应用,为实现现代农业装备高度自动化、智能化甚至无人化提供了技术支撑。进而,加速无人农场的建设,使其有望5~10年内大面积推广,促进智慧农业项目落地。
4.3 多传感器融合的视觉系统将得到进一步应用
农业场景视觉系统虽然已经涉及农业生产全过程,但是,单一的视觉算法难以满足复杂多变的农业户外场景对视觉系统的要求。多传感器融合的视觉系统正好解决了单一视觉系统难以适应变化场景的要求,在农业场景中已经有一定程度的应用。在农作物病虫草害与生长信息监测方面,融合高光谱信息的视觉系统得到广泛应用;在作物生长信息监测与产量估计方面,融合空间遥感、无人机多光谱成像技术以及基于RGB-D深度相机的3D视觉系统正在逐步应用;在果蔬识别定位与采摘方面,基于果蔬成熟度、表面缺陷检测技术的视觉系统也正在崛起;在种子产前检测与果蔬分级方面,融合近红外光谱、机器嗅觉、声学以及核磁共振等先进信息技术的视觉系统在区分水果成熟度、含糖量、表面缺陷等外观与内在品质方面正逐步替代传统机械筛选、分级方法;在农业机器人或无人机定位导航方面,基于RTK技术的视觉系统得到广泛应用。此外,融合光谱信息的视觉系统以及视觉SLAM系统已经成为了学术界研究的热点,并且,围绕农业场景的应用研究已经取得了一定的成果。未来,多传感器融合的视觉系统势必会得到进一步应用,进而推动机器视觉行业的发展。
5 结论
机器视觉技术在农业生产中的应用涉及到农业生产的各个环节,在农业装备定位导航、农作物种子质量检测与筛选、植物病虫害监测、作物生长信息监测、果蔬品质检测与分级等方面发挥着“眼睛”的功能与作用,推动了农业自动化、智能化发展。当前,中国不论是基于机器视觉技术的智能农业装备,还是应用于农业生产的视觉系统在自动化水平、作业精度、可靠性等方面还与美、日、德等发达国家存在一些差距,说明中国的农业智能化之路还有很大的晋升空间。同时,中国也成为继美国、日本之后的全球第三大应用市场,相信随着计算机科学、机器学习等信息技术的发展,机器视觉技术也将不断完善,在农业生产中的应用也将进一步延伸。