基于深度学习的机器视觉技术在工业领域中的应用
2020-12-06朱芯鸿王虹力陈黎茜王孜张治勇
朱芯鸿 王虹力 陈黎茜 王孜 张治勇
摘 要:在科技发展快速的现代社会,将技术与传统产业链结合是必然趋势。在工业视觉领域应用深度学习的案例及其常见。但是短时间内基本的深度学习相关方法不会有大突破。大多数企业在利用传统特征图像算法在进行很简单的图像识别、查找、比对等基础工作,同时辅助相关设备会把握量度实现其检测异常等相关功能。本文将基于深度学习的机器视觉技术分析在工业领域中的系列应用,仅供读者参考。
关键词:深度学习;机器视觉;工业
引言:
深度学习近乎成了计算机视研究及应用的标配。人脸识别、视频识别、视频识别、行人检测、图像识别、大规模场景的识别的有关论文大多提及到深度学习。深度学习相比于其他的AI实现方法,是一副碾压的姿态。同时在工业领域,计算机视觉应用积极广泛,而计算机视觉又离不开深度学习。
1.深度学习概述
深度学习通过建立,模拟人脑的分层结构来实现对外部输入的数据进行从低级到高级的特征提取,从而能够解释外部数据。[1]作者认为深度学习主要是多层神经网络。目前,多层神经网络效果最佳的就是卷积神经网络。它虽然在自然语言处理大模块中没有体现出来,但它在音频和图像信号效果极佳。从统计学的角度来讲,深度学习就是预通过系列特征点,预测数据的分布,甚至可以说是预测成一个具有特征的函数分布图像。然后在通过这样一个本身构造的模型去预测新的数据,要求是训练数据和测试数据是同类分布。
定义深度学习模型,是为了解决以下的问题:
1)激活函数,对应神经元的激活值。一般的有 tanh、logistic、以及ReLU。
2)代价函数。代价函数大多采用欧式距离,也就是优化问题。
3)优化策略。最简单的办法就是梯度下降。
深度学习本质就是机器学习,它可以自动的学习特征,因为算法可以通过不断迭代自动认知并学习物体特征。
2.机器视觉技术的分析
机器视觉主要研究用计算机来模拟人的视觉功能从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测,测量和控制。[2]它严重依赖于数据。因为不仅需要海量的数据组成数据库,更需要平衡的数据,令在特定场景下的所有数据是平均分布的。这就需要不断地采集、标注以及清洗,做好数据优化和管理。
2.1图像处理
图像处理及视频处理本身就是是大多数工业产品的基础,例如手机电视摄像头等,随着芯片的集成度越高,愈发离不开此技术。图像处理本质上就是在一定假设条件下的信号重建。这并非3d重建,而是指类似噪声的原始信息,进行相关信号处理。对于特征物体进行去噪、去雾、去模糊、去鬼影等系列操作,并利用特定图像滤波器生成具有特征的高频分量。最后进行恢复和着色,形成固定的框架模型。
2.2计算机视觉的预处理
计算机视觉需要采取特征,提取包括提取特征点,边缘轮廓之类的图像预处理。做这样类似的处理时也不能放过细节,因为细节会被过强的图像线条掩盖。一般操作是进行特征提取、边缘提取、进行特征匹配。
2.3机器视觉的高层:环境理解
首先是进行语义分割,利用特征分割演变成各类模型。其次,进行特征检测,最有代表性的莫过于人脸识别。最后就是目标跟踪,可以用CNN或者RNN模型求解。
3.基于深度学习的机器视觉技术——四大应用场景
3.1通行空间检测
需求:对车辆的可行驶区域与未知边界进行划分。
检测难点:难以应对复杂的类似十字路口、绿化带、坑洼路面、水坑等障碍物边界。
实现方案:利用相机标定或自适应地调整标定参数,利用车辆IMU信息获得的俯仰角获取信息。深度学习在当中扮演的是特征描述的角色,在很多具有不同特征的网站当中进行数据挖掘,连接特征点,构造相应的模型。
3.2动态物体检测
需求:对行人车辆等动态物体的准确识别。
检测难点:测距精度足够准、检测类别多、多目标追踪难度大
实现方案:给出3Dbounding box,给出车的高度类似的信息,加入多目标跟踪算法,根据现实场景增加一些几何约束条件,降低误检率,提高检测率。动态物体检测当中的深度学习,实质上是在图像描述和语言描述之间建立桥梁。帮助理解图像,及深入分析问题的组成,构造模型描述之间的交互过程。
3.3静态物体检测
需求:对交通标志、交通红绿灯等静态物体进行检测识别。
难点:交通标识和红绿灯属于小物体检测,在照片和视频占比的像素点极小,首先需要对红绿灯进行准确识别才可以进行下一步操作。
实现方案:通过数据集采集进行标签处理,同时诱发检测模型训练。利用部署好的算法,追踪后端优化,做好接口开发。
3.4车道线检测
需求:对对各类车道线包括线性的颜色和减速线等特殊的车道线进行检测。
难点:线型种类多、路线复杂例如上下坡、弯曲的车道线、远端的车道线、等都会造成车道的拟合线难度较大。
实现方案:通过摄像头的校正,使用滑动窗口、直方图等拟合车道曲线,打好标签,选取轻量级网络,更好的配适结合车辆信息,做好航位推算。
结语:
深度学习目前相对其它AI实现方法占優的4个特点:工程框架、算法通用、统一精度好、特征推广性好。这应该可以解释深度学在AI界有举足轻重地位的原因。工业检测领域具有广阔应用前景,给机器视觉等相关领域奠定了基石。随着算法、传感器的进步,生产标准化的推广,会展现出极大的商业价值。
参考文献
[1] 郭丽丽,丁世飞. 深度学习研究进展[J]. 计算机科学,2015,042(005):28-33.
[2] 段峰,王耀南,雷晓峰,等. 机器视觉技术及其应用综述[J]. 自动化博览,2002,19(3):59-61.