基于深度学习的机器视觉技术在工业领域中的应用

2020-12-06朱芯鸿王虹力陈黎茜王孜张治勇

科学导报·学术 2020年49期

朱芯鸿王虹力陈黎茜王孜张治勇

摘要：在科技发展快速的现代社会，将技术与传统产业链结合是必然趋势。在工业视觉领域应用深度学习的案例及其常见。但是短时间内基本的深度学习相关方法不会有大突破。大多数企业在利用传统特征图像算法在进行很简单的图像识别、查找、比对等基础工作，同时辅助相关设备会把握量度实现其检测异常等相关功能。本文将基于深度学习的机器视觉技术分析在工业领域中的系列应用，仅供读者参考。

关键词：深度学习;机器视觉;工业

引言：

深度学习近乎成了计算机视研究及应用的标配。人脸识别、视频识别、视频识别、行人检测、图像识别、大规模场景的识别的有关论文大多提及到深度学习。深度学习相比于其他的AI实现方法，是一副碾压的姿态。同时在工业领域，计算机视觉应用积极广泛，而计算机视觉又离不开深度学习。

1.深度学习概述

深度学习通过建立，模拟人脑的分层结构来实现对外部输入的数据进行从低级到高级的特征提取，从而能够解释外部数据。[1]作者认为深度学习主要是多层神经网络。目前，多层神经网络效果最佳的就是卷积神经网络。它虽然在自然语言处理大模块中没有体现出来，但它在音频和图像信号效果极佳。从统计学的角度来讲，深度学习就是预通过系列特征点，预测数据的分布，甚至可以说是预测成一个具有特征的函数分布图像。然后在通过这样一个本身构造的模型去预测新的数据，要求是训练数据和测试数据是同类分布。

定义深度学习模型，是为了解决以下的问题：

1）激活函数，对应神经元的激活值。一般的有 tanh、logistic、以及ReLU。

2）代价函数。代价函数大多采用欧式距离，也就是优化问题。

3）优化策略。最简单的办法就是梯度下降。

深度学习本质就是机器学习，它可以自动的学习特征，因为算法可以通过不断迭代自动认知并学习物体特征。

2.机器视觉技术的分析

机器视觉主要研究用计算机来模拟人的视觉功能从客观事物的图像中提取信息，进行处理并加以理解，最终用于实际检测，测量和控制。[2]它严重依赖于数据。因为不仅需要海量的数据组成数据库，更需要平衡的数据，令在特定场景下的所有数据是平均分布的。这就需要不断地采集、标注以及清洗，做好数据优化和管理。

2.1图像处理

图像处理及视频处理本身就是是大多数工业产品的基础，例如手机电视摄像头等，随着芯片的集成度越高，愈发离不开此技术。图像处理本质上就是在一定假设条件下的信号重建。这并非3d重建，而是指类似噪声的原始信息，进行相关信号处理。对于特征物体进行去噪、去雾、去模糊、去鬼影等系列操作，并利用特定图像滤波器生成具有特征的高频分量。最后进行恢复和着色，形成固定的框架模型。

2.2计算机视觉的预处理

计算机视觉需要采取特征，提取包括提取特征点，边缘轮廓之类的图像预处理。做这样类似的处理时也不能放过细节，因为细节会被过强的图像线条掩盖。一般操作是进行特征提取、边缘提取、进行特征匹配。

2.3机器视觉的高层：环境理解

首先是进行语义分割，利用特征分割演变成各类模型。其次，进行特征检测，最有代表性的莫过于人脸识别。最后就是目标跟踪，可以用CNN或者RNN模型求解。

3.基于深度学习的机器视觉技术——四大应用场景

3.1通行空间检测

需求：对车辆的可行驶区域与未知边界进行划分。

检测难点：难以应对复杂的类似十字路口、绿化带、坑洼路面、水坑等障碍物边界。

实现方案：利用相机标定或自适应地调整标定参数，利用车辆IMU信息获得的俯仰角获取信息。深度学习在当中扮演的是特征描述的角色，在很多具有不同特征的网站当中进行数据挖掘，连接特征点，构造相应的模型。

3.2动态物体检测

需求：对行人车辆等动态物体的准确识别。

检测难点：测距精度足够准、检测类别多、多目标追踪难度大