基于TensorFlow的图像识别水果秤设计与实现

2022-04-13许龙铭麦启明卢家俊陈苇浩

电子设计工程 2022年6期

许龙铭，麦启明，卢家俊，陈苇浩

（广州城市理工学院通信工程学院，广东广州 510800）

智慧农业已成为当今现代农业发展的大趋势[1]，而水果图像的识别在智慧农业领域具有重要的地位[2]。传统的水果秤需要通过人工辨别水果的种类，然后选择对应的价格进行计价操作。在该方式下，由于人的分辨能力以及记忆有限，所以计价环节容易出错，特别是在大型超市中，会带来不小的经济损失。文中设计的是一个采用图像识别技术实现的自动水果秤，能够通过机器视觉识别出水果的种类，然后自动进行称重计价操作，通过触摸屏进行信息提示以及语音播报称重计价结果，并且系统能够辨别不同种类水果混装的情况，然后进行拒绝称重计价以及报警提示操作。

1 方案设计

图像识别水果秤的系统结构如图1 所示，主控制器使用NVIDIA 推出的GPU 主控制器Jetson Nano，该控制器内置了128 个NVIDIA CUDA®核心，十分适合边缘部署AI 应用程序。结合CSI 摄像头、称重传感器、语音模块和触摸屏搭建硬件电路。

整个图像识别水果秤主要由5 个部分组成，分别是：

1）Jetson Nano，用于进行图像识别核心的边缘计算、传感器数据处理以及显示控制等操作。

2）CSI 摄像头，用于采集实时检测目标的图像数据。

3）称重电路，在完成目标的种类识别后进行重量检测，通过重量和预设的单价计算出总价。

4）语音电路，负责与消费者进行非接触式人机交互，通过语音交互完成水果秤的称重、计价以及购买。

5）触摸屏，为管理员提供水果单价设置、支付方式设置等操作。

2 硬件设计

2.1 Jetson Nano

Jetson Nano搭载了四核Cortex-A57处理器，拥有足够的AI 算力，以并行的方式运行多个神经网络。安装了NVIDIA JetPack 软件包后，可通过深度学习、计算机视觉、加速计算和多媒体的库进行快速应用层软件开发，而且支持各类传感器的驱动程序。

2.2 CSI摄像头电路

摄像头电路采用索尼IMX219 芯片，分辨率达到800 万像素，通过15PIN 排线直连到Jetson Nano的CSI 相机接口。由于Jetson Nano 出厂的ubuntu 系统提供CSI 协议的相机驱动，因此主控制器可以免驱驱动IMX219 摄像头，最大支持3 280×2 464 分辨率的图像采集，保证了目标原图的高画质。

2.3 CSI称重电路

称重电路使用海芯科技集成电路技术的HX711芯片。HX711是专为电精度电子秤而设计的芯片，内部集成有放大部分和24 位A/D 转换部分[3]，集成了电源电路、时钟电路，具有响应速度快、抗干扰性强等优点。

称重电路如图2 所示，将桥式传感器接入HX711的模拟输入通道A，即接入一个增益可编程的放大器，信号放大后再进行转换处理。HX711的输出为串口输出，通过DOUT和PD_SCK 引脚进行控制。当DOUT 出现下降沿时，Jetson Nano 马上输入25～27 个脉冲，分别读取24 位转换数据以及选择下一次转换的通道、增益参数。

图2 称重电路

2.4 语音电路

语音电路的主芯片采用XFS5152CE，XFS5152CE芯片是科大讯飞股份有限公司最新推出的一款高集成度的语音合成芯片[4]，除了提供语音编码功能的中、英文语音合成、中英文混读功能外，还集成了语音识别功能。通过XFS5152CE 芯片可实现水果秤与用户的离线语音交互功能。XFS5142CE 支持SPI、UART和I2C 3 种常用的驱动方式，文中选用的是UART 驱动，Jetson Nano 与XFS5152CE通过串口协议进行通信。

语音电路构成框图如图3 所示。当Jetson Nano按协议发送驱动命令以及文本时，XFS5152CE 将接收的文本合成对应的语音信号进行输出，经过功率放大器放大后的信号最后连接喇叭完成播放。语音识别功能则由麦克风采集音频数据，由芯片内部的语音识别模块转换为文本模式的识别结果，最后通过串口发送给Jetson Nano 进行处理。

图3 语音电路构成框图

3 软件设计

3.1 UI设计

系统软件使用Python3.8 进行编程，首先需要进行交互GUI界面设计。在制作GUI界面时，一般可以通过GUI制作工具和纯代码编写两种方式来实现[5-6]，文中使用Qt5编写。Qt5隶属于Qt跨平台开发框架[7]，由于Python 无法解析Qt5 编写的UI 文件，通过安装第三方模块PyQt5 将UI 文件转换为.py 文件，创建界面类对象即可运行交互UI。

3.2 搭建图像识别神经网络模型

随着标记数据和GPU 技术的发展，针对卷积神经网络[8-14]的研究取得了丰硕的成果，进而引起了大家对这种高效深度学习识别算法的广泛关注[15]。深度学习利用其强大的特征学习能力，GPU的高速计算以及计算机硬件成本的降低等优势，在目标检测任务中得到大量应用[16]。文中图像识别部分技术主要通过搭建卷积神经网络模型来实现水果种类预测。

模型的搭建需要用到大量的图片资源，文中直接从Kaggle 网站上下载需要的水果图片资源。Kaggle 是Google 旗下的一个全球性的线上数据挖掘与机器学习竞赛平台，是全球最大的数据科学家社区[17]。

Kaggle 网站中Fruits 360 类别下提供了131 种水果和蔬菜的图片，其中训练集图片源如图4 所示，使用训练集的图片源完成模型的训练后，下载对应的测试集图片源进行模型的测试。