APP下载

基于机器学习技术的智能果品识别

2021-02-03马畅遥

数字通信世界 2021年1期
关键词:拍摄角度机器水果

马畅遥

(宁波市惠贞书院,浙江 宁波 315000)

0 引言

水果的品种、甜度有区别,但用肉眼较难区分,日常生活选购时会产生困难。而且我观察到有些不法商家会用不同品种、较低品质的水果冒充高品质、高价格水果,让普通消费者难以识别,所以想到利用机器学习技术,充分发挥人工智能识别精细准确的特点来识别。

1 原理阐述

1.1 机器学习

机器学习是近年来较为流行的一种人工智能技术。机器学习试图让计算机能够模拟人的学习,思考和处理。机器学习从学习角度分为有监督学习和无监督学习。

1.2 有监督学习

有监督学习一般是事先准备一系列已经标注过的数据,将这些标注过的数据作为学习样本,用一些方式来拟合出内部的映射关系,从而推断未标注过的新的数据。在本文案例中,已经标注过的水果照就是学习样本,使用一些拟合算法拟合出内部映射关系后,就可以对新的未标注过的水果照片进行等级识别。

1.3 paddle paddle

PaddlePaddle 是百度开发的一个人工智能深度学习平台,可用于图像处理、自然语言处理、翻译等。内置了主流的人工智能算法,并且支持GPU 加速。而且提供了图形化界面,针对新手非常友好。

1.4 水果图像识别

日常生活中我们会有一些常识性的判断水果好不好吃的方法,例如去买西瓜的时候会去敲一敲听听看声音等。这些方法本质上也是在发现水果的外在属性与其好不好吃之间的联系。例如西瓜好不好吃,可能和瓜纹、瓜蒂、西瓜大小等属性有关系。故而我大胆推测,水果的外表,包含了一部分和水果的好吃与否有一定关系的特征。那么可能可以使用一些人工智能算法,来尝试测算下是否存在这样的关联性,使得光凭水果外表就推算其是否好吃。

2 数据采集

在这个案例中,水果的外观是数据特征(feature),水果好吃不好吃的分类,是标注(label),而我需要做的事情,就是去收集一系列的水果照片(外观特征feature),然后根据好吃不好吃,给它们分类成不同的级别(label)。

受制于实际的实验设备和环境,我无法定量的去根据果糖比例等方法,去量化测量水果的好吃程度,所以我只能退而求其次,根据商场中卖的价格,和该水果品种网上找来的评价,将其分成了11级(level1-level11),level1的品种,价格最贵,网上口碑最好,level11的品种,价格最便宜,口碑较一般。

机器学习算法对于越复杂的特征(feature),越难以识别,越需要高级技巧去调试。我一开始没有控制照片的背景色、光线和拍摄角度,导致数据集的训练效果不太好,大致在67%,所以后来为了减少识别难度,每张水果照片,都是以白色纸头为底进行拍摄,减少周围环境的干扰。

水果拍摄的时候,角度各不相同。为了能覆盖所有的特征(feature),我觉得去采集水果照片时,需要对每一个样本在不同角度多次拍摄采样。

3 数据训练

人工智能涉及到的算法都非常深奥,幸好现在已经出现了很多工具,它们将这些成熟的算法封装成了各种好用的工具。老师给我们推荐了一款工具:PaddlePaddle人工智能框架。这个框架对新手非常友好,所以我们根据老师的教学,使用了PaddlePaddle 的AutoDL Transfer算法进行训练。

因为数据训练的过程中可能会产生过拟合等现象,也同时为了验证数据训练的准确性,所以需要将数据集分成训练集和测试集,大致以9:1的比例将原始标注数据划分。

4 模型验证

经过训练后的模型(model),对测试集的预测准确率大致在79.24%左右,原因可能是样本过少,拍摄角度和光线的训练特征过少。

5 应用场景

防止消费者在日常选购中买到劣等水果,根据个人口味选择合适水果。

水果个体零售商进到符合要求的品种。

6 成果分析

作品完成后进行实地测验,发现准确率大致为75.35%,不是特别高。

7 结束语

本文从生活实际出发,基于人工智能的机器学习技术,有效便利了消费者日常选购水果但由于样本数量不足,拍摄角度和光线的特征过少,本作品识别的准确率还有待提高,针对这一点不足,我会在日后不断增加数据集种类、数量,调整拍摄角度,让本作品更有现实意义。

猜你喜欢

拍摄角度机器水果
机器狗
机器狗
新闻摄像中的角度选择与应用
试析纪录片《航拍中国》的突破与创新
未来机器城
“干跳”
四月里该吃什么水果
水果篇之Cherry
水果畅想曲
好看更好吃的水果餐