基于图像识别与生成技术的人工智能应用
2019-04-16王雪淳
王雪淳
摘 要 图像识别与生成技术是计算机通过分析图片而提取图像特征,根据特征来模仿,生成图片的技术。这项技术目前已较广泛应用于手机解锁,司法鉴定,医学诊断,游戏娱乐等领域。图像识别与生成技术在人工智能领域已有多方面的应用,且有极大的上升空间与发展潜力。
关键词 人工智能;图像识别;图像生成
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)232-0153-02
2017年11月3日,苹果公司推出一款可以通过人脸识别技术来解锁的手机iPhoneX,一时大受追捧。这一技术不仅为广大用户提供便利,同时也使大部分人愿意为这样一份新鲜感而买单。一些网页程序,如近期比较热门的网页小游戏image-toimage,可以将用户输入的简单几何形转化为猫,建筑物等实物图像。本文将简要分析这些应用背后的图像识别与生成技术。
1 人工智能概述
人工智能,是一门研究、开发用于扩展人类智能的理论、方法、技术及应用系统的科学技术[ 1 ]。它起源于20世纪50年代,至今已经过了多个瓶颈期和突破期,其中最新的一个突破源于近五年计算机数据科学的蓬勃发展所带来的大数据技术。人工智能是计算机科学的一个分支,主要以能做出与人类相似的反应,并胜任一些需要人工智能才能完成的复杂工作为目标,具体研究领域包括机器人,语言识别,图像识别,自然语言处理和专家系统等领域。其中主要分为具备自我思考、自我推理及解决问题能力的强人工智能,及不具备此类能力的弱人工智能[ 2 ]。
2 图像识别技术及其在人工智能中的应用
2.1 图像识别技术原理
图像识别技术,是一种计算机通过提取图像关键性重要特征以识别各种不同模式的目标和对象的技术。这一技术已经得到了深入的研究和广泛的发展,是计算机学科领域非常重要的研究方向之一[ 3 ]。
2.2 人工智能图像识别应用
人工智能图像识别广泛应用与多个领域,如司法、娱乐等,同时还与医学等学科有交叉。
1)識别笔迹。其在司法笔迹鉴定中的应用也较为成熟,能分析且提取笔迹形态上的特征,如长宽比,字间距,笔画粗细,折笔角度等关系,实现笔迹鉴定。但同时也存在一些如对于摹仿签名笔迹的有效识别率较低等问题[ 4 ]。对笔迹的识别研究是法务判断的重要参考。在经济领域,涉及合同签名等问题中,笔记鉴定显得尤为重要。除此,笔记识别还可鉴定收藏品中的名家笔墨,是真品还是赝品,抵制贩卖假货的行为,保护公民个人财产。
2)识别绘画图像。一些小程序游戏可成为开发者前期训练人工智能的绝佳场所。“猜画小歌”就是这样是一款谷歌推出的微信游戏小程序,其主要内容是人工智能识别玩家的简笔画。游戏的玩法类似“你画我猜”,但游戏的参与者不全是真人玩家。在玩家画画的同时,人工智能可以不断地提供猜测的答案并显示在手机屏幕上,直到猜对正确答案或游戏时间(每轮20秒)结束为止。“猜画小歌”可以通过预先分析上万张手绘简笔画,提取其中不同物体的关键特征,掌握群众绘图时的基本思路。然后当用户们只画下简单的线条,甚至是人类也看不出所画何物时,“猜画小歌”可以迅速将线条与数据库匹配,继而给出答案[ 5 ]。由于小程序游戏的广泛传播与极易上手,越来越多的用户为“猜画小歌”的数据库提供素材,从而促进人工智能领悟人类绘画时的思维习惯,不仅降低前期训练人工智能成本,也大大提高训练效率。
3)识别实物图像。人工智能的图像识别技术还可识别人脸和植物等实物。
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸可受发型,胡子,妆容,光源等影响,故此人脸识别需要先分割人脸,才能提取人脸特征,如五官大小,分布间的参数比例等,建立三维人脸模型,再匹配和识别人脸。此项技术极广泛的应用于日常生活,如人脸识别解锁手机,超市中识别人脸后即可用相应账户付钱[ 6 ]。随其安全性仍饱受争议,但不可否认人脸识别技术的发展也为社会带来极大的便捷。
“花伴侣”App是一款植物智能识别App,由于花卉种类繁多,分布广泛,特性相异,光建立数据库就已是一项庞大的工程。制作团队选取众多花的照片,进行分析鉴定,现已实现五千多种中常见植物的智能识别[7]。这一大众化App使用户们每拍一张照片,就可了解所见一些常见植物的相关知识,更易满足人们求知欲,同时也为科学研究作出一定贡献。
4)识别医学诊断。病理图像是疾病诊断的金标准,医师通过分析图像中细胞属性来进行诊断决策。数字病理切片是将整张载玻片进行全信息、全方位快速扫描,使物质化的玻璃载玻片变成数字化的病理切片[8]。计算机可识别组织中的肿瘤,并将结果快速输出成病理报告,从而为医师减负,也大大提高就诊效率与准确率。在中医领域,计算机也可以识别不同植物的纹理,判断中药真假,甚至能推测其作用部位。这些应用都降低医生工作难度,也降低误诊率,为人类社会提供更好的就医体验。
3 图像生成技术及其在人工智能中的应用
图像生成技术有助于人工智能的机器学习等系统,促进其将接收到的信息转化为系统可以理解与处理的信息,使自我知识体系不断完善,逐渐降低对人类专家依赖程度,从而使性能提高。
3.1 图像生成技术原理
图像生成技术指系统通过计算机视觉尝试分析一副或多副二维图像,感知几何信息,提取其中特点,而用能力模仿特征生成相关图像。
3.2 人工智能图像生成应用
基于图像生成技术,人工智能可模仿人类书写效果或名画家绘画风格,可将实物与绘图相互转换。同时,图像生成技术对于虚拟现实、人机交互、网络辅助教学等都有广泛应用。
1)生成笔迹。笔记生成技术主要是计算机对人类的真实书写进行分析,从而能模仿出其书写风格。但由于在电子产品上书写时,没有压感,机器必须先分析真实毛笔的笔刷形态,笔锋等进行分析,建立相关笔刷模型,在分析人类书写时的速度,从而调整笔画粗细与笔锋,生成能具体体现书写者书法效果的字体[ 9 ]。然后人类在电子产品中写下的字体就更美观也更真实,促进无纸化办公发展。