自适应机器人交互和机器人开放平台

2018-05-14

机器人产业 2018年4期

机器人作为AI的伴生品得到了飞速的发展，短短几年，智能机器人从蹒跚学步到胜任工作，成为社会的一分子。近日，在2018雷克大会上，英特尔中国研究院机器人交互实验室研发总监任海兵表示，目前的人工智能技术对于服务机器人仍然远远不够。人工智能技术与智能交互算法相结合才是突破技术问题的解决方案。人工智能不确定、不认识、缺乏知识的问题，通过智能交互的提问、移动和操作帮助它进行学习并改正问题，从而真正达到进入家庭的标准。

当前的人工智能技术无法满足

服务机器人的落地应用

如果想要多功能服务机器人能够在5到10年内广泛进入人们的生活，服务机器人必须能够满足以下几点要素：1.低成本；2.为人们提供多种有用的服务，帮助人们解决实际生活中需要和重要的事情；3.有良好、易用的机器人交互（Human Robot Interaction），并且由于机器人在实际生活中总会面对新的情况，需要有自适应学习的能力进行自我完善；4.安全性。

在生活中，机器人拥有众多应用的可能性。比如，它们可以帮助人们接待客人，提醒人们重要的事情，帮助人们拍照片、选视角，聊天，做教练，陪孩子一起学习、下棋……其中一个很重要的应用是对老人的看护，对老人进行情感关怀、日常聊天、紧急情况监控等。

然而，经过对以上应用的分析可以发现，目前的人工智能算法距离这些应用还有一定的差距。这些应用要求我们的算法能够达到基本上百分之百的正确率。目前深度学习算法的神经网络已经达到一千多层，但仍然存在不确定性。更糟糕的是，有的时候算法出错了但不知道自己出错了。此外，家庭中常会出现新的物体、新的任务。由于目前深度学习模型参数都是基于大数据学习出来的，而新的物品只有很少量的数据，如何利用很少量的数据来训练深度学习模型参数是具有挑战性的研究课题。同时，因为算法都是由数据驱动的，是从大数据中学习的，所以它缺乏常识性、个人个性化的知识。因此，我们认为，目前的人工智能技术对于服务机器人仍然是远远不够的，这也是服务机器人尚不能进入家庭的重要原因。

自适应机器人交互是服务机器人

需要突破的关键技术

人工智能技术与智能交互算法相结合是英特尔中国突破上述技术问题的解决方案。人工智能不确定、不认识、缺乏知识的问题，通过智能交互进行自主学习，并改正问题，从而真正达到进入家庭的标准。

英特尔中国正在做三个方面自适应机器人交互方面的研究：第一，自适应对人的理解。其中包括自适应对人的身份的验证、自适应对人的情感的学习以及对人的意图的理解。第二，对环境的理解。其中包括对新的物品的检测、分割以及对整个场景的理解。第三，知识图谱。包括个性化的知识和常识性的知识。我们还会把机器人感知到的所有知识全部输入到知识图谱里。基于这些知识机器人可以做出更高层次的推理，解决上述的不确定性问题。

我们利用机器人进行观察和交互更新它的模型，从而不断提高算法的鲁棒性。为了达到这个目的，英特尔提出了一个“置信度估计”的概念。通过置信度估计，机器人能够知道算法输出的结果是否可靠。如果可靠，即可正式采用这个结果。如果不可靠，则需要主动交互来进行确认。而对于新的物体，则要利用小数据的学习，即少量样本的学习，从而优化模型，认识物体。然后在后续的过程中，采取一些算法来收集高质量的样本，从而进一步提高算法的鲁棒性。对于知识图谱，是通过利用知识图谱自动更新，比如增加个人知识图谱，将符号方法和统计方法结合，从而解决知识不足的问题。

自适应机器人交互能力一：自适应特定人识别

对于自适应机器人的特定人物识别，首先可以利用多模态融合，将声纹、人脸、人体信息等进行融合。基于深度学习和传统学习方法，通过对人的持续观察来更新模型。然后对于每一个模态都估计它的置信度。在做多模态融合时，与一般的固定融合不同，英特尔采用的融合会根据当前的状态和置信度自适应地完成。而模态准确度的提高则需要一些正确、高质量的样本，利用英特尔中国研究院提出智能算法来评估样本质量，自动收集这些高质量样本，自适应优化模型参数，使它的准确度越来越高。

自适应机器人交互能力二：知识图谱及其自动更新

知识图谱包括常识知识图谱和个人知识谱图。机器人在和人的日常交互过程中可以通过直接语音交互以及对人和环境的视觉观察进行信息收集和更新。这些信息不仅包含物体的时空信息，还包含物体之间的相互关系。此外，机器人很重要的一个功能就是知识校验。通过知识校验，机器人可以判断其收集到的信息是否正确，以处理知识冲突问题，例如个人知识图谱与常识的冲突。

自适应机器人交互能力三：自适应物体识别

自适应的物体识别包含通用物体识别和个性化物体定制识别。通常的物体检测和识别分类器都是利用大数据来训练模型参数。但是现在新物体层出不穷，而且物体的外观形状也日新月异，在家庭环境中这些物体只有很少量的样本，无法进行通用的模型参数训练。那么最佳的解决方法就是通过少量的样本，甚至一个样本，就能够进行在线学习。此外，可以学习新的物体类别或实例，通过对物体的持续观察来更新模型。对物体的属性进行估计，比如物体的形状、材质、刚性或是可折叠、颜色，这对于后续过程中对这个估计物体检测结果的置信度有很重要的作用。

英特尔中国有一个很重要的工作就是自适应的情绪、意图识别。这与目前很多人在做的表情识别存在一定的不同，英特尔希望不仅能知道人的表情，也能把人的表情和一些事件结合起來，知道某一些事件或某一个物体对人的喜怒哀乐是有着怎样的影响。这对于看护老人的情感关怀方面等可以起到重要的作用。比如，当老人情绪低落时，机器人可以主动与他们谈起一些会令他高兴、激动的事情。而对人的自适应的意图的识别，通过对环境的理解和对人的历史运动的建模，就可以知道老人是去厨房拿东西了或者老人出门去买菜了。如果机器人能够对未来作出估计，就可以提前对老人发起交互，主动提供帮助。

机器人开放平台

英特尔中国研究院一直在做开放平台研究，目前已经推出了一个HERO机器人开放研究平台。它具有高度灵活性，适合于服务机器人和入门级自动驾驶研究；具有高性能功耗比；具有由FPGA等提供的灵活的I/O处理；还有着对实时系统至关重要的低延迟和固定延迟。此外，很重要的一点是HERO的安全框架。HERO的安全框架包括两个部分：第一，对于机器人自身CPU的安全保护，防止黑客攻击和代码的恶意修改；第二，它也对用户起到保护作用，利用其感知设备去感知外部的障碍物，防止机器人对人造成伤害。

近期，英特尔还推出了Open VINO软件开发包。它支持在边缘设备上部署CNN深度网络模型，是一个统一的应用编程接口，程序员可以统一进行调用。它也是深度学习部署工具包、模型优化器和推理引擎。

（本文根据“2018雷克大会”现场速记整理而成，经本人审阅刊发。）