APP下载

走进人工智能新时代

2018-02-07宋继强

软件和集成电路 2018年1期
关键词:模态人脸识别机器

宋继强

一个完整的人工智能系统必须具备感知、推理、行动、适应等四大能力。如果要将这四大能力良好贯穿,必须具备较强的记忆能力。

很多人会把人工智能与深度学习划等号,认为人工智能就是深度学习,但这并不是一个全面的认识。如何全面地了解人工智能?人工智能无论从硬件或者软件系统看,都应具备类似人的智能方式对外界的输入做出反应。

人工智能的系统需要具备四个能力。第一是感知能力,感知能力系统可以把外界输入,从物理信号转变成数字信号,在计算机系统中进行处理。第二是推理,系统需要具备场景的理解能力,系统能在场景中进行独立的推理并做出决策。第三是行动,系统可以进行相应的决策或行为规划。第四是适应性,适应性是真正體现系统是否具备学习和自我改善的重要一点。如果一个系统不具备适应性,那么该系统只是一个设定好的智能系统。

人工智能的技术可以分为两大类。一类是机器学习,机器学习是通过大量的数据输入到一个算法中,使算法自动寻找数据中的规律,并形成若干个模型来表示某些问题该如何解决。用训练好的模型、算法再去处理数据获得结果。目前人工智能领域最优秀的工具是深度学习,用高达千层的深度神经网络,对场景进行学习然后解决一个问题。第二类是,数据量对所需要解决的问题应具备完整性,要符合问题的本质。对于英特尔中国研究院来讲,我们希望未来自主智能设备都可以感知、理解,同时对不同场景可以进行相应的行动、反馈和适应。怎样运用先进的科技给设备带来上述能力?首先感知能力非常关键,而且还需要能进行理解和决策,最后再指导行动。

随着AI时代的到来,AI的感知和认识都是发展AI的重要的环节。目前深度学习发展火热,很多企业和院校都在从事AI深度学习的开发,来解决感知层面的问题,但是如何解决跨领域或跨输入模态下的AI感知问题?第一,算法本身要有很好的改进和推动;第二,在硬件领域要改变传统的加速的模式和机器学习方式。

在算法层面。以视觉理解为例,早期的人脸识别包括人的性别、年龄、面部表情等属性。通过传统的方法,或者通过深度学习的方法,可以解决早期的人脸识别问题。如果在一个动态的视频中运用传统的方法进行人脸识别,则相对困难。如果把三维的信息进行重建,得知人脸和身体在一个环境中的朝向,这样可以很好地指导在某个环境中人的运动和操作。同时,如果对人进行理解,情感识别也非常重要,如果只对人脸开发一个人脸识别ID,对于AI的发展推动十分有限,若使用无人机、机器人,或家庭的智能设备等为人提供服务,必须理解人的情感。

这要从人脸识别的视觉感应向前推进,可利用多种模态共同处理。什么是多模态?模态一词是指一种输入的形式和格式。通过模态和知识的相互融合,可以将视频自动转化成文字描述,便可以进行语义信息的后续输出。或者通过视频中问答,来理解环境中多个物体之间所存在的关系,或者跨时间寻找物体之间的关系。

而多模态的视觉理解的发展,可以使机器人获得更加复杂的场景理解能力。特别是服务型机器人,一定要对场景有深刻的理解,才能帮助人进行服务。同时我们面对的是非结构化环境,这种环境存在很多不确定性。现在的芯片技术是否可以满足非结构化环境?目前一种神经拟态计算芯片,可以帮助没有的计算能力的设备,具备计算能力。

机器学习可以帮助解决经验驱动,同时获得更多数据。为什么说经验驱动?因为当数据被人发掘后,便可以知道这些数据所对应的是什么,并对数据进行标注加以机器训练操作,但是如果人无法读出数据的规律,将无法实现端到端的机器训练,因为机器学习非常依赖于数据的可获得性、可观测性和可标注性,只有形成数据的这三个特性,所形成的自然智能,对场景进行理解和推理的自然智能才能自主地进行学习。在传统的计算机编程中,开发者可以根据所需要解决的问题,清晰地规划出该问题的处理流程,并对流程进行相应的开发,而这一过程也被称为已知过程。那么深度学习在其中可以解决什么问题?比如在进行人脸识别、语音识别时,中间的过程很难被描述,这要通过大量的数据训练,来显示中间过程。

那么,当数据并没有那么多,而且还存在不确定性时应当如何解决?其实人脑与深度学习所运用的计算支撑差别很大,深度学习至少需要200W以上的功耗,但是人脑功耗最多20W,人脑依靠少量的数据通过不断地训练来达到强化效果。所以我们希望通过神经拟态计算来解决机器学习问题。神经拟态被命名为LOIHI,着这种计算的模式逐渐给人们提供新的探索机会。自我学习是它的特点,它可以帮助我们解决,比如机器学习、传统的编程模式的规则问题,神经原的密度和连接的可用性决定了它的能力,它是直接受益于摩尔定律的推动。另外通过推动输入输出找在场景中的关联性,最后通过强化学习反复交叉验证自己推导出来的决策是否正确。

(根据演讲内容整理,未经本人审核)endprint

猜你喜欢

模态人脸识别机器
机器狗
机器狗
人脸识别的“国标”来了
中科视拓开放商业版本人脸识别算法
多模态话语理论在英语教学中的应用与前景探析
模态可精确化方向的含糊性研究
荣耀畅玩7C:人脸识别
基于滑动拟合阶次和统计方法的模态阻尼比辨识技术
“人脸识别”人工智能测谎仪研发成功
神奇的独眼机器