APP下载

人工智能现状:哪些是炒作,哪些是真实?

2019-12-26MichaelBerthold

计算机世界 2019年41期
关键词:机器语音神经网络

Michael Berthold

拿起杂志,浏览技术博客,或在行业会议上与同行聊天。你会很快注意到,技术世界中几乎所有的事物似乎都有人工智能或机器学习的元素。讨论人工智能的方式,听起来像是在宣传布道。人工智能是一种可以满足我们所有需求的真正技术! 它们正在拯救我们所有人!

我们可以使用基于人工智能的技术做许多神奇的事情,这是真的。但是通常情况下我们并没有完全体现“智能”这一术语的含义。智能意味着一个人们可以与之进行创造性对话的系统,即具有思想和创新能力的系统。这一术语存在着争议。今天的“人工智能”通常描述的是实现了人类在某些方面的能力,例如物体或语音识别,但肯定不是人类智慧的全部潜力。

因此,对于描述我们今天正在使用的“新”机器学习技术来说,“人工智能”可能并不是最佳术语,但是事已至此,尽管机器学习还不是机器智能的代名词,但是它们无疑已经变得更加强大,更具能力并且更易于使用。人工智能(指神经网络、深度学习以及“经典”机器学习)最终将成为分析工具包的标准组成部分。

既然我们已经进入了AI革命,或者更确切地说是进化,那么重要的是要看一下人工智能的概念被采纳的方式、原因以及未来的意义。下面让我们更为深入地研究探讨一下人工智能(即使是一些误解的说法)在当今引起关注的原因。

人工智能的爆发:为什么是现在?

在当前的炒作周期中,人工智能或机器学习经常被描述为是相对较新的技术。这些技术正突然变得成熟起来,并在最近从概念阶段过渡到应用程序集成阶段。

人们普遍认为,独立的机器学习产品是最近几年才开发出来的。实际上,人工智能取得的重要发展成就并不是新事物。今天的人工智能只是过去几十年来取得的进步的延续。变化与AI技术本身并无太大关系,而是与人工智能技术相关的周边技术,即数据生成和处理能力。我们之所以会误认为人工智能技术发生了变化,是因为人工智能技术出现在了许多地方。

我并不想用“我们很快就要存储多少ZB数据”这样的话让大家感到焦虑不安。我们都知道,我们生成和收集数据的能力正在显著增长。同时,我们发现可用的计算能力也在惊人地增长。从单核处理器向多核的转变以及通用图形处理单元(GPGPU)的开发和采用为深度学习提供了足够的算力。我们甚至不需要内部处理计算,只需简单地租用云端中某个地方的算力即可。

有了如此多的数据和大量的计算资源,数据科学家终于可以使用完全不同于过去几十年的方法。在20世纪90年代,需要花上几天的时间训练神经网络来识别数以万计的手写样本数字。如今,我们可以通过数以千万计的图像来训练更复杂的(即“深度”)神经网络,以识别动物、面容和其他复杂物体。我们可以部署深度学习模型以实现主流业务应用程序中的任务和决策自动化,例如检测和预测产品成熟度或路由打入的电话。

这听起来可能像建立真实的智能一样令人感到可疑,但是需要着重指出的是,在这些系统下,我们只是在调整数学性相依参数,尽管这是一个相当复杂的参数。人工智能方法并不擅长获取“新”知识,它们只能从呈现给它们的东西中学习。换句话说,人工智能不会问“为什么”这样的问题。系统的运行方式不会像孩子在试图了解周围世界时不断向父母问这问那。系统只知道它被“喂”了什么,它们不会识别以前未出现过的任何东西。

在其他“经典”机器学习场景中,了解我们的数据并清楚我们希望该系统如何找到模式非常重要。例如,知道生日对客户是没有用的,除非将生日转换为客户的年龄。我们也都知道季节性的影响,但是我们不应该期望系统会独立于季节来学习时尚购买方式。此外,我们可能还想在系统中注入一些其他信息,让系统在已知的基础上进行学习。与深度学习不同,这种机器学习已经被企业使用了数十年时间,并正在稳步发展。

人工智能的最新进展主要集中在数据科学家能够模仿人类识别能力的领域,例如识别图像中的对象或声音信号中的单词。对于识别诸如音频流或图像之类的复杂信号中的东西,其学习能力是非常强大的,强大到足以使许多人怀疑为什么我们没有在所有地方都使用深度学习技术。

人工智能的现状:现在是什么情况?

企业领导者可能会问他们什么时候应该使用人工智能。在神经网络解决与模仿人类擅长行为方面(对象识别和语音识别是两个最突出的例子)基于AI的研究已经取得了巨大进展。每当有人问“好的对象表示法是什么?”且你无法回答时,深度学习模型就可能值得尝试一下。如果数据科学家能够构建语义丰富的对象表示形式,那么经典的机器学习方法可能是一个更好的选择(尝试找到一个好的对象表示形式是值得认真花一些心思的)。

人们只是想在同一平台上尝试不同的技术,他们不想让软件供应商限制他们的选择,也不想因软件供应商无法跟上当前发展而影响到他们的选择。这就是为什么开源平台是该市场的领导者的原因。这样可以使从业人员将当前的最新技术与最新的前沿技术相结合。

展望未来,随着团队在使用机器学习来实现目标和方法上变得一致,深度学习将成为每个数据科学家工具箱的一部分。对于許多任务来说,在其中添加深度学习方法将提供巨大的价值。由于当前人们已经在收集和注释足够的数据方面遇到了麻烦,因此我们通过预先训练的人工智能系统合并现有的语音或语音识别组件。最终我们会意识到,就像之前的经典机器学习一样,深度学习实际上只是另一种工具而已。

人工智能的前景:接下来将如何发展?

就像二十年前一样,我们面临的障碍之一是:理解人工智能系统学到的东西以及它们是如何做出预测的是一件极为困难的事情。在预测客户是否喜欢某一特定产品时,这一点可能并不重要。但是,当解释为什么一个与人类交互的系统会以一种意想不到的方式运行时,问题就出现了。人类愿意接受“人类的失败”,因为不期望人类是完美的。但是我们不会接受人工智能系统的失败,尤其是如果我们不能解释它们失败的原因(并进行纠正)。

随着我们对深度学习的逐渐熟悉,我们将意识到(就像我们二十年前对机器学习所做的那样),尽管系统很复杂且用于训练的数据量很大,但是如果没有领域知识,就无法理解许多模式。人类的语音识别之所以如此有效,是因为我们通常可以通过了解当前对话的上下文来弥补未听出来的地方。

当今的人工智能系统还没有这么强的理解能力。我们现在看到的智能还处于非常浅显的阶段,即模仿孤立的人类识别能力,有时甚至在孤立的任务中它们表现的要优于人类。通过数十亿个示例对系统进行训练如今仅仅是关系到拥有的数据量和足够计算资源的问题,已经不再是成败的决定性条件。

人工智能还远远达不到像宣传的那样“拯救世界”。不过,它们将成为人们手中的一件令人难以置信的工具,帮助人们更快更好地完成工作。

本文作者Michael Berthold为开源数据分析公司KNIME的联合创始人兼首席执行官。其在数据科学领域拥有25年以上的工作经验,在学术界曾先后担任过加利福尼亚大学(伯克利分校)、卡内基梅隆大学、德国康斯坦茨大学的教授,在产业界先后担任过英特尔的神经网络小组、Utopy和Tripos的专家。

原文网址

https://www.infoworld.com/article/3438322/artificial-intelligence-today-whats-hype-and-whats-real.html

猜你喜欢

机器语音神经网络
机器狗
机器狗
神经网络抑制无线通信干扰探究
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
未来机器城
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用