Habana Labs宣布推出全球性能最高的人工智能推理处理器

2018-09-10刘骏

计算机与网络 2018年19期

刘骏

Habana Labs近日宣布，该公司正式退出隐身模式，将面向精选客户推出首个人工智能处理器样品。基于其Goya HL-1000处理器的PCIe卡可基于ResNet-50推理基准实现每秒15 000张图片的吞吐量，延迟时间为1.3 ms，功耗仅为100 w。与如今数据中心部署的一般解决方案相比，Habana Labs人工智能处理器的性能要高出1～3个数量級。

旨在处理各种人工智能推理工作负载，如图像识别、神经机器翻译、情感分析、推荐系统以及许多其他应用，Habana Labs的Goya平台从头设计，目标实现深度学习推理。该平台集完全可编程的Tensor Processing Core、开发工具、图书室和编译程序于一体，共同打造一个高性能且节能的全方位平台。

Habana Labs首席商务官艾坦·麦地那表示：“Habana Labs拥有一个一流的团队，目标改变云端、数据中心以及其他新兴应用的人工智能处理方式。2016年公司才成立，现在就取得这样的产品里程碑，非常了不起。我们将继续专注于打造成功、长久的人工智能处理器公司，长期为快速成长的高性能人工智能领域提供服务。”

Habana Labs董事长兼主要投资人阿维格多·威伦兹说：“30年来，我参与过一些提供最先进VLSI设备的团队，但几乎没见过哪个团队有这样高水平的执行力。从概念到经过严格测试并准备好投产，我们的Goya硅片仅仅用了不到一年的时间。这项振奋人心的成就以及Habana Labs将于未来几个季度提供的平台将使我们的客户能够引领人工智能革命。”

Habana Labs的SynapseAI软件栈对训练模型输入进行分析和优化，以通过Goya处理器实现高效推理。这款软件包括一个丰富的内核库，其工具链是开放的，供客户添加专有内核。这款软件可与TensorFlow和ONNX等颇受欢迎的深度学习神经网络框架无缝交互。

Habana Labs将于2018年9月18日～19日在加州山景城举办的人工智能硬件峰会（AI Hardware Summit）上通过一个一般服务器展示Goya推理处理器，运行多个神经网络拓扑技术。

Habana Labs计划于2019年第二季度推出首个Gaudi训练处理器样品。每个设备，Gaudi拥有2T bps的吞吐量，其训练性能线性扩展至数千个处理器。