APP下载

企业级人工智能需要更多

2018-08-28NaveenRao

中国信息化周报 2018年23期
关键词:单芯片企业级开发者

Naveen Rao

在旧金山举行的英特尔人工智能开发者大会上,介绍了有关英特尔人工智能产品组合与英特尔NervanaTM神经网络处理器的最新情况。我们意识到,英特尔需要与整个行业进行协作,包括开发者、学术界、软件生态系统等等,来释放人工智能的全部潜力。正是这种广泛的合作帮助我们一起赋能人工智能社区,为加快人工智能领域的技术创新和进步提供所需的硬件和软件支持。

在加速向人工智能驱动的未来计算过渡之时,我们需要提供全面的企业级解决方案。这意味着我们的解决方案要提供最广泛的计算能力,并且能够支持从毫瓦级到千瓦级的多种架构。企业级的人工智能还意味着支持和扩展行业已经投资开发的工具、开放式框架和基础架构,以便更好地让研究人员在不同的人工智能工作负载中执行任务。例如人工智能开发者越来越倾向于直接针对开源框架进行编程,而不是针对具体的产品软件平台,这样有助于更快速、更高效的开发。我们在大会上发布的消息涉及所有这些领域,并公布了几家新增的合作伙伴,这都将帮助开发者和我们的客户更快速地从人工智能中受益。

英特尔人工智能产品组合

英特尔近期的一项调查显示,在我们的美国企业客户中,50%以上都正在转向采用基于英特尔至强处理器的现有的云解决方案来满足其对人工智能的初步需求。这其实肯定了英特尔的做法——通过提供包括英特尔至强处理器、英特尔Nervana和英特尔Movidius技术以及英特尔FPGAs在内的广泛的企业级产品,来满足人工智能工作负载的独特要求。

英特尔至强可扩展处理器的优化,与前一代相比,这些优化大幅提升了训练和推理性能,有利于更多公司充分利用现有基础设施,在迈向人工智能初始阶段的过程中降低总体成本。最新的英特尔Nervana神经网络处理器(NNP)系列也有更新消息分享:英特尔Nervana神经网络处理器有着清晰的设计目标,即实现高计算利用率,以及通过芯片间互联支持真正的模型并行化。行业谈论很多有关理论峰值性能或TOP/s数字的话题。但现实是,除非架构设计上内存子系统能支撑这些计算单元的充分利用,否则很多计算是毫无意义的。此外,业内发表的很多性能数据采用了很大的方形矩阵,但这在真实的神经网络中通常是不存在的。

英特尔致力于为神经网络开发一个平衡的架构,其中也包括在低延迟状态下实现芯片间高带宽。我们的神经网络处理器系列进行的初步性能基准测试显示,利用率和互联方面都取得了极具竞争力的测试结果。具体细节包括:

使用A(1536, 2048)和B(2048, 1536)矩阵大小的矩阵-矩阵乘法(GEMM)运算,在单芯片上实现了高于96.4%的计算利用率1。这意味着在单芯片上实现大约38 TOP/s的实际(非理论)性能。针对A(6144, 2048)和B(2048, 1536)矩阵大小,支持模型并行训练的多芯片分布式GEMM运算实现了近乎线性的扩展和96.2%的扩展效率,让多个神经网络处理器能够连接到一起,并打破其它架构面临的内存限制。

在延迟低于790纳秒的情况下,我们测量到了达到89.4%理论带宽的单向芯片间传输效率3,并把它用于2.4Tb/s的高带宽、低延迟互联。

这一切是在总功率低于210瓦的单芯片中实现的,而这只是英特尔Nervana神经网络处理器原型产品(Lake Crest)。该产品的主要目标是从早期合作伙伴那里收集反馈。

我们正在开发第一个商用神经网络处理器产品英特尔Nervana NNP-L1000(Spring Crest),计划在2019年发布。与第一代Lake Crest产品相比,我们预计英特尔Nervana NNP-L1000将实现3~4倍的训练性能。英特尔Nervana NNP-L1000还将支持bfloat16,这是业内广泛采用的针对神经网络的一种数值型数据格式。未来,英特尔将在人工智能产品线上扩大对bfloat16的支持,包括英特尔至强处理器和英特尔FPGA。这是整个全面战略中的一部分,旨在把领先的人工智能训练能力引入到我们的芯片产品組合中。

面向真实世界的人工智能

英特尔正在与Novartis合作,使用深度神经网络来加速高内涵筛选——这是早期药品研发的关键元素。双方的合作把训练图片分析模型的时间从11小时缩短到了31分钟——改善了20多倍。为了让客户更快速地开发人工智能和物联网应用,英特尔和C3 IoT宣布针对优化的AI硬软件解决方案进行合作——一个基于Intel AI技术的C3 IoT AI应用。此外,我们还正在把TensorFlow、MXNet、Paddle Paddle、CNTK和ONNX等深度学习框架集成在nGraph之上,后者是一个框架中立的深度神经网络(DNN)模型编译器。我们已经宣布,英特尔人工智能实验室开源了面向Python*的自然语言处理库,帮助研究人员开始自己的自然语言处理算法工作。

猜你喜欢

单芯片企业级开发者
企业级BOM数据管理概要
RDA宣布推出高性能蓝牙音频系统单芯片RDA5836
基于慕课网的“企业级应用开发”课堂教学改革探索
企业级信息系统应用级灾备建设与应用
16%游戏开发者看好VR
iOS开发者调查
iOS开发者调查
栝楼产业开发者谢献忠
城市轨道交通企业级BIM应用策划研究
Marvell发布64位单芯片移动通信处理器