重启信息技术革命行动倡议(二)
2016-12-17盛开
重启信息技术革命行动倡议(二)
编者按
2015年,华盛顿特区举办了一场关于重启信息技术革命的研讨会,对实现信息技术的跨越式发展问题进行了探讨。美国半导体行业协会(SIA)、美国半导体研究公司(SRC)以及他们的成员公司和半导体技术专家共同发布了一份倡议报告——《重启信息技术革命行动倡议》,在上期文章中主要对技术革命相关发展情况进行阐述,本期将对大数据的基础设施技术、智能基础设施组成要素进行分析。
未来的信息通信技术(ICT)将产生大量的数据,远远超过今天的数据流。过去,存储和计算能力的扩大基于积极的功能扩展,表现在摩尔定律中。然而,这种扩展将无法解决即将到来的、在信息通信技术性能和能源利用方面的需求。因此,在面对越来越多的数据时,需要全新的能效分析技术和海量数据存储技术。需要新的数据处理器和基础技术来提供可行的洞察力,并从数据中推断出新的结论,而传统的存储和计算方法是无法完成这些功能的。
大数据的基础设施技术
技术将带来大数据的一个例子是将在2018~2030年间建造的平方公里阵列射电望远镜(SKA),它用于研究星系演变、暗能量和引力波等。SKA将包含成千上万个接收天线,它们分布于数千千米的范围内,每天将生成1020比特的数据。
国防应用是大数据技术的另一个重要驱动力,包括与情报、监视和侦察(ISR)相关的数据。例如,目前“全球鹰”ISR无人机系统可生成500 Mbps,它5倍于整个美军在海湾战争中使用的带宽。另一个例子是ARGUS(自动实时地面普遍监视)航空成像ISR系统,其输出为1854 Gbps,使用一个274 Gbps的通用数据链,需求与能力比为103,甚至还将采用10:1的压缩。最后,大数据的“典范”是物联网,其中数十亿的在线传感器将生成和传输前所未有的大量数据,从中将获得情报,常常是实时的情报。
1.数据中心
为了管理数据流和存储,数据中心继续增长。每个包含50000个或更多个服务器的数据中心建造成本在5000万美元到10亿美元,耗电在20~50 MW级上。云数据中心通常以标准的、自定义的或商品的配置形式实现。输入数据速度在100 Tb/s左右,通过专有纤维传输,还提供其它的网络和设施来缓存和管理该数据的延迟。在扩展上,云数据中心还必须提供弹性,这通过故障检测和中心级管理过程来实现。
2.大数据对高性能计算
大数据和高性能计算(HPC)有许多技术共性,并可能变得更加相似,但也还存在差异。HPC已经发展了几十年,主要关注的是计算密集型任务。大数据处理各种不同类型的海量数据,是当前在许多领域和应用领域正在新兴的一个主题,如遗传学和天文学。大数据使用大规模存储网络,而HPC使用本地存储;此外,它们各自使用不同的软件开发工具,受不同的文化和期望引导。HPC还包括科学和工程计算,主要基于模型和离线(尽管网络-网络计算是一个显著的例外),而大数据云服务器基于交易,它近实时地运作。在软件世界中,抽象是取得成功的关键,还有像操作/焦耳这样的指标驱动软件实现专业化而非普遍化。需要通过进一步的深入研究,来解决有关HPC的基于模型的、专业化的软件与有关大数据的实时计算的、普遍化的软件之间存在的冲突压力。
3.技术驱动因素和需求
对新兴的信息处理器,需要一个新的概念抽象,但最常见的计算模型是图灵模型,它在计算机科学和工程文化中根深蒂固。若想背离当前的处理硬件是困难的。可能的替代计算模型包括模拟“近似计算”和量子计算。不同计算模型的并列或混合可能推动类脑计算的发展,这可能是未来混合系统的一个重要组成部分。
近期,可以预期的是微服务器和云设备将兴起并得到广泛应用。微处理器使用非常小的芯片来制造规模较小、成本较低、功率较低的服务器,它能够以可再生的能源来工作。云设备在移至和移自云时对数据进行缓存,以提高性能。应该注意的是,使用这些系统需要明确跨管辖边界的数据流动问题,这会引发许多法律或隐私问题,需要解决好。
在许多情况下,数据采集相对容易,而“冷数据”的维护更困难。越来越多的数据存储在磁盘这样的介质中,其成本效益高,但访问速度慢。未来的大数据系统将受益于对以下领域进行的研究和开发,如用于通信的纳米光子学以及用于解决数据移动能量成本和访问延迟问题的、新的存储设备(ReRAM、PCM、FeRAM等)。
考虑到竞争性技术和商业因素驱动下的生态系统冲突,对数据存储解决方案,需要在概念上有进一步的突破,例如,通用的计算——加速器、专用的计算——全新替代方案、面向销量的系统——面向高利润和增值的系统。最大的机会在两极:一端是云数据中心和百亿亿次级的HPC;另一端是移动和物联网的未来前景。进步可能源自数据中心中的量子计算或超导设备以及神经形态/模拟移动设备。
图1 今天的计算机为什么不能像大脑那样处理数据?
4.新的体系结构
必须开发全新的处理器——存储器架构来解决当前处理器速度与存储器访问时间之间存在的不匹配问题。对未来HPC而言,当前传输数据所需的高昂能源成本和存储器是最困难的障碍之一。作为一个目标,新的存储器管理技术可以提高程序员的工作效率,其方法是通过使用编程方法来推动实现数据的局部性、通过自动调整以消除低层次优化方面的需求以及通过管理软件层来确保可靠性。
当前计算面临的带宽——功率的困境源于不同存储层的传输时间之间存在的不匹配问题,如从CPU传至RAM、从RAM传至磁盘、从磁盘传至磁带。管理传输时间之间差距的一个方法是在RAM和磁盘存储系统之间添加固态设备,从而增加存储层次深度。未来,存储类存储器(如STTRAM、PCRAM和RRAM等)也将插入到RAM与磁盘存储系统之间的存储器层次结构中。最后,存储器结构方面的创新(如混合存储体)可以增强RAM系统的性能。
存储器上的处理(PIM)可能为存储带宽问题提供最佳的解决方案。该想法将大大减少或消除数据移动,以便以一定的而非可用的功率来释放存储器的原始带宽。中央概念是定位每一条比特线上的每一个比特元素,以承受大规模并行且可伸缩的计算技术。PIM体系结构与自动机理论相关,将可扩展到其它新兴的存储器技术。其成功的一个关键要素在硬件和软件。
最后,在系统层面上,用于数据存储、管理和分析的分层网络可以大大提高整体能源效率以及速度和性能。通过分散数据,一个更加分布的体系结构可具备更高的安全性。
5.脑启发计算
大数据的崛起正在创造巨大的机遇,但数据容量、速度、种类和真实性等方面对当前系统和架构提出了更加严峻的挑战。需要全新的计算机体系结构,也许在某种程度上需要像大脑那样运作,以便处理大量的数据,特别是处理非结构化的数据。大脑皮层——大自然的认知处理器,是一个工程奇迹,包括一张折叠的2D平面六层结构。如果展开,大脑拥有一个约0.7 m2的面积,厚度为3~4 mm。它有约1010个神经元,每个神经元约有104个连接。它需要约25W的持续电力供应,并以相当于25 PetaOp/秒的速度开展“计算”。图1对大脑与传统无机串行架构的电脑进行了比较。我们需要的是一个类脑计算模型,可以为之开发相应的技术。
新的应用需要新的方法。在许多情况下,价值并不在于整个数据集的、高精度的、对还是错这样的答案,而是在寻找有趣的模式和连接,这种模式和连接将带来新的解决方案和见解。差异在于多快可以找到一个“更好的”主意,而不在于一个非常精确的结论。
大脑提供有用的指导:它以低得多的功率、快速决策和惊人的洞察力,对原始速度、计算能力和精度进行权衡。虽然模仿大脑结构完全可能是不必要的(甚至自然界需要用9个月的时间来建造人类的大脑以及需要用约18年的时间来充分打造它,以使之可用),尝试速度较慢、功率较低、密集互连以及与存储器更紧密集成的计算架构是一种方法,已显现美好的前景。
随着更高能效需求的提出,以及更强大计算能力的增长,新的方法(如脑启发计算)有可能改变系统的设计和制造方式。一个集成了存储和逻辑的装置,或者能够以较低的功率实现更高级功能(可能牺牲精度)的装置,可能是一个卓有成效的选择。需要对设备技术和电路开展研究,以达成良好的权衡,从而获得最佳的系统解决方案。最后,我们不应试图取代现有系统的精度和计算性能,而是应利用新的能力来为这些系统提供新的动力,以便在一个电量日益有限、充斥着数据的移动世界中,找到新的见解和解决方案。
在许多情况下,价值并不在于整个数据集的、高精度的、对还是错这样的答案,而是在寻找有趣的模式和连接,这种模式和连接将带来新的解决方案和见解。
智能基础设施的组成要素
最终的智能基础设施将由普遍接入的和智能的传感器组成,它们彼此相连、连接至本地网络以及连接至基于云的系统。这种复杂的、分层互连的系统体系(SoS)应具备分析能力,从而提供洞察力和可操作的建议或控制。虽然在某些方面正在取得进展,但仍存在必须应对的巨大挑战。许多现有的技术不能充分得到扩展,例如,为分析和存储而向云传送每一片段数据既不可行也不实用。
1.洞察计算系统
新的计算时代正在到来,正从可编程系统时代迈入“洞察计算”系统时代。洞察计算属性包括情境和学习、视觉分析和交互、软件定义的环境、以数据为中心的系统、纳米尺度和原子尺度的组件。在这类系统中,传感器至关重要,负责收集数据以生成见解。对某些实时应用,感知数据的价值可能是短暂的,也许只有几毫秒,但数据必须在该时间框架内加以应用。
行业在对话、推理、图像识别先进技术研究方面不断取得进展,在知识表示和机器学习方面实现突破。通过全面深入的研究,这些技术进步将在未来十年内带来神经合成计算、量子计算和脑启发系统设计等方面的进一步突破。
2.网络-物理系统
网络-物理系统将成为即将到来的信息技术革命的一个重要组成部分。根据美国国家科学基金会(NSF)的定义,“网络-物理系统(CPS)指的是工程化的系统,构建于并依赖于计算算法和物理组件的无缝集成……CPS技术将改变人们与工程化系统的交流方式”。一个CPS包含协作计算元素(用于控制物理实体)的网络。它们完全不同于计算系统和物理系统,需要新的工程模型(包括时间动力学和算法计算);的确,面对高动态的、常常随机行动的物理系统,一个CPS必须具有强劲的控制力。此外,它们必须满足安全性方面的约束条件。
3.芯片级安全
对信息系统的依赖将继续扩大,安全成为一个日益严峻的问题。与此同时,一系列趋势增加了系统在面对攻击时的脆弱性,不论是受经济方面动机的驱动,还是受政治方面动机的驱动。集成电路和系统的设计、制造涉及许多企业的全球供应链以及成百上千的工程师,在整个路径的许多点上为恶意篡改提供了机会。高端处理器的复杂性继续增长,设计人员正在使用越来越多的第三方设计或IP,对其安全性可能并未做审查,并且不如其所声称的那样,假冒部分正在进入供应链。现有产品的逆向工程利用了半导体制造商的知识产权,结果是带来了假冒产品,但这些假冒产品可能并不能按预期执行功能。或许最大的风险来自设计,并因此造成对数据的非预期访问。目前的验证过程的主要目标只是确保设计按预期执行功能。
随着互连设备数量的增加,安全问题预计将成为未来的一个更大挑战。传感器智能芯片将嵌入和集成到所有事物中,从基础设施到人体,以保证数据和信息的安全,保证关键数据和信息可信。事实上,物联网可以被看作是“人类构建的最大的和最脆弱的网络攻击面”。除了对物联网提出的低成本、简单和低功率等标准需求,还必须解决多种安全需求,比如防篡改、安全的通信和存储等。
(翻译:盛开)