网络就像是互联网世界的血管,为每个节点输送着数据。随着生活工作节奏的加快,以及数据量的指数级增长,人们对数据处理速度的要求越来越高,需要处理得更快、更实时。
Mellanox作为高性能计算领域的驱动者,一直致力于构建高带宽低延迟的网络传输设备,尤其在InfiniBand领域处于不可辩驳的领先位置。近日,在对Mellanox公司全球市场部副总裁Gilad Shainer先生的采访中,我们了解了Mellanox目前在高性能计算领域的最新动向,以及新品Switch-IB 2的情况。
Mellanox全球市场部副总裁Gilad Shainer先生
Co-design:改变通讯架构,削弱CPU作用
回顾高性能计算的发展,可以看出第一阶段是从小型机到集群系统,从低频到高频,第二阶段从单核到多核。发展到多核阶段的今天,以CPU为核心的计算能力已经达到了性能瓶颈。摩尔定律是否还能够继续发挥作用,已经成为业界讨论的问题。鉴于此,Mellanox提出了协同设计的理念,也即:Co-design,也就是说,软件和硬件协同进行开发,发挥协处理器作用。
十年前,网络和软件延迟都是100微秒。如今,网络延迟已经降低到了1微秒,而软件延迟依然停留在10微秒的水平。硬件快了100倍,而软件优化只快了10倍。而且,硬件性能几乎达到了极限,这样软件负荷就会增大。这种情况下,要想继续提升整个应用程序的性能就变得难上加难。Gilad表示,Co-design就能够打破应用程序延迟的壁垒。
Co-design就是通过任务卸载(Offloading)的方式,让很多组件协同完成一个任务,通过专业的芯片处理,从而实现整个系统性能的大幅度提升。“基于Offloading架构的互连技术难度和复杂度都很高,但是它能够让CPU从网络管理中脱身,进而能够大大提高CPU和系统利用率。”
在现代计算机系统中,数据能够驻留在任何物理服务器中,整个系统的效率决定于网络效率,一个高效的网络可以通过将CPU的通信任务卸载到I/O控制器,从而让整个系统更有效率。
Mellanox的Offloading架构和英特尔主张的以CPU为中心的Onloading架构是不同的。Gilad进一步解释到:“基于加载(Onloading)架构的互连技术开发相对简单的多,它只不过是一个简单的通道,所有的网络操作仍然必须由CPU来管理和执行;从应用的角度来看,一半的CPU资源都被浪费了。”
同时,Gilad还阐述了Mellanox做Offloading架构的优势。基于RDMA的InfiniBand网络能够减少CPU对数据传输的介入。从而提高数据中心的效率,降低系统整体的复杂性,为提高数据传送性能提供了理想的选择。而且,随着RoCE的出现,RDMA的优势在基于以太网的数据中心也开始发挥作用。未来,Mellanox的产品不仅具有网络转发功能,还会拥有计算能力。
Switch-IB 2:全球第一个智能交换机
Switch-IB 2交换机是针对高性能计算、Web 2.0数据库和云数据中心优化的新一代InfiniBand交换机,它能够实现100Gb/s的端口传输速率。这款全球首台智能网络交换机,集成了SHArP技术,能够将MPI操作从CPU卸载至网络,让CPU专注与为应用提升计算能力,从而让性能有10倍提升。而且,这些产品还能够应用于数据分析、机器学习、深度学习等领域。在刚刚成立的“JD-Mellanox联合创新实验室”中,或许会加强对此项技术的研发,并进一步应用到京东的电商平台上。
与此同时,Mellanox也加强了以太网市场产品的研发,发布了全球首款无阻塞100千兆以太网交换机Spectrum(光谱),它基于开放式以太网架构,为Mellanox的客户提供应用程序接口(API)选择,以实现更快的上市时间和更大的灵活性,同时还提供业内领先的25、50及100千兆以太网性能,确保数据中心可以推动其业务向前发展。
另外,Gilad还展示了Mellanox的产品发展路线图,未来Mellanox的产品还将有200Gb/s网络。“Mellanox每两年都会有一个技术革新,2017年会有200G的产品,2019年将会发布400G产品。与竞争对手相比,我们会保持一代产品的领先。”
此外,Mellanox正在积极寻求x86架构平台的突破,已经与NVIDIA结成良好的合作关系,并确保自身产品能够运行在ARM、POWER等平台。另外,Mellanox还拓展了软件平台方面的合作,成立了OPEN UCX联盟,试图创建适合HPC的高性能软件组合。
编后话:
对比Mellanox和英特尔两家的互联网技术,我们可以看出,Mellanox在努力增加网络设备在整个系统中的作用,而英特尔为了保住自己CPU老大的地位,在不断加强CPU的功能。当然,相同领域有技术竞争是在所难免,不管各家如何说自己技术先进,最后的评判标准在于用户。是否能够满足用户的需求是技术和产品存在并发展下去的关键。