当高性能计算机(HPC)的计算能力从P级跃上E级、超级计算机的计算核心数目从几十万个扩展到几百万个,超大规模计算之下各计算单元如何保持高效互连与协同?在11月12日-17日于美国丹佛举行的世界超算大会(SC17)上,中国高性能计算领导品牌中科曙光面向全球首发的Torus硅元交换机给出了答案。

曙光公司高性能计算产品事业部总经理和 Intel OPA Marketing Director Joe Yaworski

曙光公司HPC产品事业部总经理李斌和Intel OPA Marketing Director Joe Yaworski 共同发布Torus硅元交换机

“目前大型超级计算机,特别是准E级或未来的E级系统,在系统规模、扩展性、成本、能耗、可靠性等方面仍面临着严峻挑战。本次发布的硅元交换机是全球首款采用Torus架构的高速网络交换机产品,基于它构建的超级计算机互连网络系统具有领先的性能、超强的扩展能力、极佳的容错能力,是迈向E级的最佳网络技术路线。”曙光公司HPC产品事业部总经理李斌介绍说。

与传统胖树网络拓扑结构相比,强调邻近互连的Torus直接网络在扩展性上具有明显的优势,且网络成本和系统规模呈线性关系。另外,因为具有很多冗余数据通路和采用动态路由,Torus网络也具有天然的容错性优势,这些都是超大规模系统所需要的网络特性,也是国际主流的高速网络技术发展方向。

李斌介绍说,曙光公司早在2015年的硅立方高性能计算机中就已实现了三维的3D-Torus。目前,曙光的Torus网络技术研究又有了突破性进展。Torus网络的维度从3D进化到了6D,提高Torus维度能有效降低大规模系统的最长网络跳数。在软件层面,支持6D-Torus的无死锁动态路由算法已经经过实际环境检验;在硬件层面,本次发布的Torus硅元交换机就是一项重要的硬件实现。

“硅元”是指Torus高维直接网络中的一个单元,一个硅元内部采用3D-Torus拓扑结构,多个硅元可以构建更高维的4D/5D/6D-Torus直接网络。将一个3D-Torus硅元集成到一台模块化交换机,能够极大提高系统集成度和密度,减少网络线缆,降低部署复杂度,降低成本。本次发布的Torus硅元交换机可以支持多达192个100Gb高速网络端口,Torus硅元交换机之间通过400Gb专用接口进行互连。

通过这样的硬件实现,也提高了Torus高速网络技术的覆盖范围,一些中小规模的高性能计算系统也可以更便捷地享用这项先进技术。

值得一提的是,本次发布的Torus硅元交换机还支持冷板式直接液体冷却,这标志着曙光的液体冷却技术从计算设备延展到了网络系统。液冷技术对提高大规模网络系统的集成度和可靠性、降低能耗等方面同样可以发挥重要的作用。

高性能计算和人工智能蓬勃发展的背后不仅需要计算能力的支撑和推动,也离不开高速互连网络的保驾护航。未来,曙光将在计算、存储、网络等核心技术方面进行持续创新,逐步发展成为中国新形象、新技术创新力量的名片之一。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-30 19:09:31
市场情报 曙光携手江苏省气象信息中心,开启“智慧气象”合作新篇章
近日,中科曙光南京研究院与江苏省气象信息中心在南京签署智慧气象合作共建协议,未来双方将在气象大数据应用 <详情>
2019-07-25 17:09:28
数据中心节能 “数据中心”节能不能“靠天吃饭” 曙光40项专利引领“液冷”时代
7月16日,中科曙光旗下“曙光节能”公司宣布,随曙光“全浸没液冷”技术步入商业化,“数据中心”单柜功率进入160KW时代,同时PUE(总能耗/IT设备能耗)也降到1.05及以下, <详情>
2019-07-20 07:58:50
市场情报 曙光亮相中国(南京)软博会 打造江苏先进计算网络
7月19日,第十五届中国(南京)国际软件产品和信息服务交易博览会(下称:南京软博会)在南京国际博览中心正式拉开帷幕。 <详情>
2019-07-16 21:30:44
数据中心液冷 曙光何继盛:全浸没式液冷将成为趋势
随着IT技术和互联网需求的暴增,从2010年开始,我国正式进入了超大规模数据中心(超算)时代。同时,几千至上万机架的数据中心开始出现。 <详情>
2019-07-12 09:57:42
市场情报 曙光大数据服务平台助推抚州开启智慧新生活
身处陌生的城市,你是否也曾遇到万分焦急却找不到目的地的窘境?为了办理一项手续,你是否也曾多次辗转于不同的政府窗口? <详情>