中国IDC圈12月15日报道,阿里云基于公共云平台的高性能计算产品HPC正式对外商用,用户可通过阿里云官网购买GPU服务器实例。这也是中国首个云上高性能计算平台。

阿里云HPC每个计算集群配备2个GPU+2个CPU+128G内存+13T存储数据,单机单精度浮点计算能力达到11T flops。同时配备128G内存,13T本地盘存储数据,双千兆上联网络等。

测试用户用手投票

近几年,基于互联网和人工智能技术的创业风起云涌,格灵深瞳、Face++、神马语音等公司在图像、语音、安全等领域进行着人工智能的创新,以图形图象和音视频为代表的深度学习是典型的计算密集型应用,由此催生了互联网行业对高性能计算的需求。

早在今年9月阿里云HPC对外公测期间,上百家用户找到阿里云申请使用并排起长队,每周新增排队用户比测完用户还多,客户类型涵盖深度学习、科研、金融甚至国家超算用户。

“我们会给用户专属100%物理机,CPU、GPU不会发生争抢,保证无性能波动,没有虚拟化开销,也会有任何硬件功能的阉割。” 阿里云HPC产品负责人长仁强调。

据测算,假如有200万张图片需要学习,用一台双路E5-2650 v2的服务器训练需要16天时间,而如果用阿里云双GPU物理机仅需要1天。

NVIDIA全球副总裁、PSG兼云计算业务总经理Ashok Pandey表示:“在NVIDIA GPU 的支持下,阿里云提供的GPU计算云服务为深度学习领域的新兴企业的创新提供了绝佳的平台支持。”

Ashok Pandey强调,深度学习是NVIDIA重要的战略方向,未来英伟达将发挥自身在深度学习技术平台的优势和在全球深度学习领域积累的应用经验,与阿里云一起为深度学习的新兴企业提供更加强大的支持。

开放全世界唯一kepler架构GPU原生汇编器

高性能计算不仅需要硬件设施,更需要匹配“软实力”,才能大限度发挥硬件性能。

长仁介绍,阿里云不仅提供硬件和基本系统,更为HPC准备了Docker实例、调度系统、监控平台,以及针对深度学习的训练、预测中间件和工具。

尤其值得一提的是,阿里云HPC主页(hpc.aliyun.com)开放了全世界唯一的kepler架构GPU原生汇编器及cuda占用计算器,这是阿里内部性能调优的“独门秘技”。阿里用这款汇编器优化出了目前在kepler架构GPU上最快的卷积、矩阵乘法实现。

专注于计算机视觉识别的明星创业公司格灵深瞳HPC负责人张洋表示:“阿里云HPC产品性能强劲,配置简单,作为线上预测服务平台是很棒的选择。期待阿里云自己的深度学习软件框架上线。”

据介绍,在HPC正式对外商用之前,阿里内部早已经部署了大规模的GPU异构计算集群,在高性能计算领域实践多年,从设备选型、准入测试、运维监控,到系统架构、性能优化等,整个链条都有深入积累。

比如同样是利用GPU,但不同的公司会在具体技术选择上产生差异,小到如何插卡保证硬件性能的发挥都大有学问。

长仁认为,脱胎于阿里“母体”的HPC不仅是一款产品,更是一种服务能力,这是阿里云的核心竞争力。

HPC

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2021-01-11 09:25:00
国内资讯 阻挡HPC前行的“后一公里”,打破“存储墙”迫在眉睫
当下,无论是上天揽月的“嫦娥五号”,飞往火星的“天问一号”,还是下万米深海潜航的“蛟龙号”,或是抗击疫情中利用AI进行CT影像识别,几乎任何一项伟大的科学成就与工业 <详情>
HPC
2020-08-14 08:11:15
国际资讯 Intel开发mOS操作系统:Linux变种、百亿亿次超算专用
Intel不仅是大的CPU公司,还是全球大的软件公司之一,10万员工中有1.5万都是软件工程师。 <详情>
2020-03-11 12:02:00
整机柜服务器 浪潮专家解读:HPC如何协助解析新型冠状病毒基因组
一场新型冠状病毒肺炎疫情,牵动举国上下。在广大的医务人员奋战一线的同时,一大批“科技力量”也加入了抗击疫情的最前线。 <详情>
2019-12-10 16:08:38
互联网 他们为何对ASC世界大学生超算竞赛情有独钟?
ASC超算竞赛是世界规模非常大的大学生超算竞赛,自2012年举办以来共有来自全球7000多参赛队员参加比赛,吸引了众多知名媒体的关注,其中不乏多次参与的人。 <详情>
2019-11-27 12:04:00
数据中心液冷 SC19浪潮展示新型液冷HPC,采用我国自主创新自然循环蒸发冷却技术
11月18日,在美国丹佛举行的SC19全球超算大会上,浪潮展示了一种新型的液冷HPC系统,采用创新的自然循环蒸发冷却技术配合高密度计算服务器,相比同类液冷技术更加易于部署 <详情>