通信世界网消息(CWW)十年前,AWS(Amazon Web Services)发布了首个采用NVIDIA M2050 GPU的实例。当时,基于CUDA的应用主要专注于加速科学模拟,AI和深度学习还遥遥无期。

自那时起,AWS就不断扩充云端GPU实例阵容,包括K80(p2)、K520(g3)、M60(g4)、V100(p3 / p3dn)和T4(g4)。

现在,已全面上市的全新AWS P4d实例采用最新NVIDIA A100 Tensor Core GPU,开启了加速计算的下一个十年。

全新的P4d实例,为机器学习训练和高性能计算应用提供AWS上性能与成本效益高的GPU平台。与默认的FP32精度相比,全新实例将FP16机器学习模型的训练时间减少多达3倍,将TF32机器学习模型的训练的时间减少多达6倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU在最近的MLPerf Inference基准测试中一骑绝尘,实现了比CPU快237倍的性能。

1.png

每个P4d实例均内置八个NVIDIA A100 GPU,通过AWS UltraClusters,客户可以利用AWS的Elastic Fabric Adapter(EFA)和Amazon FSx提供的可扩展高性能存储,按需、可扩展地同时访问多达4,000多个GPU。P4d提供400Gbps网络,通过使用NVLink、NVSwitch、NCCL和GPUDirect RDMA等NVIDIA技术,进一步加速深度学习训练的工作负载。EFA上的NVIDIA GPUDirect RDMA在服务器之间可通过GPU传输数据,无需通过CPU和系统内存,从而确保网络的低延迟。

此外,许多AWS服务都支持P4d实例,包括Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster和Amazon SageMaker。P4d还可使用所有NGC提供的经过优化的容器化软件,包括HPC应用、AI框架、预训练模型、Helm图表以及TensorRT和Triton Inference Server等推理软件。

目前,P4d实例已在美国东部和西部上市,并将很快扩展到其他地区。用户可以通过按需实例(On-Demand)、Savings Plans、预留实例(Reserved Instances)或竞价型实例(Spot Instances)几种不同的方式进行购买。

GPU云计算发展最初的十年,已为市场带来超过100 exaflops的AI计算。随着基于NVIDIA A100 GPU的Amazon EC2 P4d实例的问世,GPU云计算的下一个十年将迎来一个美好的开端。

NVIDIA和AWS不断帮助各种应用突破AI的界限,以便了解客户将如何运用AI强大的性能。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-02-25 14:34:54
2025-01-14 16:51:00
2024-12-04 11:45:49
云资讯 亚马逊推出新一代基础模型Amazon Nova
亚马逊的新一代基础模型提供前沿智能和行业领先的性价比,Amazon Nova模型扩展了Amazon Bedrock中针对企业客户提供的丰富且强大的基础模型选择。 <详情>
2024-11-19 19:22:36
国内资讯 政策驱动下“AI + 云网安”服务发展:第一线的战略布局与实践
针对企业大模型训练与推理,第一线正探索构建AI原生超互联总线架构。 <详情>
总投资58亿元,深圳本贸重庆新型算力中心项目正式主体基础施工阶段
2026-05-29 16:30:00
总投资估算15.5亿元,中国电信杭州大数据处理(二期)项目方案进入公示阶段
2026-05-27 14:30:12
字节跳动巴西数据中心签署20亿美元绿电合同
2026-05-27 11:32:26
完整嘉宾阵容公布:500+全球算力产业领袖齐聚曼谷|DIFGC 2026·Thailand
2026-05-26 19:28:03
PDG拟出售中国区数据中心资产,估值或达10亿美元
2026-05-26 14:49:32
运营商Token套餐热潮,究竟是新赛道还是资本泡沫?
2026-05-26 10:46:00
参会指南|与您畅游 数字基础设施全球合作发展曼谷论坛
2026-05-25 11:07:01
发改委明确优先支持算力设施"绿电直连"!智算下半场已至, 8 月上海这场盛会不可错过
2026-05-25 11:01:01
案例征集|科智咨询《算力底座之争:智算芯片产业链、竞争态势与趋势研判白皮书》启动参编征集
2026-05-25 09:24:15
SpaceX斥资28亿美元 为数据中心采购燃气轮机
2026-05-22 10:11:28
AI行业最大的错配:我们都在为Token买单,却还按囤卡思维投资
2026-05-22 09:50:00
商汤林海谈AIDC:“通用标准”已不再是最优解,“适用高效”成为新法则
2026-05-21 10:48:23
东南亚AI数据中心迎“寒武纪时刻”,当前面临最大挑战是什么?
2026-05-21 10:15:26
5月27日•曼谷,DIFGC 2026•Thailand正式启幕!500位产业领袖齐聚,聚焦AI数据中心本地化交付与绿色能源协同
2026-05-21 09:24:00
35小时智能体自主进化!千问旗舰模型Qwen3.7-Max重磅发布
2026-05-20 11:22:17