5月10日消息,在第六届数字中国建设峰会“人工智能分论坛”上,阿里云智能计算集群灵骏负责人、资深技术专家王超发表了题为《建设大规模绿色智算,护航人工智能产业可持续发展》的演讲。王超指出,大模型在推理和训练场景都需要大算力,云计算将成为大模型的必选算力底座。
王超在演讲中表示,大模型训练通常需要数千张GPU卡,基于TB级别的数据,耗时几个月进行训练,然后其他用户在预训练大模型的基础上再进行强化学习,而这需要数百张GPU卡,耗时一两个月。
但这种现状存在很多问题:一方面,厂商投资数亿元建设的计算集群只用几个月极不经济;另外一方面,购买、规划和组建超大规模的算力集群也要耗时半年到一年的时间。此外,把算力集群的算力提供给全球各地的其他客户使用也有着很大的技术挑战。