近日,中国信息通信研究院可信算力服务评审会圆满结束,天翼云智算平台率先顺利通过《可信算力服务 平台技术能力要求 第3部分:智算平台》评估,成为业内首批通过该项评估的云服务商。
该项可信评估主要考察智算平台的基础资源、平台、应用三层核心能力,监控运维、安全性、高可用与灾备三大跨层能力,涉及基础资源管理、数据管理、框架管理、算法管理、监控告警、日志审计、权限管理等能力项。
数字时代到来,自动驾驶、生命医学、智能制造等领域发展迅速,超大规模人工智能(AI)模型和海量数据对算力需求不断提高,智算平台能够帮助企业突破算力瓶颈,提高计算资源利用效率,满足企业不断增长的高性能算力使用需求,成为云服务商新的发力点。
智算平台的建设面临着众多挑战,国产化AI算力自主可控要求高,需加强技术攻关,提高平台的安全性;人工智能、科学研究以及元宇宙等新兴领域快速崛起,对算力提出更多元化的要求;大规模分布式训练、异构算力的统一管理和调度效率较低,新计算任务上线耗费大量时间;网管、云管多平台共存,AI场景算力的统一分配和融合调度难度大。
天翼云紧跟市场需求,依托分布式架构的云底座和海量的计算、存储、网络资源打造智算平台,具有自主可控、高性能、算力调度赋能、统一管理调度、产业赋能等优势。
①自主可控
打造国产化能力体系,适配昇腾、寒武纪等国产主流GPU芯片,适配海光、鲲鹏等各种国产服务器,构建自主可控的智算平台。
②高性能底座
计算侧提供GPU云主机、弹性裸金属等高性能服务器;存储侧支持并行文件存储、海量文件存储、对象存储等多种存储形态,提供百万级IOPS、亚毫秒级时延,支持丰富的大容量非结构化数据保存和分析场景;网络侧提供百GE RDMA。
③算力调度赋能
提供AI任务调度、异构算力调度、数据缓存加速、GPU虚拟化等能力,支持近万亿级参数模型训练规模、3D并行分布式训练、推理加速引擎、数据加速等算力赋能调度能力,大大提升训练速度和推理效率。
④统一管理调度
云上云下多算力数据中心可统一进行管理调度,平台提供标准化运营计费、租户管理、监控运维等能力。
⑤产业赋能
根据客户的业务软件特性,为数字政府、产业金融、高校科研等行业客户提供风险低、高性能、最佳性价比的实现方案。
天翼云智算平台适用于城市治理、AI质检、搜索推荐、自动驾驶、金融、科学研究等领域,大模型训练与推理全场景支持,可提供人工智能应用所需算力服务、数据服务和算法服务,通过算力的生产、聚合、调度和释放,支撑产业创新聚集。
为了满足更多场景更多元的算力需求,天翼云基于智算平台和超算平台融合打造解决方案,为企业提供更灵活、高性能、高性价比的算力服务。
“1”个底座:以“云+智”的体系为核心,提供云计算完整产品能力、超大规模超高性能底座、精细化运营能力,为数字经济发展提供强有力的云底座支撑;
“2”个平台:智算、超算平台,满足复杂业务场景需求;
“3”种部署形态:智算、超算、智算超算融合三种交付形态,实现不同场景灵活交付。
未来,天翼云将继续坚持智算平台的自主研发与技术创新,推动国家人工智能战略实施,赋能实体经济实现动能转换,促进人工智能科研等领域高质量发展。