人工智能早已影响了人们工作生活的各个方面,人工智能需要数据的支持,而大数据处理早已进入需要云端支持的时代。因此面向云端数据中心的人工智能加速卡为数据处理提供了强大的算力。

继去年12月发布了首款面向数据中心的人工智能训练加速卡“云燧T10”后,今天燧原科技发布首款人工智能推理产品“云燧i10”,这正是一款面向云端数据中心的高性能推理卡,用以满足由于AI应用和落地场景迅速扩大,市场和客户对更高性价比以及国产化和差异化云端推理产品的需求。

燧原科技CEO赵立东表示,“当前全球科技产业特别是集成电路产业正在发生深刻变革,燧原科技会继续加速技术创新和产品迭代。”

与此同时,与上下游伙伴合作,加速业务落地,扩大市场规模。针对互联网数据中心、垂直行业(金融、保险、教育、医疗及运营商等)、新基建三大业务方向的应用场景,完善训练和推理软件栈、工具链和解决方案。通过产学研协作,共建国产化产业生态,助力中国人工智能和集成电路产业的发展。”

人工智能对于算力的要求非常高。云燧i10是单槽位标准卡,大大加快了人工智能的深度学习过程中的运算环节。支持PCIe 4.0,FP32算力达到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。

据介绍,“云燧i10”拥有卓越的算力、出色的通用性以及优异的价值特性:高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持从FP32到INT8等多种精度,而大功耗仅为150W;高能效、高可靠性:采用动态调频调压(DVFS)技术,根据负载加速应用性能,支持RAS、ECC;设备虚拟化:实现多用户支持,大可支持4个设备实例,具备计算与存储资源的独享性,多用户间安全隔离;单颗芯片上可同时部署不同的业务与负载,实现多任务并行,有效提高利用率;支持KVM、Xen等系统虚拟化平台;易编程、生态开放:开放C++和Python编程接口,支持CNN及NLP典型模型,支持主流机器学习框架,并通过SDK提供深度定制。

燧原科技COO张亚林介绍道:“云燧i10在多项基准测试中,性能领先,并已完成与浪潮、新华三及Supermicro等服务器厂商推理服务器的适配。可适用于视频图像、语音、自然语言处理、知识图谱等多种应用场景,并针对内容理解、推荐、识别等高精度场景做了优化。与此同时,面向多元的开发需求,我们提供不同层次的开发模式,针对客户定制化算法模型联合开发,从而实现与客户的双赢。”

除了硬件,燧原科技同时推出针对推理产品的高性能神经网络模型推理引擎“鉴算TopsInference”。通过计算图优化、算子融合、模型压缩、量化等优化技术,可以为深度学习应用提供低延迟、高吞吐率的推理性能。

通过TopsInference的推理加速,配合i10 的高算力及虚拟化技术,数据中心可以高性价比地部署计算密集型深度学习工作负载。此外TopsInference除TensorFlow、PyTorch模型格式外,还支持ONNX通用模型格式,借助燧原GCU-CARA架构的可编程性,可以应对未来深度神经网络日益多样化、复杂的增长趋势。云燧i10与云燧T10以及“驭算TopsRider”软件平台搭配,可实现算法模型在数据中心训推一体化的快速生产部署。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-05-08 16:41:16
大数据资讯 用天工AI搜索梳理《如懿传》触到了观众哪些“逆鳞”
在「增强」模式下,天工 AI 可以检索更多网页,提供全面个性化答案。 <详情>
2024-04-03 09:42:00
云资讯 浪潮海若大模型业务战略正式发布
伴随新一轮科技变革和产业变革深入发展,一大批新兴技术和产业如潮涌现,全球迎来了新一轮的发展机遇期。 <详情>
2024-03-01 15:06:00
新闻动态 第二届北京人工智能产业创新发展大会成功举办 全市首个自主创新人工智能算力集群签约落地“京西智谷”
北京24家企事业单位联合发起“大模型应用产业联合体”,将依托华为软硬件底座,打造生态聚合的“AI原生应用引擎”平台。 <详情>
2024-01-16 10:37:56
国内资讯 瞭望 | 前瞻2024人工智能四大趋势
2024年值得关注的是AI代理和无代码软件开发带来的“冲击波”。 <详情>