作为一个国家科技实力的象征,高性能计算(High PerformanceComputing,简称HPC)多被用于气象、天文、航空、能源等领域的科学研究中。
而近年来,随着互联网、大数据、人工智能等新兴技术的兴起,企业中越来越多的计算密集型场景,也对高性能计算提出了应用需求。
10月19日,在第13届 HPC China全国高性能计算学术年会上,腾讯云正式发布腾讯超算云解决方案,以云服务的方式,让科研级的高性能计算力,真正从实验室走向企业级应用场景。
(腾讯云深度定制云中心高级产品总监吴坚坚发布腾讯超算云)
来自云端的高性能计算力
对企业而言,获取高性能计算能力一般有两种形式。
一是自建超算集群,二是租用超算中心的计算资源。前者存在超算集群建设周期慢、价格贵、初始投资高、机型不能及时更新等问题;而后者也面临着超算中心资源难寻、计算资源迭代周期长、大规模伸缩灵活性欠佳等一系列问题。
以云服务的形式提供高性能计算力则能够解决这些问题。
腾讯超算云提供了集合黑石物理服务器、云服务器(CVM)、存储、网络、批量计算(Batch)、深度学习DI-X平台等优势产品的云端高性能计算解决方案。
较之企业过往获取高性能计算力的模式,腾讯超算云具备了三大优势:
l 快速可获取:用户可即时获取HPC资源并快速扩容,可通过HPC PaaS平台按小时购买,也可按月、按季、按年租用专属HPC集群,减少了集群的建设周期,也不用一次性巨额资金投入。
l 资源灵活配置:使用者可以根据应用需求创建各种配置的 HPC 群集,比如减少GPU服务器配比,增加FPGA服务器等。同时还能在技术革新后,即时使用到换代机型,用户不用再受限于HPC资源,加快研发速度,节约研发成本。
l 高性能硬件:腾讯超算云采用基于英特尔至强可扩展处理器定制机型的黑石服务器,并针对HPC应用进行专门优化,高性能无虚拟化开销。同时提供包括 NVIDIAP100/V100 GPU机型、FPGA机型等在内的各种异构计算机型,加速多机并行应用,让应用享受最新的硬件加速。
同时,腾讯超算云专门为HPC集群设计了高可用高带宽和可扩展性强的网络架构,大幅提升网络性能。其中,腾讯超算云提供40GE/100GE的RDMA网络,延时小于1.5us,还能兼容基于MPI的传统HPC应用;并提供GPUDirect RDMA功能,使多机多GPU之间的带宽和延迟性能得到大幅度提升。
此外,为了应对高性能计算对存储的高标准需求,腾讯超算云提供文件存储CFS和高性能并行文件系统,其中腾讯云并行文件系统基于腾讯分布式存储架构,能提供TBps级的吞吐带宽和EB级文件系统。
满足多样化高性能计算场景需求
基于优势基础能力,腾讯超算云还针对工业制造(CAD/CAE、碰撞、材料模拟等)、生物基因和人工智能等场景推出基于业务流的PaaS平台和行业应用的集成,让客户在使用高性能计算服务时专注产品研发和创新,无需关注底层集群和调度系统,提升产品研发效率和上市速度。
汽车制造中,从汽车外观的流体力学设计、模拟汽车碰撞从而得出保护车内人员的结构设计,都需要高性能计算来进行建模分析。目前,腾讯超算云中的黑石HPC集群已经通过北京汽车的“汽车典型的碰撞模拟和流体力学计算”场景测试。后续,这种高性能的计算力,将帮助汽车制造企业大幅缩减研发时间,有效提升企业效益。
在生物基因领域,随着测序成本的进一步降低,基因测序的数据量即将达到EB级别,大量数据需要高效的存储与管理,也需要的超大规模计算资源能够按期交付。腾讯超算云的双螺旋PaaS平台为基因行业用户提供高性能、低成本、高自动化、易管理的整体解决方案,帮助客户一键完成基因相关软件的部署,平台自动调度计算、存储资源,加速基因分析流程。诺禾致源利用腾讯超算云精准匹配所需资源,实现资源快速交付,并节省大量的人力物力;碳云智能则通过腾讯超算云,实现在分钟级别创建动辄上千核、数百 TB 的 HPC 集群用以处理海量数据,减少人工投入,极大节约成本。
在人工智能领域,以图形图象和音视频为代表的深度学习技术快速发展,也需要高性能计算力提供支撑。腾讯优图实验室在国际权威海量人脸识别数据库MegaFace中刷新世界纪录,在100万级别人脸识别测试中位居榜首,用的就是腾讯超算云提供的黑石HPC集群。
此外,腾讯超算云在石油勘探、地球科学、物理化学、图像渲染等行业场景下,也有着丰富的应用前景。
打造开放的超算云生态
在高性能计算领域,腾讯超算云并不满足于做一个单独的解决方案,更希望用开放的理念来建设超算云生态,让高性能计算力更好地服务于各行各业的密集型计算需求。
目前,腾讯云已经与英特尔、NVIDIA、Mellanox等硬件提供商达成合作,确保用户获得快速迭代的高性能计算硬件。其中与英特尔合作推出至强可扩展处理器定制的HPC机型,为客户提供前所未有的使用体验。存储方面合作推出Lustre文件系统,兼容原有应用和使用习惯,方便企业应用的顺利上云。
腾讯云还与中国国家网格服务公司并行科技达成合作,推出部署在腾讯超算云上的HPC PaaS平台,该PaaS集成工作制造CAE等相关应用,提供随租随用HPC服务,轻松帮助客户HPC业务云化。
“高性能计算不仅需要强劲的计算力,还需要从应用层针对性地匹配解决方案,才能让场景更好落地。”腾讯云深度定制云高级产品总监吴坚坚表示,腾讯云还将继续秉承开放的理念发展腾讯超算云平台,引入更多的HPC ISV合作伙伴,帮助企业HPC应用上云,降低使用成本,提高产品研发效率。