4月21日,在经历了6个月的试运营之后,中科曙光针对高性能计算集群推出的SaaS级专业化在线平台EasyOP(Easy Operation的简称)正式上线。

自去年11月EasyOP在全国高性能计算学术年会上亮相并宣布试运营之后,业界一直对曙光这款7*24小时在线运维平台的表现充满期待。而从EasyOP试运营的数据反馈信息来看,曙光EasyOP的表现称得上专业、全面,不负众望。

试运营数据评析:专业、全面

试运营期间,EasyOP累计接入来自20组HPC集群的超过7800个节点,应用涵盖CAE、气象、海洋、物理、生物、材料及互联网6大领域,对所有接入集群资产全面监控的指标超过180项。

从周期上看,EasyOP接入时间跨度分布合理,系统满负载和低负载的情况均包含在内。在监控的7800多个节点中,CPU的高和平均利用率为83%和70.1%,内存的高和平均利用率为40%和25.5%,存储的高和平均利用率为23%和20.3%。另外,在EasyOP接入的资源作业中,中短时长作业占近70%,作业排队率约为1/5。这种多线程任务下适于对HPC系统各子功能的全方位监控。

统计显示,试运营半年期间,全部集群共自动触发近2900条通知信息,其中2281条是因计算节点主要部件温度升高触发的轻微类通知。严重类通知仅有3条,其中两条起因自共享存储挂载故障,一条系严重级别温度过高导致节点自动关机,从侧面反映了曙光集群系统的高可靠性。

应时而生,让HPC运维变得简单

目前,在基于HPC的IT中心建设中,几乎所有公司只是就某个或几个离散的环节提供服务,难以做到全生命周期的运维服务。而第三方HPC服务商由于并不研发和生产HPC系统,对于HPC运行中产生问题的分析和解决效率与HPC专业出身的曙光相比还有不小的差距,不足以保障用户HPC高效运转。

EasyOP在线运维平台

针对此,曙光打造了拥有五大关键技术的EasyOP--监控数据实时远程采集、海量数据存储与展示、故障的分析与定位技术、大量数据统计与分析、移动终端的集成与推送,应时而生的曙光EasyOP平台使HPC在线运维变得简单。

HPC运维人员不仅可以随时了解HPC集群的运营情况和故障,还可通过网页或微信等在线咨询服务与线上专家进行一对一的交流。EasyOP还会将常见、有代表性的故障解决方案上传至知识库,以便于HPC运维人员积累。

来自中科院物理所的徐力方研究员表示:"HPC集群的运维此前一直是我们的艰巨任务,非常辛苦。接入EasyOP后,我们的运维压力大大降低了,运维成本和人力投入也都减少了,而且HPC集群的安全性和使用效率也得以提升。我们终于解放了。"

懂HPC,更懂HPC运维

"EasyOP是曙光结合'互联网+'和HPC的产物,不仅帮助用户维护HPC系统,还有望利用用户的系统为其创造更多的价值。"曙光副总裁沙超群表示,"EasyOP通过提供运维、调优等服务,将各行各业的专家从HPC的运维和管理中解放出来。不止于此,曙光希望通过EasyOP构建一个资源交易平台,让闲时资源创造价值。"

"懂HPC,才能更懂HPC在线运维。"曙光总裁助理兼高性能计算产品事业部总经理曹振南感慨道,EasyOP可满足用户在立项支持、设备选型、产线交付、售中部署、应用环境调优、在线运维指导、售后技术支持等方面的持续需求。

"曙光推出EasyOP在线运维平台,引领了我国HPC行业向互联网+转型的方向,将促进行业整体服务水平的提升。"中国软件行业协会数学软件分会常务副秘书长姚继锋博士表示,"EasyOP可实现曙光与HPC用户的互联,对于打造'HPC生态圈'具有重要意义。"

"从硬件提供商向综合服务提供商转型"是曙光公司近年来为应对不断变化的市场需求推出的重要战略,注重服务升级的EasyOP无疑将在其中扮演重要角色。同时,出色的HPC系统搭配专业的在线运维平台,也将更深入地践行曙光"数据中国"战略。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-21 09:54:00
大数据资讯 腾讯:已发布的三款自研芯片面向AI推理、视频处理与高性能网络场景
在前沿技术创新方面,就芯片而言,已发布的三款自研芯片,面向AI推理、视频处理与高性能网络三大场景,推动自研芯片在腾讯的实际业务场景中规模化应用。 <详情>
2023-03-10 13:08:02
云资讯 提升科研算力,云极高性能计算EPC升级实现一键式集群部署
随着工业电子信息产业的发展,高性能计算已经逐步由单机处理逐渐发展至集群化,很多企业存在自建高性能计算集群的需求。 <详情>
2022-10-24 09:52:00
大数据资讯 数据如何助力企业发展?【虹科云科技】直播为您解答!
从高性能计算、商业智能、数据库三个领域出发,通过知识介绍、解决方案分享、案例探讨来详细分析企业如何解决数据难题、如何利用数据进行创新发展! <详情>
2022-09-09 09:14:00
云资讯 中兴通讯助力中国联通打造算网时代高性能数据中心网络
展望未来,与时俱进,中兴通讯将继续携手中国联通,把握算网一体新生态、新动向、新机遇,共同构建面向算网一体的新一代数据交换中心和承载网络,全面助力中国联通实现算网 <详情>
2022-01-14 16:11:31
市场情报 《2022联想高性能计算解决方案白皮书》:用全栈高性能计算能力赋能千行百业
作为世界公认的“计算金字塔尖上的明珠”,高性能计算不仅是一个国家综合科研水平的重要标志,也是综合支撑国家安全、经济和社会可持续发展不可替代的信息技术手段。 <详情>