很多公共云提供商在日常运营中通常不可避免地遭遇灾难性中断,而IT管理人员需要从云平台的故障和教训中学习,并将其应用到内部基础设施当中。

云平台(尤其是大型公共云平台)具有多种冗余级别,但没有一个平台能够抵御出现的意外停机。云计算平台和数据中心一样,都会遇到导致停机的问题。

20190117091259965

数据中心冗余

组织内部部署的硬件故障和软件错误是不可避免的,但公共云为IT管理人员提供了应对这些问题的方法。公共云具有可用性集合、冗余数据中心、可用性区域和云区域,使管理人员能够在遭遇中断时更好地规划业务运营。这些策略很重要,但管理员必须设计可靠的应用程序,以利用公共云冗余功能。

组织IT资产的弹性更多地取决于应用程序而不是基础设施,这种想法与传统的思维方式不同。在过去的二十年中,管理员通过备份、复制和其他以基础设施为中心的技术保持弹性。但是对于绝大多数公共云平台来说,此策略不再有效。

近年来,云计算提供商遭受的损失已超过其承受能力。云计算提供商提供的云服务在出现中断时,行业厂商和用户似乎都在学习如何设计本地云冗余,管理人员希望将这些教训应用于传统的虚拟化数据中心冗余。

重新思考数据中心的冗余

对于大多数传统组织来说,一些基本的服务都是为防止停机而设计的。网络时间协议和网络路由等服务设计通常是高度冗余。然而,仅仅因为系统应该是冗余的,并不意味着其配置已经为利用自然冗余做好了充分准备。

一些核心服务并没有高度可用的选项。IT部门几乎总是面临必须处理的技术债务,这就要求对行为并不理想的遗留系统提供支持。例如,一些遗留的应用程序身份验证系统只能存在于服务器上,这限制了数据中心的冗余功能。

管理人员不应将所有鸡蛋放在一个篮子里。对于大多数的传统部署,好在数据中心内部使用冗余硬件。管理人员可以通过使用不共享系统的冗余虚拟化群集来进一步采取这种策略,这类似于可以提供多个可用性区域的云计算提供商。这可以使应用程序依赖数据中心更高级别的冗余,但只有当业务需求保证该级别的冗余保护时才有价值。

通过在云平台和数据中心之间并行实施这些策略,在采用类似的传统基础设施时,使用公共云提供商的概念(如可用性区域)可能会有所帮助。这种术语使开发人员能够更轻松地理解基础设施概念,因为他们可能熟悉类似的云概念。

云计算冗余并不完美,停机中断提供了经验教训

高度冗余的系统不会免受性能下降的影响。在最近的公共云中断事件中,其目录服务无法使服务从一个区域保持运行到另一个区域。重新调整的流量超过其他区域的能力,使服务无法满足需求。

当管理人员设计数据中心冗余时,他们必须在发生中断时对负载进行规划。管理人员可能有两台服务器来支持数据中心冗余,但是其中一台服务器可能无法处理整个负载。关键是需要设计满足正常和异常状态下业务需求的系统。

许多组织都认为如果配置正确,在中断期间会发现其他情况。Netflix公司推出的Chaos Monkey系统就是人们所熟知的模拟中断事件,而其提供的经验教训是,如果管理人员没有练习处理实际的中断,他们永远不会知道IT系统将如何反应。而没有一个系统是孤岛,每个应用程序和服务都具有进一步使测试复杂化的依赖性。

停机中断在私有数据中心和公共云中并不罕见,但在数据中心内部,管理人员通常需要了解并理解系统的内部工作方式。当云计算提供商的服务出现中断时,可能会感到并没有从停机中学到什么教训,但这不是事实。虽然公共云提供商使用与传统数据中心不同的工具和方法,但有关构建和调整冗余的经验教训是通用的。

相关阅读

图解阿里巴巴这样的超级平台是如何崛起的

非法获利410万美元!黑客入侵SEC数据库

传闻 Intel、NVIDIA 欲收购 AMD,疯狂还是合理 ?

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-04-25 11:11:02
国内资讯 万国数据全国首单“数据中心持有型不动产ABS”在上交所 成功挂牌上市
本次发行是贯彻落实中央‘金融五篇大文章’要求的生动实践,通过‘持有型不动产ABS+可持续挂钩’这一创新,实现了资金用于金融数据中心核心资产收购和运营。 <详情>
2025-04-01 18:19:39
国内资讯 普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
普洛斯推出首支数据中心收益基金,提供稳定收益和长期增长并重的投资产品,满足投资人需求。 <详情>
2025-03-26 16:35:02
国内资讯 中国移动成渝(重庆)江南数据中心正式投产
3月20日,中国移动成渝(重庆)江南数据中心(以下简称“江南数据中心”)投产暨战略合作协议签约仪式在南岸区、重庆经开区举行。 <详情>
算力自由谜题马上揭晓|维谛技术(Vertiv)即将直播首发新一代智算MDC
2025-11-07 13:41:50
实现吉瓦级灵活部署:维谛推出面向NVIDIA Omniverse DSX蓝图的快速交付系统级参考架构
2025-11-07 13:38:06
跨越20年的“可视化”年鉴:《中国IDC行业资讯大全(2026年版)》征集启动
2025-11-06 17:10:55
工信部、水利局:面向数据中心推广液冷、 蒸发冷却、 热管、 氟泵等高效制冷散热装备
2025-11-06 17:08:39
算力并购潮持续?安徽润迅被卖了2.23亿!
2025-11-06 17:07:25
中国建设银行内蒙古和林格尔新区数据中心项目(一期)通过竣工验收
2025-11-06 17:05:55
ST东易面临重整 投资人起手赠送一个智算中心
2025-11-06 17:04:01
通过信通院权威测评,纷享销客如何把AI写进CRM的核心代码?
2025-11-06 14:25:49
维谛Vertiv宣布拟收购液冷流体管理领先者PurgeRite ,进一步扩大液冷服务版图
2025-11-05 14:27:15
算力狂飙,绿电何解?一场深度研讨会揭示“算电协同”破局之道
2025-11-04 18:20:57
天津空客“超级工厂”:Aginode安捷诺综合布线产品如何应对航空制造场景的极限挑战
2025-11-04 11:43:15
深度|重新定义智算中心生存法则
2025-11-03 18:02:21
征集|二十年沉淀 百人话新生·口述IDC产业发展
2025-11-03 17:54:00
投资26.2亿元,孝感大数据产业园一期项目开工
2025-11-03 17:51:05
发改委等五部门:优化改造城市内“老旧小散”算力设施
2025-11-03 17:48:57