如今,许多企业都在谈论他们的公共云采用计划,而这些讨论经常围绕如何避免受到潜在的云服务中断影响。而其原因是确实发生了公共云服务的中断,尽管这些中断现在比以前发生的要少得多,但企业最关心的是如何减少中断的风险。

好在每个主要的公共云供应商都提供了构建高度可用环境的选项,这些环境可以在某种类型的中断得以恢复和幸免。例如,AWS公司提出了利用多个地理区域的四个选项。这些选项(其他公共云供应商也可以使用)具有不同的价格,并提供不同的恢复点目标(RPO)和不同的恢复时间目标(RTO)。

企业可以选择最符合其恢复点目标(RPO)和不同的恢复时间目标(RTO)的要求和预算的选项。关键是公共云提供商能够帮助客户在其全球基础设施上构建高可用性解决方案。

以下简要介绍一下这些选项,并回顾一些使用公共云构建高可用环境的基本原则。以AWS公共云作为示例,但这些原则适用于所有公共云提供商。

首先,企业需要了解每个应用程序的恢复点目标(RPO)和恢复时间目标(RTO),以便为每个用例提供正确的解决方案。其次,对于利用多个地理区域来说,没有一个万能的解决方案。企业根据恢复点目标(RPO)、恢复时间目标(RTO)、愿意和能够承担的成本数量,以及愿意做出的权衡,可以采取不同的方法。

以AWS为例,其中一些方法包括:

从备份恢复到其他区域,人们将环境备份到S3,包括EBS快照、RDS快照、AMI和常规文件备份。由于S3在默认情况下仅将数据复制到单个区域内的可用区域,因此企业需要启用到灾难恢复区域的跨区域复制。企业将承担在第二个区域传输和存储数据的成本,但不会产生计算、EBS或数据库成本,直到企业需要在其灾难恢复区内生效。而权衡是启动应用程序所需的时间。

在另一个区域进行热备份,将数据复制到第二个区域,这里企业将运行一个缩小版的生产环境。这个环境始终处于活动状态,并且其大小适合恢复业务所需的最小容量。企业根据需要使用Route 53切换到灾难恢复区域。根据需要将环境扩展到全部容量。有了这些选项,企业可以更快恢复数据,但会产生更高的成本。

多区域“Active/Active”解决方案,在这个方案中,数据在两个区域之间同步,并且两个区域都用于为请求提供服务。这是最复杂的设置和最昂贵的方案。然而,即使整个区域出现故障,停机时间也会很少或根本没有。虽然上述方法实际上是灾难恢复解决方案,但这个方案是关于构建真正高度可用的解决方案。

成功的多区域设置和灾难恢复流程的关键之一是尽可能采用自动化工具。这其中包括备份、复制和启动企业的应用程序。利用Ansible和Terraform等自动化工具来捕捉环境状态并自动启动资源。此外,重复测试以确保企业能够成功从可用区域或区域故障中恢复。这不仅要测试工具,还要测试其过程。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-04-13 10:57:23
云资讯 政务云市场爆发,云服务商们怎么抢单?
在中国,云计算在政府部门的应用更为接地气,有着普通民众需求的倒逼;同时,云计算厂商针对政府创造的服务越来越分化,显得颇具中国特色。未来,随着云计算在政务领域的覆 <详情>
2018-04-13 10:21:28
国内资讯 光环新网:关于副总裁辞职的公告
北京光环新网科技股份有限公司(以下简称“公司”)于近日收到公司副总裁齐顺杰先生的书面辞职报告,齐顺杰先生因个人原因,申请辞去公司副总裁职务。 <详情>
2018-04-13 10:15:07
交换存储 2018年数据存储市场概览
根据分析机构Statista公司的预测,2018年的数据中心存储容量将达到1.45泽字节,到2021年将增长到2.3泽字节。可以说这是很庞大的数据,而且增长很快。在商业存储领域,数据 <详情>
2018-04-13 10:06:10
云资讯 宁夏中卫云计算产业未来将接受不少于350亿元授信支持
根据协议,工商银行及建行宁夏区分行给中卫市新兴产业、重点领域和重大项目、具有特色和发展潜力的中小企业,提供本外币结算、综合授信、直接债务融资工具、投资银行业务; <详情>
2018-04-13 10:01:09
云资讯 什么是云计算呢,云计算人才需求紧迫
云计算(cloud computing)是一种基于因特网的超级计算模式,我们可以把云计算想象为:成千上万台电脑和服务器连接成一片。因此,云计算可以拥有每秒10万亿次的运算能力。 <详情>