如今,公共云已迅速成为构建IT基础设施的一种简单而无障碍的方式。
如果企业已经拥有内部部署系统,那么在某些时候,可能就会希望将内部部署和外部部署整合在一起。而实现这一目标的一种方法是采用云爆发,但云爆发究竟是什么?以及“爆发在云端”意味着什么?
“云爆发”这个术语并不新鲜,并且在过去的10年中,企业IT部门一直对其进行讨论。
云爆发意味着企业扩展内部部署工作负载并将部分(或全部)业务迁移到公共云中。通常这样做是为了缓解工作量的快速增长,例如应对峰值需求。
当应用程序部分或全部迁移到云端以减轻升级或更换期间内部部件工具包的负载时,还可以使用云爆发作为工具来帮助进行工作负载迁移。
云端爆发的“按需”模式提供了满足工作负载需求高峰或峰值的能力,而无需在现场保留大量未使用且昂贵的设备。
网站流量
例如,如果网站流量高峰一年只出现三到四次,那么使用仅在高峰期间按需使用基础设施来满足这些需求是有意义的。
当需求减少时,可以关闭云计算资源。与内部部署数据中心相比,这将节省大量的成本。
此外,使用云爆发可以缓解企业扩展内部部署数据中心的需求。
想象一下,计算需求的增长需要构建数据中心或扩展内部部署数据中心。企业将一些工作量转移到公共云以减少资本支出是有意义的。
这种情况并非完全是一个云爆发的场景,因为根据定义,爆发意味着工作负载在一段时间内被移动到云端,然后最终返回到内部部署。但是,它可以在升级现有数据中心时用作临时解决方案。
云爆发的误区
虽然采用云爆发似乎是一个好主意,但实际上这个过程非常困难。许多应用程序并不是设计为同时分布在两个(或更多)计算环境中,因为它们本质上是“整体的”。
例如,可以考虑构建在大型关系数据库之上的系统。将其迁移到云端意味着移动整个应用程序。即使应用程序层可以分离(例如应用程序逻辑和数据库的Web层),然后云平台引入的这些层之间的延迟可能会使云爆发成为一项挑战。
因此,尽管许多组织可能对云爆发很感兴趣,但很少有人会以真正动态的方式实施该流程。实际上,许多云爆发项目将侧重于将整个应用程序或应用程序组永久性地移动到公共云中。
云爆发和存储
如何在云爆发场景中实现数据存储?
首先,存储在使应用程序可以移入和移出公共云方面发挥着重要作用。将应用程序爆发到公共云的过程通常基于将应用程序和数据一起移动或将数据移动到已经存在的另一个应用程序实例。
例如,目前的大多数应用程序都打包为虚拟机。 Velostrata(被谷歌公司收购)、Zerto和Racemi等供应商都提供将整个虚拟机迁移到云端的功能。
云计算提供商也有自己的解决方案。其中一些工具专注于在一次性过程中移动整个虚拟机。但是,例如Velostrata提供了只是移动活动数据,并以真正动态的方式将虚拟机更新带回内部部署的功能。
此功能突出了此类迁移的主要问题之一,即保持应用程序和数据同步。
在整个网络中移动多个虚拟机(或多组虚拟机)既昂贵又耗时。在将虚拟机移回内部部署时尤其如此。超大规模的云计算提供商对出口的数据收费,对于用户来说,将其应用程序和数据从云端返回内部部署的方法并不可行。
还需要考虑延迟时间。通常,在公共云平台之间移动时,应用程序不可用,这可能是一个问题。延长的中断将影响用户体验,需要尽可能地解决这个问题。
以存储为中心的云爆发
如何将数据移动到公共云?简单地使用公共云作为内部存储的扩展已经存在了一段时间。备份供应商以及主存储解决方案供应商和辅助存储解决方案供应商都提供了将数据作为存档形式推送到公共云的功能。
从控制非活动数据成本的角度来看,这很好,但是活动应用程序?企业需要考虑一些事项,以使主动存储云爆发变得切实可行。
第一个问题是数据视图的一致性。这意味着需要管理与数据关联的元数据。对于块存储来说,需要跟踪和访问任何单个块的最新版本。对于文件和对象存储,这意味着了解文件或对象的最新版本。
元数据一致性是一项挑战,因为所有数据更新都会更改元数据,无论是新文件的信息还是现有文件的更新。这些更改必须尽可能快速高效地分布在数据的所有端点上。这导致了元数据管理的另一个问题——锁定。
为了确保两个位置不会试图同时更新相同的内容,一个或其他位置将获得对数据的锁定,其他位置必须等待。
这个锁定过程可能会带来显著的问题(例如不可接受的延迟)。另一种解决方案是不会导致锁定(将一个副本设为只读),或者像对象存储中看到的那样,采用“最后写入者获胜”的过程,其中最后一次更新有效地反映为数据的当前副本。
“最后写入者获胜”对于像对象存储这样的存储平台来说是一个可以接受的解决方案,但对于基于块的存储解决方案来说是完全不切实际的,其中数据一致性是通过确保每个读写都按时间顺序准确反映来确定的。
数据保护
构建分布式存储和应用程序架构的最后一个考虑因素是了解如何从故障中恢复。
如果内部部署服务器出现故障会怎样?如果云计算提供商的服务中断会发生什么?当数据位于多个位置时,如果其中一个平台出现故障,则很难知道最后一致的数据副本的存在位置。为了避免数据丢失,人们需要很好地理解故障场景。
云爆发存储解决方案
供应商如何应对存储云爆发?主要的云计算提供商在早期阶段就确定了这一要求。AWS公司具有存储网关产品,该产品可以在内部部署数据中心中作为虚拟机部署,并作为iSCSI LUN公开提供给本地应用程序。将数据存档回AWS云平台,可以在那里远程访问。AWS存储网关现在可以满足文件和虚拟磁带格式。
几年前,微软公司收购了StorSimple,为AWS 存储网关提供类似的iSCSI功能。最近,该公司收购了Avere Systems的vFXT技术,该技术允许将内部部署文件系统扩展到公共云。
包括NetApp(Data Fabric),Scality(Zenko),Elastifile(CloudTier)和Cloudian(HyperFile / HyperStore)在内的存储供应商都能够跨越内部部署和公共云来按需移动数据。整个行业中还有更多可用的类似解决方案的例子。
人们的期待
在未来,人们将看到应用程序被重写,使它们分布在多个公共云和内部部署位置。在这种情况下,云爆发将是其设计的固有特征。
与此同时,存储供应商正在使人们接近一个更加实时的分布式数据生态系统,尽管有的企业还在采用专有解决方案。
相关阅读: