云爆发技术可为用户提供在应用高峰时期所需的能力,但是这一切都要求用户能够正确地管理好私有云和公共云中的数据。复制等其他策略可帮助用户做到这一点。
在云爆发策略制订中,IT团队会对他们的私有云部署的规模进行规模设计以便能够支持企业的日常平均工作负载,然后可以使用公共云来处理负载高峰。但是,开发一个高效云爆发架构还有着几个不小的障碍——其中大的问题之一就是广域网。 广域网中高速链接的部署状况要远远落后于局域网。其直接后果是,私有云与公共云之间文件传输的速度通常是比较慢的,这就严重地影响了企业实施云爆发措施中较为关键的速度因素。
在云爆发过程中,在处理开始之前必须先将数据传输至公共云中。新建一个新的虚拟机只需要几秒钟,而Docker容器则可以进一步减少其时间周期 .所以,如果私有云和公共云之间数据传输速度较慢,那么云爆发架构的价值就会被大大削减。 在大多数企业数据中心中 ,绝大多数数据都是稳定不变的。但是用户需要频繁地访问其中某些数据。例如,产品价格数据可能会以月为周期频繁变动,但其访问频率则可能以秒为周期的。此外,不同类型的数据会进行不同的更新。数据库同步通常也是以逐条记录的形式进行的,但是例如网页的更新则涉及一个或多个文件夹条目,其中所有的的文件只改变一次。
存储设施中的重复数据删除服务可以有助于克服这些挑战。这项服务会保留数据对象的一个副本而删除其他所有的,从而使用一个指向那个唯一副本的指针来取代其他的副本。然后,IT团队可以使用复制服务或者纠删码技术以确保那个唯一副本的完整性。这种方法可以节省空间,也能够让更新动作变得更为简便,这是因为其中只有一个文件和一个指针列表会接收数据变更。
针对云爆发架构的重复数据删除 重复数据删除服务是一个很好的服务,但是云爆发需要的则是有计划的数据复制。这个理念也是比较容易理解的:IT团队需要对那些在公共云和私有云中所需数据的副本做好预定位。 如果数据永远不会改变,那么这将是很容易做到的;用户只需复制所有的文件并按月支付存储费用即可。但是现实生活中的数据是不会一成不变的,所以在云爆发开始前文件复制需要做好数据同步。必须在两个云平台之间保持一些数据的步调一致。
IT团队应当根据实际需求的同步水平对数据进行分类。当处理紧密度更高的数据时,就会出现更多交易延迟的情况,因为需要在两个云平台之间进行频繁往复更新。如果数据同步的要求是较为宽松的(例如,只需每月同步一次),那么两个云环境中的使用也是更易于管理的。可想方设法将数据从同步水平要求更高的迁移至要求更低的,从而进一步提高性能。
如需迁移那些数据库更宽松的同步模式,可对在一个单一小列表中更改的每一条记录进行标记。每分钟都执行一次从私有云到公共云的更新,那么公共云数据库将知道以此记录作为最新数据的参考。 另一个选项则是共享数据结构。这个方法比较适用于数据库,但也可以应用到任何的数据集。例如,通过预先选择可能因流量爆发而迁入公共云的数据范围,客户端名称从R到Z,这样当开始实施云爆发措施时,用户就可以大限度减少数据同步的工作量。对近期公共云中的数据保留一份快照,那么同步差异就能够保持较小了。
图像和应用程序是缓慢变化的,所以应当在两个云中都保存其副本。对于虚拟机管理程序,这可能导致在云爆发程序开始时出现大量的流量,这就是容器共享通用图像和应用的一个原因。 目前,还没有很多自动化工具可用于在云爆发架构中执行有计划的数据复制,但是这一状况将在未来一年内发生巨大变化。在此期间,可靠的数据管理将进一步推动混合云业务的推广。