作为云计算的领军企业AWS,一直备受业界关注。这不前一阶段的AWS的云存储(S3服务)服务宕机,又被业界作为头条拿出来说事。
AWS作为成熟的产品,这次S3服务事故被解释为是AWS S3(云存储)团队在进行调试时输入了一条错误指令,本应该将少部分的S3计费流程服务器移除,可是意外移除了大量服务器,被错误移除的服务器中运行着两套S3的子系统,从而导致S3不能正常工作,S3 API处于不可用状态。
这样的解释是让外界认为此次事故是由于人为原因造成的,而不是产品出现了问题。除此以外,这次S3云存储出现问题,其实更多涉及到数据层面,所以抛开这次事故的原因,我们需要深层次思考企业云中数据的保护问题。
在Commvault大中华区技术总监蔡报永看来,云是一种不可逆转的发展趋势。从数据管理的角度来看,我们一直认为云中的数据管理是非常重要的。
云计算时代的企业数据管理挑战
蔡报永告诉ZD至顶网记者,在云计算的驱动下,预计到明年,企业在云上的系统将超过在本地数据中心的系统。这样的结果就是企业在云端的数据管理将变得至关重要。
随着云计算的深入发展,企业的生产系统也在向云端迁移。而生产系统往往与企业业务数据息息相关,应用在本地数据管理的策略也需要向云端迁移。
但是现实是目前企业对云中数据保护的意识还是比较薄弱的,仍然需要进行市场教育。“很多人认为,只要把系统迁移到云端就非常安全了,但是云并不是那么完全的安全。比如云计算提供商提供了N个9的SLA服务可用性水平,但是宕机事故仍是不可避免的。这种概率极低的事故却会给企业造成100%的业务故障。”蔡报永说。
这就是说,部署云的时候一定要考虑容灾,除了系统本身的容灾外,数据的容灾也不容忽视。Commvault提出了数据服务的概念,不管系统部署在云端还是本地,数据应该作为一种服务随时可用,让业务能够正常开展起来。
“因为每个云服务商有不同层面的服务,比如IaaS和PaaS。对一个企业来讲,如果要开展业务的话,光有IaaS和PaaS,都没有太大的意义。只有企业数据迁移到云端才会驱动业务的发展和创新,这个时候数据的可用性变得非常重要。”蔡报永解释说。
通常企业在本地构建数据中心的时候会考虑数据保护,但是当考虑云计算的时候,往往对于数据保护是缺乏的。蔡报永表示,此前他跟国内客户谈合作的时候,对方往往说,我自己建了一套分布式的Hadoop系统,数据在上面很安全。因为Hadoop本身集成了很多数据保护机制。“但是,当过了一两年,我们再跟这个企业去谈的时候,他问我们有没有针对Hadoop的数据保护方案。因为Hadoop本身只是保证了物理可用,一旦出现逻辑故障的时候,数据往往会出现丢失。所以,对于企业数据保护而言,光有硬件底层保护技术是不够的,还需要完整的逻辑数据保护。”蔡报永如是说。
Commvault的云时代数据保护之道
去年11月份,Commvault公司发布了新一代数据管理平台V11,其中很大的一个特点就是以云为优先,就是帮助企业往云方向发展的时候,既用到云的便捷性、方便性,但是又不用担心数据的丢失问题。数据可以存储在不同的地方,比如说本地或者云,因为数据是可以互相迁移的,一旦出现宕机的时候,可以把数据从本地或者云中复制下来,从而不会造成数据的丢失。所以,当企业向云迁移时,Commvault的建议是逐步进行迁移,而且本地和云端数据互为保护,或者放在不同的云上,这样可以达到一个真正保护数据的作用。其实这就是混合云的理念。
正是因为深知云的重要性,Commvault很早就在与云计算提供商进行合作提供数据保护的方案,这也是云计算提供商的的一个价值增长点。比如Commvault和Rackspace合作从最初的几万台机器扩展到几十万个客户机器的数据保护,并通过数据管理平台进行云中数据的管理。
对于国内的情况,蔡报永表示,Commvault也积极与国内的一些云厂商合作,实现了产品对接和集成。企业的数据可以从本地数据中心迁移到这些云平台,也可以从这些云平台迁回到本地数据中心。
除了“云优先”以外,Commvault还有另外的两个技术理念,一个是数据保护方式的改变。以前的数据保护是把生产系统备份起来,这往往需要一个备份窗口。而Commvault正在改变这个技术,当数据产生的同时,实时把数据保护起来,也就没有这个所谓的备份窗口的概念。另一个是改变备份数据的使用模式。原有数据保护技术是通过把备份数据通过恢复技术恢复到某一个平台或者生产系统,而Commvault则可以在生产系统数据不可用的时候,直接使用备份数据。
写在最后
云时代,企业数据保护和管理方式都需要革新,传统的数据保护已经不能适应云时代的业务发展需求。很显然,AWS S3的这次事故给企业敲响了警钟。如何在云时代进行有效的数据保护成为每个企业需要思考的命题。
以下是Commvault云数据恢复方法的建议,特摘录如下,希望对于企业进行数据保护有所帮助。
云数据恢复第一点:分区域管理数据
对于企业而言,可以把所有的数据都放在一个公有云上,但是需要在不同的区域进行完整的数据备份,并了解各区域数据所在的位置。如果某一区域的云服务发生中断,企业可以在其他区域快速恢复数据,并且在服务中断期间保证业务的正常运营。
关键数据和服务必须在云内、各个云之间以及从云上进行备份,以确保数据始终可用。自动数据备份与数据备份验证能够确保云中数据的安全,减轻企业因宕机或中断带来的压力。
云数据恢复第二点:掌握数据存储的位置
企业应该随时掌握所有可访问数据的位置。当数据迁移到公有云时,并不意味着各个区域的数据都得到了保护。所以,企业应该主动管理数据存储,掌握数据所在的位置。
一旦云服务宕机或中断,企业需要迅速了解哪些数据受到影响,从而能够快速创建分析报告,找出故障,降低损失。所以,如果某一个地点发生中断或宕机,企业可以在其他地点快速恢复数据。
云数据恢复第三点:制定数据恢复备用计划
无论是将本地数据备份到云,还是将云中数据备份到本地,企业都需要在主要地点之外保留一份数据副本。
企业需要在各地点和平台之间迁移数据,而这种数据迁移的灵活性是目前任何原生云工具所不具备的。如果某一个地点不可用,企业需要能够在本地、异地以及不同的管理程序平台之间实现数据恢复。
云数据恢复第四点:马上制定数据管理策略
一系列云服务宕机事件给需要数据保护的企业敲响了警钟。许多企业IT团队正在制定从云到本地、以及从云到云的数据策略。Commvault亚太区企业解决方案架构师李可表示:“企业需要根据自身的业务和要求,制定全面的数据保护方案,特别包括容灾方案,尽可能规避单个节点或者单个中心导致的损失。“