继一系列企业所关注的业务类技术(包括CRM、ERP及协作等)之后,云计算又将自身势力范围推向灾难恢复方案领域。对于终端用户而言,这无疑是个好消息。价格的大幅回落不仅让过去不敢做非份之想的小型企业也有了筹备灾难恢复机制的能力,也给企业用户带来了更加丰富的方案选项。
然而云绝不是万能的,而且对于很多企业,云基础灾难恢复其实无法满足甚至完全偏离了需求轨道。
为了帮助大家制定出一套与企业目标相匹配的云战略,请认真考虑以下五个问题:
1.哪些数据在灾难过后需要首先恢复?
随着CIO们对灾难恢复机制的进一步关注,此类规划不可避免地与大数据搭上了关系。如今员工们指尖所操作并保存下来的数据达到了前所未有的规模——PC机磁盘、移动设备、廉价的U盘加上以Dropbox为代表的线上存储都成为人们囤积信息的方案——而与之相应,存储功能的单位成本则变得越来越低。2000年时每GB的存储成本还需要接近10美元,如今则已经低于10美分。成本低了大家自然也就轻松了,管它有用没用,保存了再说。
在大数据时代下,我们显然无法对每一个字节进行备份与恢复,至少不会在灾难发生后第一时间这么干。毕竟数据的重要性有所不同,全面恢复既浪费时间又毫无必要。对于建筑企业Graniterock公司而言,让企业资源规划(简称ERP)软件尽快恢复正常才是他们遭遇故障后的当务之急。ERP能帮助他们派遣运力、将卡车分配到像机场这样优先级别高的建筑工地,以确保司机师傅能够在混凝土凝固前将其运送到指定地点。
这家公司原先使用的是由甲骨文提供的本地ERP解决方案,然而对于Graniterock那过于袖珍的IT团队而言,本地方案所带来的维护与管理负担实在难以消化。有鉴于此,Graniterock公司果断转而使用来自Velocity的托管型ERP方案。云基础ERP系统所带来的大优势在于将灾难恢复变成一种功能,而不像过去那样需要当作一个漫长、繁琐且消耗大量资源的特殊项目。
“ERP是我们的业务重心,但我们也希望今后能在业务中使用更多辅助类应用,”Graniterock公司CIO Steve Snodgrass表示。该公司最近刚刚将原先使用的多供应商存储环境(来自EMC、NetApp、Data Domain及Buffalo四家)更换为由Nimble Storage一家提供的SAN方案。
截至目前,Nibmle SAN采取的是仍然是本地备份机制,但运营经理Ken Schipper希望企业能尽快拥有自己的在线灾难恢复方案。只有能够涵盖Exchange、虚拟机及各数据库的方案才能称得上真正的灾难恢复机制。
2.企业所在地可能遭遇的灾难属于哪种情况?
当公司转身云基础存储方案时,所在区域的重要性往往没有得到足够的重视。如果大家在选择数据恢复服务时没有考虑到所在地的特殊性,那么像卡里里娜或是福岛这样的重大事故将令灾难恢复机制形同虚设。
“很多技术人士对灾难恢复方案中的‘灾难’属性认识不足,他们忽略了在很多情况下,企业员工需要撤离基础设施甚至公司所在地。人们总是把希望寄托在云服务供应商那边,但事实上如果不付钱,根本没人会上门为大家解决难题,”来自IDC分析公司合作伙伴、一家位于普鲁士王市业务连续性企业的美国注册业务持续专家Ginnie Stouffer指出。
“卡特里娜在这方面是个值得大家借鉴的绝佳实例,”她补充道。“许多企业意识到了异地备份的重要性,但却把异地数据中心选在了新奥尔良。不少愚蠢的银行甚至批准了这类项目,但我们了解事情的走向、也深知这么做的危害。”
举例来说,Graniterock公司的总部设在加州沃森维尔市,即圣何塞南部约45分钟车程。这里是地震的高发区域,但凡关注新闻的人应该都有所了解。事实上,沃森维尔的本地IT基础设施与Velocity在西雅图创建的数据存储中心都面临着地震频发的问题。也许一场地震不可能同时摧毁两个区域,但一系列与火山活动有关的地震则可能持续袭来、最终令该公司设置的异地备份方案化为乌有。
没错,这种情况发生的概率极低,但卡特里娜和福岛县的核泄露不也同样是低概率事件么?灾难恢复防的就是低概率事件,大家必须清醒地认识这一点。
“现在我们以实时方式将Velocity西雅图数据中心内的信息传输到丹佛,”Snodgrass指出。“将数据存储在低风险区域能够有效提高关键性信息的安全性。”
那会不会有一场影响范围极其广泛的自然灾害同时席卷圣何塞、西雅图与丹佛?嗯,当然有可能。但我们估计要导致如此规模的灾难,至少也得是外星人入侵或者僵尸大爆发之类的世界级事件了。到那时候Snodgrass早就逃命去了,哪还管你什么数据恢复。
3.您部署的是灾难恢复机制抑或仅仅是数据复制?
人们印象中的很多服务项目及供应商支持方案并不是真正的灾难恢复机制,而仅仅称得上数据复制服务。数据复制确实能起到一定作用,但却无法向终端用户提供整套基础设施的镜像生成能力。用户能做的只是获得经过复制的数据,却无法保证与数据搭配的系统仍然保存完好。
操作系统、应用程序与用户设定就不在复制内容之列。一旦灾难发生,数据根本无法在服务器与数据库重新创建完成之后得到恢复,这也就意味着企业需要承受更长的停机时间与更大的舆论压力。
数据复制对于企业的正常运营而言当然很重要,不过更重要的是技术人员得清醒地意识到这绝不是灾难恢复机制的全部内容。不过随着HTML 5以及基于浏览器、无需存储的Nirvana方案的最终出台,相信数据复制必将真正有能力接过灾难恢复的大旗。
但在此之前,请大家先别盲目乐观,把现有灾难恢复机制落实到位才是正途。
4.所有保障规划顺利实施的补充工具都准备好了吗?
云基础数据复制之所以在人气方面远超云基础灾难恢复,其中一大重要原因在于通过公共互联网传输灾难恢复所需要的规模化数据实在太过昂贵,这需要企业花大价钱购置MPLS连接才有可能实现。正是出于成本的考量,大多数企业才仍然选择在物理层面实现灾难恢复,采用磁带等效果不好但更为廉价的解决方案。
对于真正有能力服务于企业的云基础灾难恢复机制而言,光靠存储与镜像功能还远远不够。即使大家将应用程序交由云服务供应商托管,也仍然无法保证它能够有效完成数据镜像生成及跨区域传输工作。
我们怎样才能在不耗尽基础设施资源的前提下把如此海量的数据通过互联网进行传输?许多企业已经发现,以CDN或WAN优化为代表的补充型技术对于灾难恢复工作的顺利完成有着不可或缺的重要意义。
“多年来我们一直在向客户提供WAN优化服务,但说实话这方面成本还是偏高,”OpSource公司全球渠道与合作高级副总裁Jon Beck表示,这是一家专门提供云计算及托管管理服务的企业。传统WAN优化方案要求在每套基础设施、多数办公地点及其它远程站点当中安装硬件设备,由此带来的成本无疑令人难以接受。
为了帮助客户降低成本并为更广泛的消费群体提供数据复制与灾难恢复业务,OpSource公司对来自Aryaka的WAN优化方案针对云环境进行了调整。“在OpSource公司,我们对于SaaS模式充满信心,而Aryaka公司只是众多遵循SaaS模式提供WAN优化服务的供应商之一,”Beck表示。经过悉心调教,目前所有服务于OpSource及其客户的灾难恢复方案都开始根据实际使用情况计费,而不再需要投入高昂的前期设备采购成本。
5.针对脱机业务筹备一套B计划
即使是最完美的灾难应对方案也无法保证在真正的灾难面前保障万全。对于Graniterock公司而言,企业所拥有的大量建筑运力能够在灾难发生后帮助管理者及时清理现场、组织重建。但他们要如何组织起这项工作?
“如果灾难降临,而公司所在地的WAN已经无法正常使用,那么异地数据备份就根本不可能发挥作用,”Snodgrass指出。
尽管Graniterock公司早就已经在开展网上计费及在线支付业务,但他们仍然在手头上保留了大量纸质票据以备不时之需。他们准备了大量纸质发车通知及验证票据,这样在网络服务无法使用的情况下工程人员就能以人工形式规划及指派复杂的混凝土运送工作。