尽管有关云计算的宣传铺天盖地,尽管Gartner曾预测"到2012年将有20%的企业采用云技术,从而完全摆脱IT资产",大型企业在短时间内都不会放弃对ERP解决方案的部署。知道吗,这些企业的重要数据都存储在他们的ERP系统中。David Linthicum曾在一篇题为"数据整合给云计算泼了一盆冷水"的博文中指出,把任何业务相关功能迁移到公有云中都需要解决云应用与企业IT系统相整合的问题。
确定整合机制对于采用混合云模式而言至关重要,这是因为在混合云模式中,需要将公有云和私有云整合起来,从而满足企业的各种需求。Christine Dunlap在她一篇名为"数据中心受到混合云的冲击"的博文中指出,安全和基础设施供应商已经意识到私有云作为迈向公有云第一步的重要性。把私有云和公有云的数据连接在一起不仅仅是一个有关数据位置的隐私及法律要求的问题,同时也是运营上的需要。
在首席信息官和首席执行官尚未准备好将所有数据都迁移至云的前提下,有三种方法可供选择:
将所有数据都保存在私有云中,并建立一种机制让公有云在需要时可以从私有云中获取数据(远程访问)。
将一些数据复制到公有云中,并且同步这两个位置的数据(同步)。
当云服务启动时,把相应的数据传送过去(动态迁移)。
接下来,让我们更深入地了解一下每种方法。首先需要说明的是,现在的大部分公司都只允许将一小部分数据放到公有云中。这表明,企业需要明确地确定每个数据的保密性。这是一项数据分类工作,是超越最初的概念验证、迁移至公有云的先决条件。
远程访问
在远程访问的方法中,DMZ(隔离区)中将设置一个开发用服务器。这台服务器上存有"公共数据" .它会建立一个机制,使数据与防火墙后面主数据保持同步。开发用服务器上的的代理会与云应用进行通信,并按要求将数据传送过来。显然,加密、VPN和数字批处理可用来保护连接的安全。数据一旦被云应用使用,就意味着已经暴露在外。这个方法的优势是数据不会永久地保存在云里,这样可以限制数据的暴露时间。此方法的弊端是会导致网络流量增加,从而增加成本,这方面的一个例子就是企业在云中计算生产进度。需要注意的是,您应该从一开始就考虑提高的处理速度(源自可在云中使用更多资源)是否可以弥补在云中获取数据所需的额外时间。如果有大量数据需要传送(如CAD数据),那么这个问题就没那么容易找到答案。
同步
另一种方法是在云中预留一个永久的存储位置来维护企业数据的副本(或至少是可以存储到云中的那部分数据)。这个方法的优势在于可以提供一个实际的灾难恢复功能。这就引出了一个问题:执行的功能是否需要在企业数据源和云数据源之间进行即时同步?比如,企业服务器中的数据在更新后的多长时间内必须在云中显示?时间越长意味着越容易操作。
同步的方法意味着,数据将永久地保存在云里,并且需要一个应用在主数据更新之后将其传送到云中。虽然数据只有在更新后才会进行传输,这样可以节省通信成本,但是却将数据保存到了存在数据激增、隐私和其它安全性问题(我们在之前的帖子中曾讨论过)的云中。不过我们应该切记,这个方法意味着不管我们是否使用了云,都需要支付公有云的使用费用,基于云的永久性数据存储空间是需要付费的。
动态迁移
如果企业里启动了实际的交易活动,则可以采用动态迁移的方法,然后迁移到云中。例如,作为银行的客户,我可能想要对我的股票投资组合进行模拟。发起这个要求后,我将在企业环境里进行身份认证。我的个人数据将会随着我的会话一起发送到云中,以进行高级模拟,这需要进行大量的计算工作。完成分析后,基于云的数据已经暴露在外(数据并无改变),而我的决定可能会被发回企业环境中来执行。显然,这个方法只能在传输的数据量相当小时才能被采用。
整合工具实例
谷歌发布的谷歌安全数据连接器就是一个有关如何在数据中心和云之间安全传输数据的实例。然而,必须明确的一点是,上文介绍的方法都需要对应用进行重新设计,以便考虑企业和云环境之间的整合问题。SaaS产品通常无法提供这样安全的整合机制。
结论
总之,您首先需要为数据分类,分析一下数据放至公有云后的暴露程度,然后确定哪些数据可以永久地保存在云中,哪些数据应在掌控之中且在云中可见,以及哪些数据不能出现在云中。这不仅可以让您确定迁移到公有云的业务逻辑,还可以明确应使用什么机制来保护数据。