近段时间来关于公共云的消息不时传来,比如在阿里云故障、AWS故障、谷歌云故障,包括不久前腾讯云的故障新闻……,几大公有云频频出现故障,让选择上云或者已经上云的一些企业人心惶惶,对云计算技术的安全性产生担忧。

其实,关于公有云的故障,早就引起了很多不满,一度成为人们云计算技术上云的最大障碍。这些都是公有云里的大牌,市场地位显赫、技术过硬,也是不差钱的金主,但仍逃不过故障的魔掌,其它的公有云就更不用提了,只是市场份额不大,出了故障也不像这几个更受人们关注罢了。这说明在公有云的道路上,还有很长的路要走,还需要不断完善。

公有云故障危机引担忧 业内人:给它更多的成长空间

公有云仍算是一个新鲜事物,伴随着云计算的出现而出现的,迅速成为了一种新的IT服务模式,据有关资料表明,公共云是目前云计算行业增长最快的一个分支,与传统的机房租赁不同,客户需要自己买设备,放到机房中自己运营,业务断了也得自己处理,损失自己承受。现在公有云则不同,这时客户租用的是公有云提供的整个服务,客户一下子成了甲方,有权利对乙方造成的损失进行索赔,所以当公有云故障时,自然这些甲方不高兴,其实以前机房故障也并不少,只是哑巴吃黄连,有苦说不出。现在则不同,将业务交给了公有云,就要求公有云不能出故障,这样虽显得无理,但只是站的立场不同而已。

客观上讲,上云之后,依仗先进的数据中心架构和运维水平,故障频率和时长较以往已有大幅减少。的确,我们是偶尔能听到某个公有云又断了。但屈指数一数,按年计算也不过一两次而已,这对偌大的、全年24小时满负运行的公有云实属不易。航空飞机、火箭、航天这些领域不也发生过大大小小的故障吗?公有云就要全年无故障运行?当然,出现了故障总是要总结经验的,避免同样的错误第二次发生。

现在的公有云承载了太多业务,网络架构和规模都很庞大,复杂性可想而知,要让这样一个庞大的IT系统运转起来,并且还要长时间不出问题,难,很难!公有云企业也是绞尽脑汁,确保业务不出问题,一切以业务为先。有人可能会说,为何不增加冗余备份系统,冗余的确可以降低故障发生,就像飞机一定要携带两个或者四个发动机一样,但这样无疑增加了系统复杂度,要处处都要备份,这样的公有云运行起来也显得臃肿,所以要在冗余和复杂度上做好权衡。

一味地追求冗余,最终这个公有云可能变得不能用。现在公有云基础架构上都倡导简化,比如网络层级要减少,无用的网络协议弃用,能减则减,这样的公有云才好维护,出了故障也能很快感知到,切换到冗余设备或系统上来。公有云拥有大量专业技术人才,也在如何保证业务持续性方面做了大量研究,对公有云的任何部分都做假设,任一个环节出问题都有备用方案,从而确保业务不受影响,这项工作正在做,也会一直做下去。

与其将命运交给别人,不如掌握在自己手中。作为用户,一方面我们要上云,一方面也要把握好这个度。公有云的确可以给上云业务带来好处,最大的好处就是IT投入成本大幅降低,租用公有云的业务很廉价,这要比自己购买设备,自己做运维要便宜得多。但并不是什么业务都要上云,要做好取舍,关键业务是否掌握到自己手里,也好不受制于人,这是作为一个上云用户要认真考虑的事情,自己的业务是否能得到完全保障。

一旦确定上云,那要做好选择,有条件的要选择多云,即将业务跑在多个公有云上,我们经常听到有公有云故障,但从没听到过两个公有云同时故障,可以选择两家或更多家公有云部署业务,万一其中一个公有云故障,业务可以顺利切换到另外一个公有云上,确保业务不受影响。也许这样的投入成本要高一点,但就要看我们对业务的重视程度了,能够忍受可能故障带来的损失。另外,要向公有云要护身符,一旦公有云故障,给自己的业务带来损失,可以根据故障损失来要索赔,避免自己遭受额外的损失。一般公有云急于扩张,是很可能答应去签订这样的保护协议的,这样就给自己增加了一个保障,这对公有云方也是一个约束,让其更加不敢有故障,从方方面面去确保不出故障。

如今,公有云已经和我们的工作和生活紧密联系在一起,有太多的业务都与此有关,可公有云不过也才发展十年的时间,我们要给它成长的空间,让它不断得到完善。正因为公有云吸引了太多的关注,所以一出故障,事件就会很快发酵,影响范围很广。人无完人,更何况是这样复杂的新生系统,出现故障再正常不过了。对于大部分的公有云,早已将保持业务稳定性放在了首位,它们在背后做了大量的工作,一切就是确保用户的业务不受影响,在此基础上再去搞扩张,搞发展,这和用户的想法不谋而合。

相比以往的技术,公有云在可靠性方面其实是有很大提升的,新的技术在冗余上做很多文章,包括虚拟化技术、软件定义、灾备技术等等,只不过现在一出故障,就成了众矢之的,坏消息传的太快。当然,我们仍要清晰地认识到,公有云还处于起步阶段,难以避免会出现这样或者那样的问题,我们要给公有云成长的空间。公有云能够快速部署业务,建设成本极低,免维护,这些都是优势,是其能够获得大量用户支持,市场不断高速增长的原因,它的未来也一定是光明的,会有越来越多的用户选择公有云所提供的服务。对于公有云的可靠性,我们要给予一定的宽容心,给它成长的空间。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-17 16:17:39
云安全 狙击网络病毒,收藏这一篇干货就够了
对于病毒攻击者来说,核心诉求是利益获取。以往的病毒攻击事件,大部分以数据盗取为主,同时通过数据倒卖等手段进行变现。 <详情>
2019-07-17 10:41:18
国内资讯 腾讯云披露退役硬盘销毁流程,强调用户数据安全保护
销毁过程中有任何异常,腾讯云设计的回溯机制将有助于找到问题所在 <详情>
2019-07-11 18:54:06
云资讯 公有云选型系列:蜂鸟网渐进式混合云之路(下)
对于那些有些历史的企业,它们既想拥抱云计算,同时原有的传统IT架构又无法割舍,如何兼顾它们,通过合理的组合采用混合云模式搭建起一个真正适合自己的IT新平台,是一个挑 <详情>
2019-07-11 12:05:53
云技术 云风险、云中断和云安全:人为错误是主因
企业可能希望跨多个云计算提供商构建弹性。需要确保不依赖于特定于平台的专有工具,并始终将应用程序构建为可迁移的。容器和基础设施代码方法意味着企业可以快速、可重复地 <详情>
2019-07-10 18:54:17
云资讯 将主流公有云们拉进朋友圈,开源的容器服务商Rancher Labs不以技术为壁垒
相比构建技术壁垒,开源的Rancher Labs更愿意做的是产品上不断创新,反而能够适应行业的变化。 <详情>