2019年3月3号凌晨,我使用极客时间学习专栏的时候,极客时间APP各种报错无反应。随后网上消息传来,阿里云大规模出现瘫痪。我恍然大悟,原来极客时间背后用的也是阿里云。
此后阿里云公布,自从3月2号23点55分钟左右开始,华北2地域可用区C部分ECS实例出现IO HANG。通俗一点解释就是磁盘无响应。由于该地区对应的服务区主要是北京的客户。而北京又是互联网企业的聚集地,此次的事故造成的影响巨大,不言而喻。
此次阿里云的故障也导致了一系列的公司的运营运维被唤醒。大家都在努力的排除故障。包括自己的故障和不是自己的故障。但是从网上反映的信息来看,除了干等阿里云几个小时修复以外,建立在阿里云上的各个企业能做的非常有限。
这一方面说明了国内阿里云的确是占据了云厂商的主导地位,另外一方面也说明云的确如同水电一般。一旦出现故障,云故障的破坏力,和停水停电的破坏力,并没有什么太大的区别。
同样的事情在美国发生过一次。亚马逊AWS的存储服务S3,号称比本地硬盘要靠谱不知道多少倍的块存储服务,因为一名码农操作失误,导致了大面积的服务中断。结果是美国半个互联网瘫了,从雅虎邮箱到StackOverflow,一时间哀鸿遍野。这是第一次让我这个普通的吃瓜群众感受到亚马逊的云服务在美国的影响力。
但是也正是这次之后,有能力的企业意识到不能把鸡蛋放在一个篮子里。很多企业选择了亚马逊和Azure,或者亚马逊和GCP(Google Cloud Platform)的双云方案。有些独立的SaaS服务提供商,之前都只拿AWS作为其资源池的,也改由两家云厂商来提供了。
当然,更有经验的企业早就知道单云的问题。比如说苹果公司的iCloud,一直以来都是选择两家云厂商一起来提供冗余备份服务的。这种做法在S3断服之后,变得越来越普遍。
从某种程度上看,亚马逊AWS的江湖地位是很牢固的。但是之前大家一直对亚马逊是不是会一骑绝尘把其他云厂商都干翻这个事情抱有某种程度的期望。S3断服事件以后,AWS的市场份额依旧领先,但是大部分人对于北美市场存在两到三家云服务场商已经没什么怀疑了。毕竟,即便用AWS,也需要有个备份。
有竞争肯定是好事情。S3断服对AWS不一定是个好事情,对北美市场的云生态,却是一个值得纪念的历史性事件。我一直在想,同样的事情在中国市场应该会出现。但是之前出现的一直都是腾讯云弄坏一个客户这样的鸡毛蒜皮的事情。今天阿里云大规模断服,无疑给广大的云用户厂商提了一个醒,云服务也是需要有备份的。
阿里云在中国就像AWS在北美一样,占据了巨大的市场份额。有多巨大对我们来说不够直观。这次阿里云一瘫,一堆堆的企业都冒出来叫唤,真的是非常的直观。
这个事件,对阿里云来说也许并不是一件好事情,因为这让很多企业意识到云厂商也是需要备份的。阿里云一家独大的可能性被大大压缩了。但是对华为云,腾讯云,中国电信天翼云们,都是好事情啊。对比美国云市场的发展,中国云市场阿里云一家独大的局面,也越来越难了。
相关阅读: