中国IDC圈7月17日报道:7月15日至7月16日,由工业和信息化部指导,工信部电信研究院、中国通信标准化协会主办,数据中心联盟和云计算发展与政策论坛承办的"2014可信云服务大会"在北京国际会议中心盛大召开。本次会议以"可信中国云 未来新生态"为主题,积极推动了国内可信云服务认证体系的建立,促进云计算产业良性发展。工信部总工程师张峰、财政部政府采购管理办公室主任王瑛、中央国家机关政府采购中心主任王力达、工信部电信研究院院长曹淑敏、中国通信标准化协会秘书长杨泽民、工信部通信发展司副司长陈家春等重量级嘉宾均出席了会议。其中腾讯云副总裁陈晓建也应邀出席了大会并发表精彩演讲"打造高质量的云服务"。
以下为陈晓建演讲实录:
陈晓建:各位尊敬的领导,各位嘉宾,大家上午好。下面我做一下有关云计算方面的汇报。分四个部分,一个是关于可信云的组织架构的建设,介绍一下高可用云服务,要做哪些事情。我们认为提供高质量的云服务,需要三方面的能力:一个是前端的网络的能力,还有中间虚拟化的能力,还有后端的存储能力。
先看一下有关腾讯的云的组织架构,左边是分为多的云的服务组件,从上到下,是高可靠性、高性能的虚拟主机的服务,还有一个paas的服务,是一个低成本、高效的这么一个paas的服务。第三个是快速的服务,有点类似亚马逊的EDS的服务。第四类就对象的存储服务的,类似于亚马逊的S3的文件存储的服务。第五类我们提供了基于内存实现的服务。第六类我们提供的是腾讯的一个分析服务。在这个方面依据腾讯自身多年积累的一个大数据平台。
我想指出一点的是,腾讯在所有的服务上,都是有我们自身的积累,并没有用到外界的云服务。右边是我们腾讯云整体的架构。我们自身的服务,主要是依托与我们自身的平台,提供了两类,一类是关于IAAS,还有一类是关于PAAS的。
下面是Region和zone分别,第一项要具备足够的规模,你具备了足够的规模之后,才有能力对用户所使用的云服务进行容灾。大家知道我们的一些海量的服务,覆盖全国的一级用户,包括微信、其他的游戏等。所以我们腾讯云服务,在全国各地有很多的机房,我们在华北、华中、华南都会有区域的中心,通过专线,可以把各个数据中心高速的互联。
以这张图举一个例,画的大线是整个的Region,是整个区域的概念。连接三大运营商,还包括其他的一些中小运营商在里面,下面是我们研发多个机房之间互联的TRX,通过外网切入的系统,我们可以连接到多个zone里面,这就意味着无论用户哪一个具体的机架,他所得到的服务,都是整体划一的。
在这样规模的环境里面,用户他自身的业务可以得到很好的保障,无论是因为服务器本身的问题,还是因为网络的问题,我们的系统,都有能够对用户的服务进行保障。我们认为这是为了保障高质量的云服务,所具备的条件。
下面我简单的谈一下,我们在三个层面做的工作,第一个是有关外网的工作,第一个TGW的网关,他所做的工作,就是实现了对多个用户的服务的资本化的,在最外端,只需要用一套系统,就可以对多个运营商实现良好的覆盖。
另外我们也通过网络的便捷手段,可以把来自于外网的转为会内网的。最终用户从外网接入以后,到达内网,中间是经过过滤和保护。如果来自外网的DDOS的攻击和用户的入侵,这个网络可以实现很好的防护,并且可以帮助自身的业务,去防止DDOS的攻击。
我们自身建设有两套的系统,第一套是宙斯盾的,第二个是大禹,第一套是单机房防护,这个系统可以提供高达百G,可以很好的实现业务的保护。如果超过百G的DDOS攻击怎么办,我们有一个大禹的分布式防护,我们在全国各地分布有数百个机房,大禹系统可以把来自于外界的攻击,通过CDN导到圈地各地的各个机房。大禹实现了集中式和分布式一体化的防护。
除此之外,还需要建设我们自身的网络,目前我们在业界有一个非常火的概念叫SDN,就是软件定义化的网络,腾讯在自身软件建设过程中,也做了非常多的工作。其中最主要的就是我们做了一个虚拟网络,就是用户他自身的服务,可以灵活的在多个网络之间进行迁移。如果底层的基础架构出现问题的时候,无论是服务器,或者是网络的问题都可以进行防护。最后我们做的是QOS的控制。
为了做这些事情,这是我们做的网络架构,怎么样实现在不同的区域网络之间有一个很好的环境。我们也实现了由业务层面多层的操作,这样的话呢,任何一个发生问题的时候,我们都可以自动的检测,可以把他切换到另外一个网络层,实现最好的防护。
这个是讲具体的实现,在我们腾讯的网络建设中,有很好的应用。
讲一下关于主机的事情,我们通过自身建立的云主机的能力,可以实现下面的特点。第一30秒快速创建,我们也提供了99.95%的高可用率,另外就是分钟级故障恢复。
在实现这些能力的时候,通过三种能力,第一种是通过镜像的快速创建能力,第二个是基于网络存储的在线热迁移能力,用户的所有数据,他可以选择放在本地和网络,放在网络上,可以通过后台的技术进行一个灾备。最后是完备的故障检测与恢复能力,当问题发生,我们可以很快的检测到这个问题是出在哪个环节。
所有这些服务,都能够通过上层最上层的标准API的方式提供接入层。
这个讲的是我们现在所具备的热迁移、和冷迁移的能力。通过热迁移,可以做到在问题发生之前,对这些业务进行保护,通过冷迁移,在业务发生问题以后,可以通过对用户的业务进行快速的恢复,可以通过分钟级将业务迁到新的服务器上面。
最后谈一下有关质量块存储,最关键的就是块存储的服务,它是腾讯自主研发的服务,可以把后台的硬盘。我们通过后端的这些平台能力,可以实现一些高效的存储。
左边所讲的是架构,我们通过SSD和SATA,另外有很多的优化手段,通过这些优化手段,就可以很好的实现高可靠性和低成本。这是我们的监控平台,通过我们的API,对用户来说,他可以非常灵活的去使用,并且实现自动的调用。
举一个例子,用户通过采集,可以很好的检测到用户的使用情况,通过他的大数据平台去做分析,最终通过我们的链路接口实现操作。这个例子是实际发生的案例,我们的系统在发生告警之后,30分钟以后我们自发一个系统进行维护,这个问题就得到了缓解。后台的能力,可以帮助我们非常好的具备一个高质量的服务,这也是腾讯未来工作的主要的目标。希望为用户提供,不仅在使用云服务的时候,关注他的成本,他的价格,同时不用去关心他业务的可靠性,我们会帮他做好很好的灾备工作。