混合云管理是现代IT运营领域中的一个热点话题。继续阅读本文以了解它是什么,它的工作原理以及它能够为用户的基础设施做些什么。
目前,大的IT热点之一就是混合云。规模更大的IT运营团队不是正在尝试混合架构就是在积极地将混合云投入生产应用。作为一种相对较新的IT方法,混合云仍然存在着导致拖慢应用和阻碍顺利持续运营的部署与管理陷阱。
混合云管理平台是由两个或两个以上的部分组成的。其中一部分是私有计算机集群,它通常会处理企业的关键任务和核心工作负载,而另一个(或多个)则是处理工作负载需求高峰以及其他任务(例如备份与归档、web服务以及媒体交付)的公共云基础设施。
在理想配置中,可实现工作负载跨混合云边界的动态往复迁移。这就能够让企业根据平均工作负载而不是峰值工作负载来规划和建设一个现代化的数据中心,同时进行适当配置以便在发生故障事件时实现不间断的系统运行。
要实现如此的敏捷性是需要付出一定代价的,即:快速变化的运行动态。
混合云管理自动化的案例
最终,混合云都需要超越传统的管理任务,那远非是使用命令行界面和PERL脚本程序的传统管理方法所能够胜任的。在一个层面上,它太复杂了。例如,一个拥有着100台服务器的服务器集群可托管三十万个容器,而所有的实例都需要控制vLAN和虚拟驱动器。此外,公共云已经将租户控制的概念带入了云领域,其中实例租户都是在他们自己的实例集群内完成他们自己的大部分配置工作。
迁移至容器为所有的管理方法都带来了一定的压力。容器技术极大地增加了实例数量,但随之带来的方便性和便捷性让用户能够以比传统虚拟机管理程序实例更为动态的环境创建和删除容器点。
如果这一点还不够分量,软件定义基础设施(SDI)将被设置为接管集群中的平台层,并实现数据服务和底层硬件资源的虚拟化。SDI可允许更灵活的配置,它能够让瞬态微服务成为众多运行的规范,并将应用程序、平台和虚拟基础设施均化为一个拥有持续变化关系的常变体。
在所有这一切中,很容易被忽略的就是在IT中的一些总体目标。管理员需要在整个系统中维护治理,同时还需遵守法律。这就会带来一些问题,例如加密策略与密钥管理。同样,必须将安全机制融入混合云并根据需要进一步加强和加固它们,这一点是非常重要的。治理与安全这两个问题都需要基于策略的控制、自动化的监控以及针对威胁的识别。
混合云方法加速了向可重用代码段的转移,这通常来自于在线公共库。虽然这是缩短产品上市时间和降低开发成本的一个好方法,但是在第三方代码中还是存在着固有的风险。更进一步,云正在使用让软件即服务(SaaS)和其他的即服务产品变得更具吸引力;大多数未来的IT运行流程将可能是内部代码、第三方模块以及SaaS软件包的混搭。由于云租户对于在何处存放源代码拥有着很大的自由度,所以保持高标准的代码质量也是相关管理工作的一项持续性挑战。
在混合云部署的早期阶段,企业采用手动方法,即主要在沙盒中进行原型设置。但是,随着OpenStack现在正在进入生产阶段,而Azure也正在进入似有云领域,管理方法自动化的问题已在优先级列表上名列前茅。好消息是,业界正在对这一需求做出积极响应,但是解决方案的成熟度还不够高。在集群自动化的过程中,我们将看到区别于传统方法的一个根本性的转变,其结果就是数据中心管理员团队的一次重新调整。
有鉴于上述这些原因(包括用户授权、全面治理、安全性与高效性、敏捷运行等),一个能够处理超出沙箱原型级别增长的自动化管理工具是将混合云应用于实际生产的至关重要因素。
在理想世界中,所有这些功能都将是一个单一交钥匙管理软件包的一部分,但是我们目前还无法达到这样的复杂程度。如今,我们使用多个软件模块来实现一个混合云的管理平台。但是,随着工具集的不断发展,现实与理想之间的差距必将消除,用户也将更易于开发一个合适的控制系统。
诸如亚马逊网络服务(AWS)、Azure以及谷歌这样的公共云供应商已经在他们的专用系统中解决了这些问题。大型云服务供应商们可能会将他们的产品推向混合云中的私有部分,就像AWS对美国政府云所做的那样。作为替代品,诸如Rackspace这样的企业已经转向私有云管理即服务。在这两种情况中,其价值主张就是将管理系统集成复杂性从生产部署中剥离出去。
让我们来更详细地了解一下混合云管理自动化中的关键领域。
混合云部署
在云部署中使用现成的商用系统可简化集成工作,但是一些供应商将在他们的产品中包含专用钩子,从而对存储驱动器、NIC卡或者甚至盒级设备与网络模块造成限制。这一点在混合云的早期阶段是可以理解的,而KISS(保持简单化原则)可以帮助每个人更快地获得工作工具,但是现在它也带来了买家应当避免的受制于供应商。
一个自动化的混合云管理平台是从部署开始的。可以自动且无缝地将新设备融合至资源池,而不用考虑其功能集。这样做可允许管理员分阶段地扩展混合云,从而在任何时间使用最新的设备。在具有快速发展技术的行业中,使用最新的SSD或NVDIMM或服务器芯片将极大地影响成本与性能。
部署自动化可免于要求数据中心团队掌握开发硬件的专业知识,而现有的硬件专家能够更加专注于性能调试和瓶颈问题缓解。
同样,更新与升级的管理自动化也解决了大型集群运行中的一大难题。它还从根本上降低了诸如OpenStack之类多模块软件堆栈中不均衡更新措施、手动错误以及复杂性等风险。
自动软件更新还有助于应用与镜像管理。我们看到了采用已认证图片库的自动化图片验证技术,该技术有助于解决潜在的质量或恶意软件问题。
混合云监控
为了在混合云性能或故障中做出明智的决策,管理员必须知道已经发生了什么以及是如何发生的。对于任何大规模管理套件来说,一个能够监控事件、性能和系统响应时间的监控系统都是必不可少的。版本较新的软件包甚至可以检测到应用程序段中的运行缓慢活动,这一信息可用于确定事件的根本原因。
基于策略的控制
为云租户提供敏捷性和自由度的最简便方法就是采用一个由核心IT制订的策略控制系统,这种方法一方面可以限制租户可以做出的选择,另一方面还赋予租户一定宽泛的选择范围。供应商提供了模板,此举可简化管理员的工作并降低人工错误。一个好的混合云管理平台应该是能够控制和发布策略模板的。
随着伴下一波IT浪潮而到来的软件定义基础设施的出现,基于策略的控制技术将是管理快速变化配置变更的关键所在;基于纸质文档的请求系统已显得不合时宜。在网络方面已经取得了很大的进展,基于策略的软件定义网络和网络功能虚拟化已经实现,而早期的成功案例也指出了改进的易用性和对需求的快速响应。
安全性
虽然企业界早期对于公共云安全表现了一定的担忧,但是有证据证明大型云实际上比典型数据中心更为安全。混合云所面临的挑战在于无缝地将那些公共云安全实践应用覆盖至所有的混合环境。 用于混合云安全方面的现代工具集显得有些碎片化,有些零星的软件可用于防火墙、访问控制等应用。但是,我们可以期望在不远的未来不同的模块可以整合成为安全套件以缓解工具集成挑战。
在所有的安全功能中,加密功能仍然是云运行中的一个主要问题,虽然这也是大多数传统数据中心运行中所存在的普遍问题。大多数用户都不会对关键数据采取加密处理,我们经常看到企业会为此付出代价。加密性能和密钥管理仍然是业内专业人士希望寻求解决之道的两个重要命题,但是它需要相当高的用户需求推动,但似乎这一点还是非常缺乏的。
包括点入侵或意外入侵的入侵检测是相对较新的,但是它是保护混合云攻击面的另一种方法。这种方法可以处理敏捷环境,这种环境中的配置和外部访问都是持续变动的,同时其中也存在着众多准独立运行的租户。入侵检测工具可防止近期的许多重大攻击,例如Target、Experian、Anthem和JP Morgan。
计费系统
管理员更愿意像使用AWS一样运行他们的云(采用所用即所付模式),所以他们需要一个计费工具。计费工具可以提供控制开支策略和限制租户运行的能力,但是所有费用都是在月底结算的。所有的大型云供应商们都提供了良好的计费模式。
在科研领域中,良好计费模式的重要性是显而易见的,超级计算云的精细粒度和所用即所付可确保更多的项目运行强大的仿真模拟和数据分析。
混合云自动化的需求是迫切的,供应商们正在努力满足这一需求。本系列的下一部分将更详细地介绍可用选项以及如何为云的IT团队和租户们实现一流的混合云管理。