随着复杂性增加,基础设施组件之间的相互依赖性以及向基于云的基础架构的迁移以降低风险和成本,IT中断服务提供商Continuity Software发布了2016年私有云灾难性标准问题(2016 Private Cloud Resiliency Benchmarks)。
在对超过100个企业环境的调研中,每个企业都遇到了停机事故。该研究还发现99%的环境中面临的安全风险,97%的环境中存在性能风险,以及82%的公司的数据丢失的风险。
私有云环境的要点包括:
48%的企业首选操作系统是windows,只有75个使用Linux操作系统,46%的企业使用混合操作系统。73%的企业使用EMC数据存储系统,38%的企业使用NetApp,使用IBM的占据26%,使用HP的占24%,使用Hitachi系统的占18%。27%的企业进行了数据复制以确保自动化异地数据保护只有12%的企业使用主动故障转移,以确保持续可用性几乎96%的企业使用多个物理路径在外部存储设备和主机之间传输数据。
关键风险包括:
在集群节点之间存在配置转移,这可能是由于诸如亲和力规则的错误设置或集群中存在的所有主机的文件的不可访问性之类的差异而阻止故障转移。网络配置错误,可能导致虚拟机停机和隔离。这可能是由虚拟机端口组的错误配置引起的,ESXi集群主机之间的资源不对称也可能导致故障。存储设置错误可能会导致备份损坏和数据丢失。这可能是由无效的CBT配置或由于不正确的UUID设置,或不一致的LUN编号引起的。
Ponemon的报告显示,每次的中断停机的成本约为74万美元。
Continuity Software的首席执行官Gil Hecht说:“每个系统都会宕机,当一个流行的服务下降时,用户在短时间内就能意识到。好消息是,云基础设施中潜在的大多数风险都可以在服务中断之前被识别和纠正,这需要专门的工具,但最重要的是要有发现风险并补救的战略。”