中国IDC圈2016年9月6日报道,9月1日由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟承办的“2016可信云大会”在京隆重召开。在可信云服务性能和运维论坛上,中国信息通信研究院技术与标准研究所工程师、可信云认证测试团队负责人陈屹力对金牌运维及主机性能评估方法进行了全面介绍。以下是演讲全文:
中国信息通信研究院技术与标准研究所工程师、可信云认证测试团队负责人 陈屹力
谢谢各位来宾和嘉宾,今天算是一个暖场,介绍一下可信云金牌运维和性能评估两个专项评估的一些评估方法。
首先我们讲一下金牌运维,金牌运维从可信云传统的运维审查,相当于一个服务升级。大家都知道,可信云所有的评估参评云服务都有一个必要环节,就是运维审查。对于云服务的运维系统能力的考察,包括管理制度,包括运维系统,我们从这儿可以看到,运维系统作为可信云认证的必选项,主要从公司管理制度和运维管理系统审查,运维管理由多个字系统发展,比如如何协调发挥运维系统的功能,运维系统管理体系体现的也是管理理念,相关制度是保障整个稳定运维的必要条件。目的就是保证云服务安全性、可靠性、业务持续性,尤其是保障企业关键业务系统的持续运营和可靠运行,提高运营效率和服务质量。审查方式其实就是现场通过对于文档和运维管理系统的查看。
为什么做金牌运维专项评估呢?实际上我们对运维系统提出更高的要求,在原有的基础上,要实现更多,比如自动化运维,更高层次的要求。我们现在已经完成了可信云认证服务专项评估第一部分,面向云服务提供商的运维指南,这个在2015年8月份正式启动的。旨在引导云服务商建立完善的运维体系,为企业提供业务提供有效指导,提高企业的运维能力。运营审查涵盖了所有的目前可信云可以评估的云服务,包括云主机,云数据库,IaaS层,PaaS层的服务。所有参评云服务在原来必须要进行运维审查。审查具体工作一般是双方我们各自准备,可信云我们归准备一个云服务运维管理系统审查表,现场审查并如实记录审核情况,服务商按照审查要求,准备文档材料,包括运维系统的一些相关功能的演示。这是我们现场审查的照片。
运维审查规则是什么呢?必须满足所有审核要求,比如在某些初审后不合格项目,需要在整改期采取修正措施整改之后再进行评审,符合要求的也可以。推迟的或者不通过审查的项目,没有满足某个审查要求或者缺少某个审查要求,这些都是属于文档类的。如果在整改期还不满足那就不能通过了。运维审查有一些常见问题,运维体系文档不满足审查要求,第一是没有明确的职责和范围,第二是运维流程不规范,第三是制度落实不到位。对于运维管理系统功能上的不达标项,一个是监控方面,故障处理问题,整个流程不连贯或者不规范。二是拓扑管理,第三是安全管理。
金牌运维评估的话从三个维度,第一个是云服务运维流程管理指导,二是云服务系统完备性,完备性是指材料方面的。云服务的管理系统自动化管理是三个维度,这是我们的评估流程,包括运维审查和金牌运维审查都是这样的,第一是企业进行报名,我们首先要企业根据金牌运维审查表进行自查,自查以后反馈给我们,然后我们再去进行确定,自查材料是否符合,如果是合格的话,我们就展开金牌运维专项评估,不合格的再返回到上面材料那块。最终我们会安排现场运维审查,审查结束双方签字确认,再最后统一组织专家评审,专家评审如果合格的话,那就预设着获得了金牌运维的认证。
我们大概看一下金牌运维管理的流程,第一是服务台,服务台包括运维人员岗位职责说明,服务台与客户联络方式,服务台职责,服务台管理制度。事件管理是事件记录和分类,事件处理和封闭,日志管理。问题管理是问题记录和转交,问题处理,问题录入实时管理,下面是变更管理,配置管理,发布管理。还有知识库管理,知识库管理是企业内部所有包括运维故障的一些记录都可以发布到VK上,最后一部分是从统计角度来看,各种维度的包括事件,问题的,配置的类似报表统计功能。运维系统包括权限、报警、拓扑、日志、软件、统计报表、公章、计费、安全管理等等。
我们的指标一共有220个具体子指标项,180个通过项。金牌运维优势,第一,我们更权威,通过严格把关,实时现场评测最后得出的结果。第二,更全面。金牌运维评估比传统评估内容更多,覆盖更广。第三,获得金牌运维认证的企业会更安全。评估申请条件,参与可信云服务认证年检,同时符合两项要求的企业可以申请金牌运维。评分规则220分,所有达标企业将服务云服务金牌运维专项评估证书和网站logo的标识。截止到目前通过的有五家企业。
下面简单说一下性能评估,性能评估是我们最坎坷的标准制定和评估体系完善,我们走过了好几轮。首先我介绍一下性能专项评估,大家需求都有,但是我们做的时候,有时候发现很多问题是必须要过的坎儿,首先我们原来是想性能专项评估能够直接反映云服务的水平,第二是用户选型是有要求的,最后针对服务商,性能能够体现出服务的差异性,促使它提供一些优化的手段。最后我们想做一个测试工具,统一测试工具,就是标准化。
2015年可信云发布了一个云端的跑分评测,我们是从计算、存储、网络展开的。这是我们的测试结果,左边是计算,右边是存储,网络是由于我们安全性问题,暂时屏蔽了。最后回顾一下我们整机测试总结,首先整机性能我们想补充单向性能评估的一个弱点,我们利用场景化或者实际业务去整体衡量它的服务好坏水平,最开始第一阶段,我们是做一个场景化,场景化我们把场景剥离开,我们第一个做了数据库场景,第二是基于流媒体的场景,我们逐步展开评测。第二阶段是怎样集成这么多的场景,如果按照权重来评分会更合理,不是说通过一个工具就决定性能的好坏。第三阶段,我们业务有了,但是机制怎样做呢?就是不同的权重,怎样施加业务压力,比如说并发,比如连接数,我们怎么样平衡。最终我们要做自动化,包括把前面场景化工具全部集成,自动化最终要实现部署、测试自动化,目前我们标准不断在修订,工具在不断开发。标准制定我们基于云服务性能基准测试方法第一部分,云整机和个人存储,这是IaaS层的,感谢中国移动、华为、阿里、腾讯等等单位的支持。
如果大家有业务方面的问题可以随时联系我,谢谢大家!