大家下午好!我给大家分享的是“大型OpenStack私有云运维项目角度实践”,我是中联润乐观通的运维负责人。我的分享分为两部分:第一部分是政企专享云建设过程;第二部分介绍一下我们公司对政企专享云的实践。
我们公司2009年成立,是一家专注于云计算大数据技术研究和业务运营服务的知名服务运营商,有可信云及ISO27001的认证等等。我们的客户包括国家发改委、国家信息中心、人民政府、中国红十字会、中华人民共和国国家卫生和计划生育委员会、中国人口宣传教育网、中国海关、中国石油、中国联通、中国海事局、复星医药,我们客户有国家级、省部级、上市公司项目,而且是大型的项目。
我们产品线包括VPC云,客户共享一多云,还有专享云,一个客户一个云。还有大数据,有大数据资源管理平台、分布式数据库、安全态势感知、可信数据交换。还有专业服务,IDC托管、运维外包、咨询和设计、培训。行业方案上有宏观经济解决方案、工业、农业、电子税务的解决方案,政务公开、办公云计算解决方案,制造、医疗方面的解决方案。
今年工信部发布了《云计算三年行动计划》,这全面预示着或者全面标志着云计算从概念变成全国全行业落地的概念。
有公有云和私有云,公有云是向上发展,整合更多的高端功能,比如FPGA、人工智能、大数据。私有云是向下发展,IT常态的生产力工具。
政企云的核心需求是什么?我们总结了12个字:自主、开放、成本、性能、定制、迁移。自主是自主可控,开放是代码技术开放,成本和性能大家都能力,从实践来看,大家对定制和迁移有非常深刻的要求,购买业务不是单买一个云就结束了,还要做定制化的迁移工作。我们应对策略是四个字词:开源、定制,可以满足性能定制及迁移方面的需求。
这有两个案例可以说明政企云的过程,这是某国家级大数据中心,底层是我们的云,上面是大数据解决方案。第一步是分析业务需求,在信息发达的现代社会,各级政府和相关决策部门需要海量的充分详实的数据,为政策决策提供数据支持。第二是建设思路:以点带面,以北上广三个核心为基础,利用或建设各省区市地方节点,构建物理分散、逻辑互联、全国一体的基于云的大数据平台。建设方式是统筹数据资源,与国家电子政务外网统筹,充分利用现有互联网大型政务和社会数据中心资源,构建形成的国家数据中心体系,覆盖中央和地方各级政务部门,以互联网信息为主,政府数据为辅。建设成果支撑经济决策,大数据中心有效支撑了国家大数据分析及应用,大幅提升了政府大数据采集。
第二案例是某医药行业某上市公司,智造云、星云,从传统模式的自建IDC迁移到基于OpenStack体系的私有云,同时支撑多种子四复杂的内部信息系统,Forest智造云包含集团ERP系统等,星云包含医院业务系统、医疗团队、办公系统等。
设计架构是混合架构。新建以OpenStack为核心的企业私有云,提供了SAP HANA ERP的特殊配置的物理机和标准配置的虚拟机。核心架构为全冗余架构,使用点对点专线连接到用户现有办公职场。建设成果是满足安全和性能要求,以用户需求为导向、以稳定性、安全性、灵活性为设计目标。建设私有云平台。满足行业监管机构对某型业务系统的特殊安全要求,包括医疗档案的数据隔离、数据保存等等。用户受益,安全稳定可靠,通过部署私有云实现了客户IT资源的标准化,通过服务木交付服务,企业不再承担固定资产投入,以更灵活的方式按需选择IT服务。
介绍一下我们在运维方面的挑战。经常同时五个以上的OpenStack项目部署,同时几十个OpenStack项目提供运维服务。比如建设的时候,怎么保质保量的将业务按时交付。
解决方案,任何运维面临的问题都是技术,比如说人。我们在技术、流程方面解决方案是固化工具,我们有运维工具。对于人我们有持续不断的培训,还有一些项目管理的理念引入到我们日常运维过程中。
运维工具包含五个方面:自动化运维系统、工单系统、日志系统、项目管理系统、智能运维系统。
这是我们的工单系统,运维工具—即将开源。还有微服务,换工具就行,相应调整的东西并不多。这是运维管理工具的界面,预计到明年年初或者上半年。
这是我们引入项目管理工具,对项目管理来说都是非常简单的、日常实用的工具,但用到运维场景里,可以起到化腐朽为神奇的效果。比如WBS,所有运维人员拿到项目以后,首先要做的是写一个WBS,然后把任务分解下来,一个人四个小时,几十分钟,但一定要具体到人、具体到。之后是Todolist,每天有一个跟踪,到底任务完成怎么样,有没有完成,或者中间有没有碰到问题,每天都要做。这样整个过程都能够掌控。然后是每个项目做完以后有个回顾会,进一步总结,下一步如何改进,一直持续不断的这么做。
团队建设上有一个改进过程,现在运维有60多个人,最早的时候有4个字:支持组,24小时接电话,24小时值班,还有一个4000电话;现场组,基本上做的是物理操作,比如服务齐、网络设备,查网线;还有网络安全组;系统组,比如OpenStack之类的。这个是以业务需求划分的,有一个问题,业务来后,现场组、网络组就非常忙,现场组做的一些活,技术含量相对较低,所以离职率越来越高。后来做了架构上的调整,建立了支持组,还有实施组,对服务器、数据机房、网络设备要会操作,这些人都经过了培训,也能够代表OpenStack。基本上我们对实施组的定义是一个人完全有能力单列出来一朵云。然后是架构组,架构组主要做方案设计,包括跟客户沟通形成方案设计,包括后面的故障处理。
我们还有一个概念是虚拟项目,针对项目服务,比如来一个项目,架构组缺一个人,这个人专门复杂项目,去协调实施组、支持组的人组成协调团队,专门有人负责这个项目就会特别上心,项目遇到任何事情都会找他,项目有哪块要改进也非常上心。虚拟项目从去年年底到现在,效果非常好。