中国IDC圈11月12日报道,中国IDC产业年度大典作为国内云计算和数据中心领域规模大、具影响力的标志性盛会,已成功举办九届,如今第十届中国IDC产业年度大典(IDCC2015)也将于2016年1月5日-7日在北京国家会议中心隆重召开,预计本届大会参会人数和规模将达到8000+人次。
"百家访谈"作为第十届中国IDC产业年度大典的预热环节之一,自启动以来已经得到了业界和行业媒体广泛关注与好评,诸多IDC和上下游知名企业高层均将应邀参与其中,他们的真知灼见为国内IDC行业发展起到了重要推动作用。
近年来,随着我国信息产业的快速发展,一批批互联网企业如雨后春笋般迅速崛起。互联网正以其强大的信息存储、互通和处理能力成为当前最重要的科技生产力。信息技术的飞速发展尤其是云计算的出现对企业运维人员提出了新的要求,自动化运维逐渐取代了手动、面向基础架构的运维,同时运维人员需要革新意识。
那么现有的互联网企业运维的现状是什么样的?在运维的过程中经常遇到哪些难题?云时代运维人员在云端进行运维需要考虑到哪些问题?记者就这一系列问题采访了泰岳教育专职讲师张冬洪,其同时也是Ceph中国社区沙龙活动的负责人,据悉其曾先后在外企和某上市公司担任系统工程师和DBA工作,拥有多年运维经验,并且在大数据,云计算和自动化运维方面积累了丰富一线实战经验。
泰岳教育张冬洪
目前互联网企业在运维过程中或多或少存在运维体系和人员两大方面的问题,张冬洪表示:一方面,运维体系不健全,缺少必要的运维管理平台;组织结构没细化,管理混乱,内部分工不明确;监控体系不健全,没有一个完整的流程和体系,除了基本的系统硬件、应用监控,缺少必要的业务监控,而且没有一个完善的灾备机制;前期缺乏对业务增长的预估和调研,有的缺少必要的性能测试,压力测试,导致架构设计不合理,可扩展性不强,系统不稳定,不能很好的满足业务快速增长的需要。另一方面,内部知识分享,文档库(wiki)建设不完善、凌乱,不利于运维人员的成长和部门知识体系储备。有的互联网创业团队,为了节约开支,节省成本,控制人员,给现有的运维人员造成极其重的负担,以至于在多数情况下不能较快地适应新技术,最终导致许多新技术不能被加以利用。
而在运维过程中经常会遇到诸如系统升级,软件包升级,安全策略制定,偶尔会遇到一些DDOS攻击,SQL注入,IDC光纤故障,IDC机房被攻击,操作不当造成业务瘫痪等问题。在中大型企业中,经常会有跨IDC的高可用架构方案的设计规划、异地容灾体系的构建、跨数据中心网络和监控体系部署等难题。
现如今,云计算正以其高可靠性、规模大、高扩展性、虚拟化支持、高稳定性、通用性强、资源利用率高等强大的优势迅速占领高地,运维人员在云端进行运维需要考虑到哪些问题?
云运维要部署适合自身的IDC和网络
对IDC选择来说要从以下几个方面进行综合的权衡,IDC基础设施是否具备较好的冗余性和高可用性,IDC的规模和专业程度、IDC的服务质量、IDC的租用价格(BGP机房、机柜、带宽)、IDC的历史故障率以及响应速度、IDC周边设施(优先选择周边有其他运营商)、IDC的UPS是否冗余、IDC的网络运营商的覆盖面(优先选择覆盖面广,本地线路资源多的)以及是否有较为完善的监控体系和抗Ddos攻击能力。
从网络层面来讲,首先在硬件上就要选择合适的厂商设备,在构建网络高可用时一定要选择同一类型的设备做主备或者堆叠,并且要做好配置备份和及时进行升级。如果有充足的预算可以考虑万兆交换机(通常是千兆交换机)来提高吞吐量。如果是部署的私有云网络,可以通过设置trunk和channel来实现简单的vlan(可以采用openvswitch、linuxbrige等),切记管理网络和业务网络需要分离。在私有云内部也需要划分不同业务和不同网段,默认不需要出外网。特殊情况下,可以通过设置来实现访问外网,来提高安全性。如果企业有需求要构建自己的内部局域网,类似AWS的VPC这种功能,可以运用vxlan或者SDN比较前沿技术。
私有云运维自动化过程中系统需具备可部署性
原始靠手动、面向基础架构的运维已不能满足互联网时代的运维需求,自动化运维已成为当今时代的主流之一。那么在私有云运维自动化过程中系统具备可部署性首先需要有足够的硬件和网络资源的支撑。跨数据中心的部署,需要专线或者VPN连接机房和办公网,组成局域网,并需要能满足对比如HP 的ILO,DELL的IDRAC,IBM的IMM的远程管理。
其次应根据运维人员的基本情况选择一种或者多种自动化工具来进行自动化任务的分发、部署和管理,有条件的企业可以开发一套自动化运维管理平台。系统的自动化部署可以考虑cobbler或kickstart,软件包或者项目分发可以考虑借助puppet,ansible或saltstack等工具来实现。
再次,为了能够使部署更方便、快捷,本地yum 源必不可少。有时候也要准备一些私有rpm包,针对web服务器、DB服务器、缓存服务器等应用系统制作与之对应的内核。就此一点张冬洪说:“系统上强烈建议要部署IPMI等类似的系统管理工具,帮助收集系统的基本信息和便于自动化工具或平台的调用。”
最后,各种项目代码、配置文件、脚本文件等应该存放在一个安全可靠的仓库中,比如:svn、git、gitlab等,方便配合自动化工具的使用。
IaaS和DevOps成为IT运维管理的新常态 运维人员面临新的挑战
在互联网时代的洪流中,运维人员经常会被IaaS、DevOps等新常态名词给洗脑,其实质上是从传统运维到云上运维的一个转变,手动运维到自动化运维的一个转变,运维人员需要从思想上进行一次升华,不仅要做好传统的运维工作,而且要在此基础之上,解放思想,提升服务意识。传统的运维工作基本上可以驾熟就轻,运维人员现在应集中精力于新技术的探究以及自动化部署和实现上,不仅如此,对现有服务架构的高可用性,高可扩展性,高稳定性和高安全性等方面也需要持续的关注和跟进;同时运维人员还应不断追求新知,学习一门编程语言,进而向运维开发、架构师演变,从而全面发展。
云上运维在从某种程度上解放了运维,同时也对运维人员提出了更高的要求。运维人员要掌握Openstack、CloudStack、Docker、Kubernets、Mesos等云计算相关的技术;还需要深入了解KVM、XEN和Hyperv等虚拟化技术;要懂分布式存储相关技术Ceph、NFS、Sheepdog、GlusterFS、MooseFS等;还需要懂一些网络知识vlan,vxlan,SDN等。
与此同时,新常态对监控也提出了更高的要求:不仅要对宿主机进行监控,还需要对云平台和业务进行监控,甚至还需要对资源的使用情况进行监控和统计。总之,云上运维管理将更复杂,更加具有挑战。
采访的最后,泰岳教育张冬洪介绍,泰岳互联网学院由神州泰岳集团下属子公司北京互联时代通讯科技有限公司创建,致力于面向大学生和初入职场人群,打造职业规划,职业培训,就业推荐三位一体的一站式在线职业教育服务平台,师资来自一线技术专家,十年以上从业经验, 都是业界的名人,有较丰富的工作经验和行业资源。 课程理论结合实践:从工作出发,带领学生快速学习技能,工作后能较快的容入工作。同时作为Ceph中国社区沙龙活动的负责人张冬洪表示,为了推动Ceph技术在中国的普及于今年5月份成立了Ceph中国社区,后续将在全国开展Ceph技术沙龙巡演布道之旅,为Ceph的普及冲锋陷阵,培养更多Ceph专业从业人员。
来自泰岳教育张冬洪的寄语:企业的快速发展离不开IDC产业保驾护航,我们将继续支持IDC产业的全面发展,同时衷心祝愿第十届中国IDC产业年度大典顺利召开!