一、媒介
在IT服务管理和运维主动化这个范畴,业界比年来的发展比力快。从IT服务管理(ITSM)、数据中心主动化(DCA)到开辟运营一体化(DevOps),相干概念和理论不绝涌现。从IBM、BMC、HP等传统厂商各类工具产物纷纷面市到Puppet、Ansible、Saltstack等开源办理方案风起云涌,各类工程实践也是出色纷呈。
放眼如今各类技能论坛、交换大会,运维主动化已然成为专题,各路豪杰纷纷登台,分享案例,探究方向,令人目不暇接。在这个范畴,我固然在企业内部有一些工程实践履历,但更多的还是一名学习者,常常“潜水”于各种讨论群,关注相干公众号,积极从偕行的履历中汲取营养,不绝调解我们本身的工作方向。
恰逢我们团队研发的智能运维平台第一阶段工作完成,将行内数万个节点纳入了管理。我想可以借此机遇把这几年的一些思考作一总结,以期抛砖引玉,与偕行探究交换,于是便答应下来。也就有了如下零散的总结,不成体系,还请各位专家指正。
二、运维的界说
(一)运维概念探究
论及运维主动化建立,起首有须要先讨论一下运维的界说。通常,我们把运维看作是英文“Operation”的翻译。固然,这个单词也可以翻译为“运营”。于是业内也有不少专家偕行撰文研究运维和运营的接洽与区别。比如,优诺科技CEO陈傲寒曾写过一篇文章《IT:从运维到运营》,内里就有一番独到的叙述,感爱好的同道可参考。
对于我们一线工作者而言,概念和理论固然紧张,但怎样举行工程实践却是我们更为关注的话题。我们讨论运维的界说,更多的是盼望明白其所指代的工程范围。固然,这本身也是一个见仁见智的题目。
于我个人而言,倾向于把运维的寄义界定为数据中心各专业技能岗位的一样平常运维工作,具体而言,就是各专业技能岗位职员与各类软硬件运维对象举行交互操纵的活动。必要增补阐明的是,技能运维也只是数据中心各专业技能岗位职员技能管理工作(TechnicalManagement)的一部分。由于,这些专业岗位的职员一样平常还必要完成技能文档整理,技能培训,各类申请提交等技能相干任务。但是,由于这些工作与运维对象并不举行直接的交互,以是不思量纳入技能运维的范围。假如从ITIL理论体系来讲,这里的运维界说大抵可圈定在服务运营(ServiceOperation)中的IT运营管理(ITOperationsManagement)范围;假如从DevOps供应链的视角来看呢,则又可对应于技能运营(TechnologyOperations)的部分。
本文界定的运维工作范围可用下面的图1来表现。
图1运维界说
(二)聚焦小运维
如许的范围界定,可以说是“小运维”的视角,看起来大概有些“局促”。毕竟,在IITL体系中,从V2版本就开始夸大要从运营维护的层面上升到服务管理的层面,V3版本则更是夸大了服务生命周期管理的理念,假如我们再回过头来讨论技能运维工作,简直有“头脑倒退”的怀疑。另一方面,DevOps也开始讨论怎样突破传统的部分壁垒,推进构造文化的革新,以寻求更加灵敏高效的IT交付,假如我们还停顿在运维部分这一环的具体专业工作,好像也有些跟不上期间潮流。诚然,按照这些先辈理论来推进企业级“大运营”体系的建立无疑是精确的方向,我们不但不会反对,而且还要不停积极跟随。
然而,我在这里聚焦于“小运维”的概念,重要是出于如下几点思量:
无论已往、如今,还是将来,技能运维都是数据中心的底子工作,提拔这部分工作的“生产力程度”对于提拔整个数据中心运营程度和服务本领至关紧张。这既是实现大运营体系建立的底子,也是大运营体系建立的紧张内容。
随着假造化技能、分布式架构、云盘算办理方案的广泛应用,企业IT环境正在快速变革,职员活动的风险也在不绝增长,数据中心技能运维工作正面对着新的挑衅和变革。
从实践履历看,生产运行风险很大一部分出在技能运维环节。技能运维操纵失误导致庞大生产变乱的环境我们时有耳闻(就在笔者整理这篇文章的时间,大洋彼岸就传来了GitLab误删除数据库的消息)。这些变乱的发生,固然有技能管理方面的题目,但也与技能运维生产方式密切相干。正所谓,生产力决定生产关系。刀耕火种的掉队生产方式,肯定制约着先辈生产关系的创建。运维是个专业麋集型、知识麋集型工作,但本日,它在肯定程度上还是劳动麋集型工作。我们做IT的,不停在积极解放别人,暮然回顾,却发现我们还未曾解放本身。
已往一段时期,相对于办公主动化和管理流程主动化,不少企业在技能运维主动化建立方面的器重程度并不敷。比如,有些很早就创建了IT服务流程主动化平台,实现了变乱管理、变动管理流程的主动化。但其背后体系、网络、应用、安全各专业的大量技能维护工作长期以来还是由技能职员手工完成。在这个过程中,固然也在渐渐引入大概建立一些工具平台,发挥了肯定成效,但并未根本改变运维工作模式。
(三)传统企业VS互联网企业
就本身不完全的观察与总结,在技能运维范畴,好像存在两个比力显着的征象:
已往从事专业技能运维工作的职员大多定位为管理(Administrator),他们对各类产物的技能原理、下令操纵、题目诊断、性能调优等都有相称深入的明白和把握,此中不少骨干还通过了业界比力有影响力的专业认证。但是他们在开辟技能方面好像比力短缺,有些乃至对完成脚本编写如许任务都感到困难;
传统企业和互联网企业在IT管理体系建立方面的做法也有显着差别。传统企业多数优先夸大管理流程的建立,运维主动化建立工作则在其次,很多时间优先级还比不上测试主动化建立;而互联网企业呢,多数优先推进技能运维主动化建立,而后再渐渐思量管理流程体系的建立。
对于上述两个征象背后的缘故起因,我也做了一些分析。除了有企业文化和管理理念方面的差别之外,我想尚有两个紧张因素也不能忽略:
1)技能环境的差别
传统企业已往的IT环境,大多是基于商用软硬件构建的,在IT管理方面,通常也引入了专业化的工具产物,因此技能运维要求重要侧重于“能用”、“会用”、“用好”这些工具或产物;
互联网企业的IT环境,基于开源和自研构建的比力多,险些很少采购贸易工具软件,因此不得不“本身动手、丰衣足食”,因此我们显着感到他们运维职员“动手本领比力强”。
2)IT规模和运维职员规模的差别
对于传统企业而言,
固然近10年IT规模也在不绝增大,但由于大多采取会合式架构,单台装备的设置也比力高,以是IT装备的规模控制比力好,大多都在万台以内,少数大型企业也没有突破十万这个数量级(此中很洪流平也是比年来假造化技能不绝引入的贡献)。
职员设置方面,国内传统企业广泛比力器重,一些大型企业中,上百乃至近千人的专业技能运维队伍设置也是常见的。
因此,已往较长一段时期内,这些企业的运维工作大多采取人工维护为主,工具支持为辅的模式。固然,如许也可以或许满意一样平常工作需求,以是技能运维主动化建立的需求和压力并不不黑白常急迫,不成其为重要抵牾;
而对于互联网企业而言,
大多采取了分布式架构,通过大规模比力便宜的服务器集群来支持海量的业务压力,加之比年来又广泛利用DOCKER等容器技能,因此不少企业的IT环境规模都比力巨大,十万级,乃至百万级节点规模在大型互联网企业中并不鲜见。
职员设置方面,由于互联网企业的业务发展较快,市场竞争剧烈,在较短时间内配备肯定命量的专业化运维队伍并非易事,加之面对云云巨大的运维规模,主动化运维天然就成了肯定选择。
不外,近几年我们也看到,传统企业和互联网企业在IT架构方面已经开始渐渐走向融合。不少传统IT企业也开始实行引入分布式技能架构和一些较为成熟的开源产物,走上了会合式架构与分布式架构相互融合,相互增补的蹊径。沿着这个蹊径走下去,肯定会导致IT运维的规模快速扩张,IT运维的复杂度也将不绝增长。末了,技能运维主动化天然也就会成为各人共同的寻求。实际上,我们已经看到各传统企业正在纷纷加大技能运维主动化的建立方面的投入(包罗智能化运维方面的实行),固然,这尚有一个发展过程。
这两年,GoogleSRE运维履历在国内偕行中引起了较大反响,其核心的一条理念就是:SRE团队的运维工作限定在50%以内,剩余时间应该花在研发项目上。我想这也代表着专业运维将来的一种发展趋势(旁白:笔者在5年前也开始预感到运维开辟是局面所趋,因此启动了第一个运维主动化工具自主研发项目,几年下来渐渐作育了一支运维开辟队伍,但这个规模还是很小,离50%这个比例相去甚远)。将来企业IT运维本领的竞争,运维开辟本领必将成为越来紧张的因素。
(四)小结
综上所述,我们在这里把运维聚焦于技能运维工作,并不是要“开汗青的倒车”,而是号令各人更加器重数据中心技能运维工作的新变革和新挑衅,务实地面对技能运维主动化的急迫需求,扎踏实实地打牢这个底子,以便更好地实现IT服务管理和代价创造。对于安全生产而言,产物质量是根本,生产运维亦是关键,这正如一块硬币的两面。毕竟,在业务体系整个生命周期中,在开辟测试运行的完备链条中,生产运行这个环节的周期最长,对客户服务也有直接影响。我们不能让这个环节成为短板。
三、运维业务模子
(一)好的运维业务模子要求
假如把运维主动化软件看作是业务体系,其架构计划也可依照“业务架构→应用架构→技能架构→数据架构”的计划方法论。因此,我主张在研究运维主动化技能方案之前,应该先对运维业务有个清楚的形貌,最好能抽象出业务模子,以确保实现的运维主动化软件最洪流平匹配业务模子。固然,这里的运维业务仍旧是上文讨论的技能运维范畴。
在我看来,一个比力好的运维业务模子应该能满意如下六项要求:
可以或许完备地形貌数据中心技能运维工作中的业务对象、业务活动、业务流程和业务脚色。
可以或许实用于体系、网络、应用、安全等多个专业(即每个专业的运维都是这些内容);可以或许实用于传统数据中心和将来云盘算数据中心的环境。
独立于运维生产模式,即无论手工方式,还是主动化方式,大概智能化方式,都能实用。业务本身和做业务的方式要能“解耦”。
独立于运维主动化工具和技能体系,即无论是外购、自研,还是引入开源办理方案,这个模子都要有较好的实用性。
独立于数据中心的构造架构。由于差别企业的数据中心构造架构每每差别,即便是同一企业的数据中心构造架构,在差别的阶段也大概发生变革。
可以或许有效支持运维主动化软件应用架构、技能架构的计划和开辟实现;可以或许有效地支持运维功能的构造,以形成布局条理清楚的的服务体系(大概说业务功能树的构建)。
(二)OASR运维业务模子
如前文所述,在ITIL理论V3版本中,技能运维相干内容重要会合在服务运营这部分。但我发现ITIL理论更侧重于大运营流程建立,对于更具体技能层面的运维工作,虽时有提及,但也是放在大流程中举行同一形貌,并未有给出体系化总结。
此前,我曾看到国内一些专家提出了“羁系控”一体化建立办理方案,抽象度较高,也比力简便。但这里“管”的维度,其内涵界定弹性较大,完全可拓展到IT服务管理的范畴。也就是说,这个模子差不多可以涵盖数据中心的全部工作,与我们这里讨论的运维范畴并不非常匹配(固然,这里也不可否定这个模子的公道性,关键要对每个维度的内容举行具体界定)。
下面,我也给出一个本身总结归纳的OASR运维业务参考模子,具体如图2所示。
图2运维业务模子
对上述模子的阐明如下:
1)运维对象
运维对象重要包罗:
物理办法(Facilities),即机房、空调、电源等;
IT底子架构(Infrastructure),即硬件(装备)、软件、网络(线路)
应用(Applications)。“应用”这个对象的寄义,在这里有狭义和广义之分:狭义的应用,是指应用程序软件(无论自研还是外购),它与操纵体系、数据库、中心件等体系软件相对应;广义的应用,是指提供相干业务功能的应用体系,物理上是一组硬件、体系软件、应用软件和数据的聚集。一个应用体系每每由多个应用节点构成。
2)运维活动
由于前面我们已经将运维界定为专业技能维护工作,以是这里的运维活动重要是指各专业技能职员基于各类运维对象开展的技能维护操纵,进一步归纳为4类:
摆设(Deploy),其内涵界定为针对各运维对象的安装设置、升级(包罗打补丁)以及删除操纵。摆设活动的结果是产生(或删除)运维对象,也是运维对象运维生命周期的出发点或尽头;
监控(Monitor),其内涵界定为依据肯定的规则和逻辑,对各类运维对象的状态、性能、规则符合性等举行跟踪、比力和判定。监控活动的结果是产生报警变乱(AlertEvent)或及时视图(DashboardReport);
操纵(Operate),其内涵界定为针对各类运维对象的一样平常技能操纵,包罗下令实行、周期性任务实行(比如定期巡检、批量操纵等)、技能变动实行、备份与规复、高可用(或灾备)切换与回切等。技能操纵活动的结果是改变或规复运维对象的某种状态、属性或模式。
分析(Analyze),其内涵界定为对各类运维对象的状态、性能、过程、变革、数据等举行分析,也包罗依据肯定规则实行题目诊断。分析活动的结果是生产分析陈诉、趋势猜测或决定发起等。
3)运维场景
运维场景是基于各类运维对象DMOA四类活动的特定组合,进一步还大概与别的流程体系举行联动,以实现特定运维目标的任务。我们可以给出运维场景的一些具体例子。比如,
某个运维对象产生监控告警之后,体系可根据预先确定的规则实行某个应急操纵(场景1=监控+应急操纵);
有些环境下,还必要进一步主动创建一个变乱单(场景2=监控+应急操纵+创建变乱单,这里与服务管理流程举行了联动);
假如满意预先界说的肯定条件,大概还要求同时向肯定范围的职员发送短信关照(场景3=监控+应急操纵+创建变乱单+短信关照,这里进一步与办公主动化流程举行了联动)。
对于运维工作而言,场景的特定性和机动性是很广泛的。比如技能变动,每次实行的目标和内容每每不尽雷同,我们可称之为一个特定的“运维场景”。业界很多偕行也提出了场景化运维的概念,我想各人的认识是同等的。
这里再增补阐明运维场景和运维活动的关系:
运维活动重要是指服从技能规律的客观活动,比如安装一套操纵体系,具体步调和实现方法是由操纵体系产物的技能特性确定,对于差别企业而言,都是同等的;
运维场景一样平常包罗运维活动又不限于运维活动,每每必要与管理活动等举行联动和融合,后者与具体的管理环境和运维目标(需求)密切相干,差别企业(或需求)差别大概较大,乃至同一企业的差别时期也大概发生一些变革。因此,我们可以说,运维活动是运维场景的底子,但并不完全便是运维场景。
4)运维脚色
数据中心的岗位重要可分为三类:专业技能岗位、生产管理岗位和服务支持岗位。固然差别企业具体部分和岗位设置有所差别,但上述三类性子的岗位应该是包罗的。
在这里的运维业务模子中,运维脚色重要对应于专业技能岗位。对于专业技能岗位的运维脚色分别,发起基于差别的运维对象和运维活动举行组合,从而确定差别的脚色。运维对象和运维活动的粒度可得当机动,以满意差别风雅化、专业化分工的管理要求。进一步,我们就可以将运维脚色和职员岗位对应起来(即举行授权)。实际工作中,有些企业专业技能岗位分别和分工比力风雅,而有些企业大概综合一些,乃至要求“全栈工程师”。别的,数据中心每每有技能值班的安排,假如某个职员负担技能值班的工作,就大概必要举行“临时动态”授权,赋予其一些特定的运维脚色。采取如许的运维脚色界说方法和授权方式,应该可比力好地顺应各类环境。
5)运维流程
流程(process)一样平常是指一系列步调(或子流程)的有序组合。因此,无论是前面提到的运维活动和运维场景,大多数环境下在技能层面都会表现为一个流程(固然也有部分场景只必要实行某个下令或某个脚本,这就谈不上一个流程)。因此,在运维主动化软件架构体系中,流程引擎是不可或缺的一个组件。
毋庸讳言,本文提出的运维业务模子,其科学性和严谨性肯定有值得商讨之处。但总体看来,它根本可以或许满意前面提出的六项要求。在运维主动化建立的工程实践中,这个模子大概提供如下一些资助:
无论是外购产物、自研工具大概开源方案,怎样确保运维主动化技能体系的相对完备?参考上述模子,我们可以从OASR四个维度举行梳理,看看对象、活动、场景是否覆盖?有无遗漏?是否为各类脚色都提供了对应的主动化服务功能?
假如是多个专业、各部分分头建立、多个产物组合推进,怎样只管确保“业务”同等性?假如参照上述模子,各人在运维主动化功能条理、维度、粒度的分别方面就拥有“共同语言”,能分亦能合,如许才便于进一步组合,满意企业级机动多变的跨专业运维场景。
具体到运维主动化软件体系的建立,上述模子也有助于需求的分类构造和服务功能的有序扩展,确保建立过程中,技能体系和功能架构相对稳固,克制不绝地“重新再来”。
四、运维主动化功能条理
这部分要讨论的话题,不知道冠以功能条理的标题是否得当。但涉及的具体内容,简直是必要我们在运维主动化建立工作中加以研究和区分的。比如,我们常常听到面向应用的监控、面向业务的监控如许的概念,那么它们具体的寄义是什么?有什么接洽和区别?针对这个题目,这里我提出一个三个层面的运维主动功能建立思绪,供各人参考。
这三个层面为:面向资源的运维主动化功能、面向应用的运维主动化功能和面向业务的运维主动化功能。三个条理既相对独立,又有肯定的关联关系。
(1)面向资源的运维主动化功能(ROA,ResourceOrientedAutomation)。
这里的资源是指数据中心各类物理办法和软硬件资源。面向资源的运维主动化就是针对每类资源,实现DMOA各项主动化功能,并组合实现各类运维主动化场景,重要目标是解放各专业技能职员的手工劳动。这个层的运维主动化建立比力轻易推动建立,每每也是企业运维主动化开始建立的部分。面向资源的运维主动化功能建立的重要挑衅在于各专业是否均衡有序推进,要关注各专业的短板。
(2)面向应用的运维主动化功能(AOA,ApplicationOrientedAutomation)。
这里的应用重要是指各应用体系,其运维主动化功能建立重要是两个方向:
以应用为单位,归集整合该应用下各类资源运维主动化功能。
【例】某个应用某天必要实现几台应用服务器的主动化扩容,假如要端到端实现整个场景的主动化,大抵必要把如下几类资源摆设主动化功能的整合:服务器主动扩容(比如主动分配假造机)、应用程序(或镜像)主动化摆设与设置、分配IP地点和参加负载均衡的主动化。
基于该应用各资源的关联关系,进一步构建以应用为单位的综合性运维主动化功能。
【例】对于确定的某个应用,其所属的各类节点(如WEB服务器、应用服务器、数据库服务器)之间的访问关系也是确定的,在这个底子上,就可以新增出实现该应用各节点访问关系是否正常这个综合性监控指标。
面向应用的运维主动化功能建立的重要挑衅在于各资源专业团队与应用团队是否能举行有效共同,同时也要求对应用逻辑有比力深入的相识,每每必要应用开辟团队的支持。别的,假如企业中应用体系数量较多,而各应用每每差别较大(通常不如资源层面运维主动化建立的标准化程度),因此工作量和构造难度也比力大。
(3)面向业务的运维主动化功能(BOA,BusinessOrientedAutomation)。
这里的业务是指为向企业客户提供的业务服务。IT终极的目标还是为业务服务。因此,假如可以或许将运维主动化功能和业务服务关联起来,就能更好地表现IT服务的代价,这也正是各人积极寻求的目标。面向业务的运维主动化功能建立得好,不但可以为数据中心提供服务,也可以为业务部分提供服务。
由于大多数业务功能都是必要超过多个应用体系来实现的。比如在银行的柜面取款,整个买卖业务数据流将超过柜面体系、前置体系和业务处理惩罚体系等多个应用体系,因此,要实现面向业务的运维主动化功能(比如买卖业务相应时间的监控),就必要在资源监控、应用监控的底子上进一步归集、整合和构建,并把运维对象需进一步关联到业务对象,即具体的业务产物、业务组件和业务买卖业务。
面向业务的运维主动化功能建立的工程难度比力高,其最大的挑衅在于对业务流程、业务对象、业务买卖业务举行体系化梳理并将其与IT运维对象创建起映射和关联。一样平常都必要跨应用的业务架构师参加,通常也要求应用开辟团队共同举行应用改造,仅仅以数据中心运维团队来推进实现的难度很大。在实践中,一个常见的误区是以某个应用体系代替业务体系,以面向应用的运维主动化功能代替面向业务运维主动化功能。
下面的图3给出了资源、应用和业务三者之间的关系表示。对于企业运维主动化体系建立而言,这三个层面的功能可以分头推进,但最好还是能统筹构造,特别是面向业务的运维主动化功能建立,每每必要从更高层面予以构造推动。一些企业组建了相对独立的专业化部分,也是一种不错的选择。
图3资源、应用及业务的关系
五、运维主动化建立构造模式
运维主动化建立不但要求具备通用的软件工程本领,还必要纯熟把握各专业对象技能特性的专业技能职员参加。从软件工程角度来看,运维主动化软件的需求提出者、开辟实现者以及利用者都是IT职员。这种环境,是一件功德,也不肯定是功德,由于各人都“懂技能”,在肯定程度上都可以动手,偶然反而不肯定能很好形成共识,形成协力。因此,构造模式对于运维主动化建立来说也是一个紧张思量因素。根据本身的观察与总结,企业运维主动化建立的构造模式,大抵有如下四种情况:
模式一:分散模式
各专业,各部分分头建立,无同一规划与计划,百花齐放。
这种模式的上风是能充实发挥各方积极性和创造性,在较短时间内便能产生肯定生产力。
不敷是各专业各部分建立维度差别,不免出现重复建立;各专业资源投入比力分散,力气有限,每每难以整合形成企业级生产力,更多的是产生一些小型工具。别的,多样化的工具摆设到生产环境,不但有较大维护本钱,也大概给生产稳固运行带来风险。
模式二:会合模式
由某一团队牵头会合规划和推进建立,其他团队配归并负责提出需求。
这种模式的上风是有肯定同一规划和计划,有肯定规模的专业化队伍,因此可以推出企业级运维主动化体系,实现比力完备的功能。
缺点是运维主动化建立的积极性更多在于牵头团队,别的团队是被动共同,很大概导致瓶颈,或引起其他团队的共同不力,乃至不满或抱怨。另一方面,企业级运维主动化需求整合和规划也面对挑衅,不少个性化需求每每难以得到满意,用户满意度大概受到影响(我们都相识,对于运维工作而言,多样性和个性化是其紧张的特性)。
模式三:平台模式
由某一团队牵头规划计划并负责底子技能平台的建立,具体的运维功能可以由各专业,各部分自行开辟维护和发布,形成1十N的构造模式。开源产物Puppet就是采取如许的模式,其底子功能和核心框架由本身负责,但利用Puppet的各用户必须要举行二次开辟才华拥有符合自身运维场景需求的运维主动化功能,并不能做到“开箱即用”。
这种模式的上风是能发挥多个积极性,各取所长。在企业内部采取如许的模式,也能较好地分身共性和个性,从而推动形成比力完备的企业级本领。
面对的挑衅在于对技能平台的底子功能和核心框架要求很高,一旦这个底子平台出现风险和题目,对企业全局建立也会带来影响,所谓“一荣俱荣,一损俱损”,因此关键在于可否驾御这个挑衅。另一方面,这种模式也要求企业内部其他团队具备较强的运维开辟本领。
模式四:自助模式
各专业、各部分、各应用在同一架构、同一平台、同一接口下各自独立开辟运维主动化功能,发布之后连续集成,形成有机的企业级运维本领,我们也可把这种模式称作应用自带运维(BYOO),大概看作是DevOps理念的一种实践。
这种模式的上风是运维已经成为同一规范和规则下的各专业、各应用自身本领建立的一部分,并不必要数据中心主动去推动,从而形成大家皆运维的局面,运维主动化功能建立会变得更加主动而高效。
但这种模式的条件要求也很高,关键的一点就是要有企业级同一的架构规划、技能平台和开辟接口,并在企业内部形成广泛共识,同时还必要具有全员运维开辟和集成本领。
从另一角度,上述四种模式也可以当作是企业运维主动化本领建立不绝走向成熟的四个阶段,终极的目标是实现自助运维。
笔者地点企业,可以说已经履历了前面三个阶段,智能运维平台建立采取的就是第三种模式(大概说第三个阶段),同时这两年也开始在一些应用体系中探索第四种模式。
无论哪种模式,很紧张的一点就是必要连续加大运维研发资源的投入,特别是越往背面的阶段推进,对运维开辟本领和资源投入的要求越高,这也是运维队伍转型的方向。
六、几个关系的讨论
(1)运维主动化与ITIL服务管理流程的关系。
重要是联动。比如实行生产变动,为了控制风险,我们都必要按肯定流程举行审批,有无运维主动化体系,这都是肯定要求。
假如有了运维主动化体系,就可以实现两者的联动。比如,变动审批通过之后就可以直接启动变动操纵主动化功能,完成之后再将实行结果主动反馈到变动管理流程中,实现流程的关闭。
另一方面,假如具备了运维主动化功能,尚有助于简化服务管理流程。还是以变动管理为例,在手工实行变动的情况下,为了控制变动风险,我们每每要求在变动申请单中附上具体的变动实行步调,偶然间就是长达几页的文档,不但编写工作量大,而且考核的工作量也不小。假如实现了变动主动化操纵功能,大概只必要在变动申请单上阐明变动主动化功能实行的简单步调,相干环节可大大简化。
(2)运维主动化与云平台、容器等新技体系的关系。
我想从两个方面来阐明:
云平台(重要是IaaS平台和PaaS平台)建立目标之一就是实现运维主动化。参照前面的模子,重要是摆设主动化功能,其次还包罗部分操纵主动化(如弹性扩缩)和监控主动化功能。
云平台和容器等自身也是数据中心新的运维对象,比如OpenStack、Docker容器等,它们自身组件也涉及运维主动化题目,比如必要实现主动安装设置等功能。
(3)运维主动化技能体系本身的运维主动化题目
大型企业级运维主动化软件的摆设规模一样平常都不小。我们对其可用性、坚固性等也有很高要求,因此也必须思量其这套体系自身运维主动化功能的实现题目。我们把这个工作称作运维主动化体系的自服务功能建立。
七、小结
以上就企业运维主动化建立谈了一些比力琐屑的意见,文中并没有论及具体的技能实现方案。我想各人已经在各自的实践中“八仙过海,各显神通”并通过差别的渠道,有了不少分享与交换,在此也就没有特别睁开。别的,设置管理体系建立对于运维主动化建立而言也非常紧张,主动化运维和智能化运维的关系也是我们近来都比力关注的话题。此次限于篇幅,就不再睁开,留待后续有机遇再与各人探究交换。
(作者简介:侯志荣——工商银行软件开辟中心某部分总司理,天下金融五一劳动奖章得到者。其地点团队重要负责行内开放平台底子技能研究,底子办法云平台、分布式技能平台、运维主动化平台、信息安全管理平台和终端管理平台的研发工作)
(泉源:云头条)
我要评论