更新时间:2023-06-08 11:25
运维管理( IT Operations Management)帮助企业建立快速响应并适应企业业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。
随着国内企业业务信息化的深入, IT运维部门所负责的IT设备及软件的运行维护工作变得越来越复杂, 技术难度也越来越高。传统的IT工具和流程集中在技术上,而不是业务目标上。
业务服务管理(Business Service Management)使IT能轻松满足业务的需求,转变企业的环境,使业务部门和IT部门领导者能够拥有统一的语言,通过统一的界面面对挑战,理解新变化所带来的影响。
BSM主要强调从业务的视角来看待企业的IT运维,从而最大化发挥IT对企业业务的推动作用,这就IT运维的核心思想。
IT系统的业务服务管理主要着眼点
确立以业务价值为核心,业务驱动管理的管理思想面向业务要首先在IT管理的战略层面上建立“业务驱动”的IT治理和管理思想,使得业务部门的目标和IT运维的目标一致,都是为了企业整体战略目标的实现,把对业务的支撑能力和管理实效,作为评价IT系统效用和IT部门工作的首要指标。只有这样,才能在全企业范围内建立“技术服务于业务发展”的意识和文化,是真正实现IT与业务融合,共同为企业的战略目标服务。
建立关键业务服务模型,今天的业务部门对应用程序的依赖性比过去更强了。应用程序软件可以实现关键业务流程的自动化 —自动化既包括付款、资金转账、下订单和订单履行。由于应用程序故障或性能问题可能导致严重的业务影响,因此业务部门迫切需要 IT 部门在发生问题时提供更高的应用程序服务级别和更快的问题解决方案。所以,必须结合企业战略和业务运营情况,辨识企业业务服务,特别是关键业务应用。为这些核心业务系统服务,建立和企业未来发展愿景、IT架构、管理模式等相适应的业务服务模型,能够清晰地描述业务与IT之间的关联关系和IT服务的关键目标。
出于对IT资源专业化、精细化管理的要求,企业部署了诸多的监控管理工具,如网络监控、系统监控、数据库监控工具等。一般来说,这些监控工具往往来自于不同的厂商,彼此之间缺乏信息共享的手段。而一个具体的业务是由网络、主机、应用本身所组成,管理信息无法共享,这就造成了当一个故障出现时,无法通过系统直接自动分析并定位故障点,加大了IT故障的分析难度,降低了解决问题的效率。业务服务管理可以有效整合企业已经构建的众多IT监控系统,将分散的IT管理信息集中到一个单点的管理平台中,从而可以快速进行故障定位。
随着企业业务的快速发展,IT环境越来越复杂,IT组件越来越多,同时各组件之间的关联关系也更加纷乱和复杂。业务服务管理能够提供有效的根源问题定位能力,它着眼于企业的核心业务系统,通过集中与业务相关的IT信息,根据业务逻辑和IT组件之间的关联关系进行建模,企业可以在业务模型中的任何一点进行快速的根源问题分析和定位,大大提高了解决问题的速度和准确度。
当我们发现IT故障时,我们不仅应该关注故障本身,更应该考虑该故障对业务系统的影响。通过建立业务服务影响拓扑,可以快速的了解企业的关键性业务及业务故障时的影响范围,通过了解企业具体的业务环境,优先处理关键故障点。
随着统一的管理信息系统覆盖整个组织,固化需求的传统管理信息系统运维模式,必然会对整个组织的业务造成冲击,新一代应用系统(AS2.0)的运维管理必须具备以下基本条件:
管理信息系统应该是利用各类通用构件、组件、和工具等搭建构造形成的,它们是具有独立性的、松耦合、可拆卸、易维护的产品集合,从而使得支持整个组织运行的一体化管理信息系统能够持续地支持应用的拓展和完善,能够实现自身能力和效率的可持续发展和提升,特别是其过程对组织运行的影响最小,给用户体验带来持续的提升。
运维的目的是确保对业务需求和运行环境变化的,及时有效地支持,所以直接取决于应用系统对变化响应的能力、效率和可管理性。传统应用系统通过直接修改代码实现运维的模式已不适应,且不可管理,而是让用户能够通过相应的工具,对相关构件和组件的配置、定义、修改,以实现对业务和环境的运维,并且实现对变化过程的记录、跟踪和分析管理。
整个组织的应用需求可能会因为地域差异而不同,可能会因为发展进程的覆盖面而不同,可能会因为环境配置情况而不同。应对这些“不同”,以及支持这些“不同”的能力,是与传统管理信息系统运维的根本区别,传统是通过应用系统因为需要固化需求,只能通过不同版本去适应“不同”,而新一代应用系统(AS2.0)则是在统一运行环境中,通过工具的配置和定义实现对“不同”的支持和管理。
传统的运维只是通过编码实现“变化”和“不同”,而新一代应用系统(AS2.0)的运维还要拓展到对“变化”和“不同”的管理。引入数据空间的概念,记录下对业务和环境运维“变化”、“不同”、“状态”、“标准”和“历史”等要素的变更记录和发展痕迹,从而实现管理信息系统全生命周期、全功能覆盖、全面质量管理的运维管理能力。如同在数学研究中引入“导数”,拓展了对数据的变化研究一样,“数据空间”的引入,拓展了对管理信息系统变化的管理能力。
运维管理不再只是IT部门的职责,而是整个组织都需参与的过程。对于管理者要能够将管理思路和决策需求加以表述;对于业务骨干要能够自行对管理者所表述的思路和需求,进行对管理信息系统的加载和维护,以实现对它们的操作支持和用户体验;对于IT部门更侧重于运行环境的保障、应用系统构成部分的能力和性能的监控、分析、管控与反馈等;开发商则更关注公共构件、组件、工具产品的能力、性能、体验的完善和提升。
运维管理一旦纳入整个组织的管理体系中,运维管理制度不再是IT部门的专有制度,而是对整个组织业务发展、管理完善、能力拓展等过程和行为的管控和规范,使得它们发展可持续、完善易有序、拓展能稳定。