IT运营分析的增长价值

责任编辑:cres

作者:David Ishmael

2018-06-19 10:01:51

来源:企业网D1Net

原创

IT运营分析(ITOA)如今已经成为可以帮助技术管理人员提高效率的一种具有价值的实践。它使用数据科学原理来执行从底层基础设施和应用程序收集的数据的模式发现、相关性、异常检测和根本原因分析。

IT运营分析(ITOA)如今已经成为可以帮助技术管理人员提高效率的一种具有价值的实践。它使用数据科学原理来执行从底层基础设施和应用程序收集的数据的模式发现、相关性、异常检测和根本原因分析。
 
更简单地说,ITOA提供了一种检索、分析和报告数据的方法,以改善IT运营的结果。如今,没有一个产品或供应商能够成为一种万能的解决方案。相反。ITOA是一项总体活动,它使IT团队成为其组织的洞察引擎,可能导致更高的预算和更大的影响力。
 
ITOA依靠机器学习来了解行为、发现模式、为事件关联和异常检测提供具有监督和无监督的学习,并执行根本原因分析。这种方法创建了一种预测可能对IT服务性能产生负面影响的最终状态的方法。
 
例如,Trace3公司已经发展了ITOA的概念,以应用于所有IT运营。这个举措归功于“操作系统”,它将IT操作分成六个主要区域或组件层,如下图所示。
 
ITOA系统的组成
 
以下是每个区域的描述:
 
·监测生态系统。这个堆栈的基础层是整个ITOA框架的基础。监控生态系统收集有关IT系统实时发生的事件的遥测信息。正在进行的活动涉及记录和传输来自数据中心和网络设备的读数,使得基础层更加嘈杂,大量的数据不断渗透。
 
·自动化系统。这种自动化编排片段允许团队在各种联网系统中实施更改。可以部署DevOps自动化工具(例如Puppet或Chef)来识别特定事件。当某个事件发生时,自动化系统可以触发正确的响应,并通过自我修复来纠正任何问题行为。
 
·参与系统。这个事件管理层可以被认为是“管理者的管理者”,因为它管理来自整个组织的事件。参与系统可以作为硬件故障和软件崩溃等事件的窗口,然后向更高层报告。
 
·数据管理。这一部分与参与系统一起收集和存储数据的时间较长。通过汇总这些更大的数据集,管理人员可以进行取证分析,梳理出有意义的模式并识别性能异常情况。将数据管理视为追踪IT运营背景历史的机构记忆。所以,如果一台路由器在早上8点宕机关闭,那么它会被参与系统标记出来。但是,如果同一台路由器每天早上8点定期关闭,那么数据管理部分会发出哪些相关组件或问题可能导致故障模式的信号。
 
·记录系统。这部分是为运营团队生成客户服务级别记录的票务平台。记录系统可以为任何故障创建票证,还可以显示网络配置和软件设置,以丰富参与系统。另一方面向最终客户提供有关其服务发生情况的反馈,以及有关停机状态的更新。
 
·可视化。可视化层提供了提取所有基础组件的能力,以报告诸如停电、消费模型、总成本和月度比较等重要指标。可视化层通常是一个可通过Web浏览器访问的仪表板,数据是基于每个最终用户的角色呈现的。例如,公用事业公司的技术人员可能会收到关于全系统性能和停机的更新信息,而消费者会看到有关家庭电能使用情况的指标。
 
综上所述,IT运营分析需要人员、流程和技术的编排互动。在很多情况下,最薄弱的环节是人员。为了取得成功,他们必须具备适当的技术技能。但同样重要的是,人们需要认识到舒适度和变化是相互排斥的。在不再工作后,不能继续以相同的方式做同样的事情。拒绝改变的IT管理人员将会变得落后过时,并被他们的更加灵活的对手超越。
 
所有ITOA流程必须在IT服务管理水平、测量类型和总体责任方面进行明确定义。在很多方面,该技术成为最简单的部分。虽然成千上万的硬件和软件产品可供使用,但可以根据客户的IT环境和业务目标轻松选择合适的工具。技术处于所有ITOA计划的中心,被各种人员和流程所包围。
 
随着越来越多的可量化指标围绕IT运营,ITOA的好处变得越来越清晰。
 
将ITOA应用到客户环境中,可以让IT管理人员提前解决即将出现的问题,甚至可以预测何时会出现此类问题,从而大大提高了IT管理人员的工作质量,而无需等待最终用户再次报告出现问题。通过这种方式,IT团队可以加快发现中断故障的平均时间以及恢复故障系统的平均时间,从而提高客户满意度,并提高其组织的竞争优势。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号