【IT可视化系列之五】EMV,让IT告警实现至繁归于至简
2019-06-26 by uino 12.8K 技术分享

“道生一,一生二,二生三,三生万物”,老子用简单的几个字阐述了由简至繁的过程。从简单到复杂,这是社会发展的走向,也是万物发展的过程。而当事物发展到一定程度之后,面对日趋复杂的环境,人们会通过从各种复杂的事物中找到简单的规律,以期更好的认识世界的各种事物,从而去驾驭或改造客观世界,即由繁至简。对企业IT运维来讲,亦是如此。

伴随企业信息化进程不断深入,企业业务对IT系统的依赖性越来越强,IT已经成为很多业务流程的核心部分甚至是某些业务赖以运行的基础。为了保障业务的正常运行,绝大多数企业已经放弃传统的“一刀切”的单维监控方案,转而投向立体分散的“全栈”监控方法。系统监控、APM、用户行为监测、日志分析等多种监控工具对物理机、虚拟机、IAAS、PASS等各种IT环境监控。而微服务、容器等技术的发展,使得底层环境又更加有利于分布式部署;同时应用程序愈加快速的频繁更新,让企业IT监控的数据量以几何级的增加。企业IT运维由简至繁。

由简至繁,企业监控陷入告警风暴

然而,多样的IT监控工具相互割裂,运维工程师不断地在各种屏幕和仪表板之间疲于奔命,同时面临新的挑战:

1告警风暴频发

不断增加的监测工具与所需要处理的庞大数据相结合后,导致了告警激增。每当发生故障时,IT团队都被来自多个监控工具的警报所淹没。导致不仅难以快速检测和分类问题,而且还容易将严重问题掩盖。

2I****T运维的壁垒

运维部门常会碰到以下场景:核心业务系统不能正常访问,然而问题根源难以查找。各环节负责人员只针对当前自己所监控的平台进行排查,同时各环节数据相互割裂,不能从整体出发快速判断业务故障节点,导致系统的恢复时间较长,造成业务受损严重。

3监控数据展示缺失

当前业务对IT运维精细化要求越来越高,精细化的运维必然要求对海量运维数据的实时深入分析。然而传统运维平台当遇到事件高并发量情况时,往往会发生告警延迟甚至丢事件,性能数据查询展现响应慢或无响应等问题。

面对多样的监测工具、海量的告警信息,企业需要一种工具,充分发挥监控数据的价值,从海量告警信息中快速定位问题核心并解决故障。降低IT运维成本,让运维人员脱离救火队员的苦海。

优锘EMV,让告警由繁至简

面对上述问题,Tarsier—EMV给出解决之道。作为集中事件处理平台,能够帮助运维人员更准确的识别故障,更智能的诊断故障,更高效的协作处理故障。帮助运维人员简化海量告警,精准定位对业务造成影响的关键告警信息,实现告警信息的由繁至简。

高效的事件整合


各专业监控工具的独立部署带来了大量碎片化的数据和频繁的工具切换,降低了故障分析和处理效率。 EMV 提供了丰富的集成适配器,能够高效汇聚各专业监控工具的告警事件,并将原始告警事件数据转换成统一、标准的数据模型,形成可读性更强的全局监控视图,帮助运维团队快速了解跨专业故障情况。

面向场景的事件归集

面向场景的事件归集_副本.png

各专业监控工具的独立部署带来了大量碎片化的数据和频繁的工具切换,降低了故障分析和处理效率。EMV提供了丰富的集成适配器,能够高效汇聚各专业监控工具的告警事件,并将原始告警事件数据转换成统一、标准的数据模型,形成可读性更强的全局监控视图,帮助运维团队快速了解跨专业故障情况。

面向业务的故障管理

在当今分布式、高可用IT环境中,设备告警并不一定影响业务,因此传统面向设备的告警管理不再适用。EMV参考业界实践,提供了面向业务故障管理,将告警与业务进行关联,帮助IT团队更准确的识别故障,加速故障处理效率。

自助的事件规则设定


将过去事件处理策略的“黑盒”编制方式,改为整个运维团队都可以查看且自定义的“透明盒”。业务部门可以根据自己的业务需求定义告警策略,使得监控平台由封闭走向开放,由工具走向平台。

可视化的故障分析


传统的告警事件以表格形式呈现,运维团队难以直观感知告警事件发生的先后顺序和相互依赖关系。 EMV 提供可视化的故障诊断能力,既可通过告警时序图,帮助运维团队从告警发生的先后顺序判断故障根因,也可通过拓扑架构图,帮助运维团队从故障组件的相互依赖关系判断故障根因。

至繁归于至简,IT运维效率提速

在经过EMV将告警信息由繁至简的过程之后,企业IT运维人员在处理业务告警时,将实现:

问题诊断效率提升

通过事件归集智能地将警报分组和关联到相关事件中,通过时序图和视图模式,用户从时间和空间两个维度更容易地发现关键问题并找出根本原因。

故障修复时间加快

通过告警归集将获得事件的完整关联信息,而不仅仅是单个告警的信息。可以避免宝贵的故障处理时间的浪费,提升故障处理时效。

建立众创化的运维团队

简单易用的事件处理规则设定,降低了规则设定的使用门槛,可以让业务、运维、开发人员参与到规则制定的过程中,形成众创化运维团队。

互联网的发展仍将继续高速前行,而今后企业面对的IT运维将更加复杂化。面对不断推进的业务变革,EMV将持续在事件集中处理上发力,帮助企业实现受损业务的快速问题查找,更好的实现企业产品及服务价值。