您的一站式告警管理平台!

通过查阅此文档,您可以知道如何将您的告警接入到OneAlert中来,统一展现、统一通知, 我们是如何对告警进行智能压缩和关联以帮助您快速定位问题根源的, 如何灵活使用分派、通知、排班策略加强协作、提高告警运维效率, 以及如何通过告警分析来获悉团队工作效率、发现系统潜在风险并加以预防的。

告警汇集

OneAlert在一个平台中接收所有监控系统的告警,让运维人员集中处理IT事件,避免多平台切换,提升运维效率。 通过OneAlert提供的告警采集Agent,仅需5-10分钟,就可以将Nagios、Zabbix等主流监控平台的告警自动整合进来,而无需其它配置。 OneAlert更提供强大的REST API以及方便的Email集成方式,可将任何支撑系统快速接入到一站式的OneAlert告警平台。

查看如何接入各种监控平台

告警压缩

OneAlert首先使用时间序列规则,将大量重复的告警事件压缩为一条有真正意义的告警。而后通过属性关联、 机器学习等算法把相关的告警合并起来,为运维人员提供分析、甄选之后的最重要的告警。借助OneAlert告警控制台, 用户可以查看合并之后的告警,相关的子告警以及他们的时间序列关系,从而更快地定位告警和问题根源。 实际使用中,OneAlert可提供平均高达98%的告警压缩率。

详细了解告警是如何压缩的

精准推送

OneAlert提供灵活的告警分派策略,可以将不同应用、级别、内容的告警分配给不同的运维人员。 运维团队可通过排班和自动化升级机制,组织起一线、二线、三线的阶梯式团队,建立起 7 x 24 小时的应急响应机制。 在合适的时间,把告警推送给最合适的人员。

查看如何设置分派规则

通知必达

QQ、微信、邮件、短信、电话,一个都不能少,多个渠道接受事件提醒,总有一款适合您。 OneAlert确保每个事件都被准确推送,就算告警被忽略,通过预先设定的升级策略, 告警也会自动流转至下一个团队成员,让您的团队不漏掉任何一个告警。

查看如何设置通知规则

协作沟通

OneAlert允许您创建灵活的排班规则,把您的运维团队更有效地管理起来。比如您可以安排一线运维团队负责7x24小时应急值守, 快速接收告警进行初步预判,二线研发团队负责告警升级的分析和根源定位。 OneAlert集成多种沟通工具,运维人员可以一键转发告警信息。多线有效协作的同时,也能充分合理安排休息,让告警处理更高效。

查看如何设置排班规则

分析优化

OneAlert 不仅提供事件处理生命周期管理,还提供事件解决后的分析回顾功能。通过告警排行分析,您可以知道哪些应用、 哪些告警是频发的,以针对性优化解决。通过MTTA/MTTR事件处理时间分析,您可以了解大到团队、小到个人的工作效率、解决能力。 通过对告警压缩的分析,可以发现产生告警风暴的原因,优化告警规则,提高处理效率。

详细了解分析优化