Skip to main content

管理集群 SLO

参考概述▸ ,在了解 RocketMQ 集群 SLI 体系后,可以根据需求进行 SLO 管理。本文介绍 AutoMQ Copilot for RocketMQ 面向 Apache RocketMQ 的 SLO 管理功能。

本文中提及的 RocketMQ Copilot 术语是 AutoMQ Copilot for RocketMQ 的简称,均特指安托盟丘(杭州)科技有限公司面向 Apache RocketMQ 设计实现的消息队列智能辅助运维系统。

SLO 介绍

SLO 是对集群稳定性服务指标 SLI 的一个目标管理系统,即针对一个评估周期内 SLI 的运行状态定义预期的目标,并持续进行跟踪。如果 SLO 目标没有达成,可以通过 SLO 报警等功能及时感知并知会业务关联方。

SLO 管理

前置条件

使用 RocketMQ Copilot 管理 SLO,需要首先针对集群开启 SLI 探测,在产生了可用的 SLI 数据后才能针对这些数据设置目标。关于 SLI 开启,参考文档管理集群 SLI▸

创建 SLO

开启集群 SLI 探测后,即可针对集群。操作步骤如下:

  1. 登录 RocketMQ Copilot 控制台,点击左侧菜单栏 SLO 管理菜单。
  2. 进入 SLO 列表页面后,点击创建 SLOs。
  3. 参考下方截图,选择目标集群、SLI 模板,设置合适的评估周期和目标等信息后,创建 SLO。

建议根据目标集群上个周期实时的 SLI 数据设置合理的 SLO 目标,避免目标过高或者过低造成无法合理评估集群的风险情况。

查看 SLO 列表

针对线上集群日常的 SLO 检查,可以查看各集群 SLO 的达成情况。

操作步骤如下:

  1. 登录 RocketMQ Copilot 控制台,点击左侧菜单栏 SLO 管理菜单。
  2. 进入 SLO 列表页面后,查看 SLO 列表信息。
  3. SLO 列表页会展示各集群 SLO 的基本信息、当前周期的实时状态等信息。