Skip to main content

集群组管理

集群组是 AutoMQ Copilot for RocketMQ 管理多个 RocketMQ 集群的顶层资源模型。本文介绍集群组的概念、属性和相关的操作说明。

本文中提及的 RocketMQ Copilot 术语是 AutoMQ Copilot for RocketMQ 的简称,均特指安托盟丘(杭州)科技有限公司面向 Apache RocketMQ 设计实现的消息队列智能辅助运维系统。

定义

集群组是 RocketMQ Copilot 表达 Apache RocketMQ 一组 Nameserver 以及注册到这组 Nameserver 下的所有Broker 集群的业务范围。

其中包括如下约定:

  • 一组 NameServer 指的是 Apache RocketMQ 中相同配置、用于相同业务的 NameServer 集群。
  • 一个集群组对应的一个 NameServer 集群。
  • 一个集群组下所有部署 NameServer 和 Broker 组件的机器节点采用相同的操作系统、主机用户名密码等配置。

集群组主要作用是用来实现不同 NameServer 及下属的 Broker 集群的隔离,不同的集群组拥有不同的运行配置和状态。

内部属性

集群组内部主要描述如下重要属性。

属性:集群组别名

Apache RocketMQ 针对 NameServer 集群没有别名概念,不便业务区分。RocketMQ Copilot 针对集群组概念设计别名用于区分上述的 NameServer 和 Broker 集群。

集群组别名由用户设置,建议设置业务线和应用范围内有区分度的名称。

属性:NameServer 列表

NameServer 列表是集群组配置中用于管理实际的 NameServer 服务节点配置信息。由一组地址和端口列表组成,以分号隔开。常见的 NameServer 列表样例如下:

  • 正确示例一:支持单个地址,例如 192.168.1.1:9876
  • 正确示例二:支持多个 NameServer,例如 192.168.1.1:9876;192.168.1.2:9876
  • 正确示例三:支持域名地址,例如 host1.xxx.xxx:9876;host2.xxx.xxx:9876
  • 错误示例一:缺少端口信息,例如 192.168.1.1
  • 错误示例二:分隔符错误,例如 192.168.1.1:9876,192.168.1.2:9876

注意:当实际 NameServer 集群发生运维变更时,需要及时更新正确的最新地址列表,包括如下情况:

新增 NameServer 节点

删除 NameServer 节点

替换 NameServer 节点

属性:主机访问秘钥

主机访问秘钥是集群组用于远程访问 NameServer、Broker 组件本地日志的访问凭证。当前 RocketMQ Copilot 支持使用 SSH 用户名密码进行远程访问认证。

访问秘钥主要包括:

  • SSH 用户名
  • SSH 密码

RocketMQ Copilot 约定每个集群组下所有 NameServer、Broker 节点使用相同的访问秘钥进行认证。如果当前实际情况不满足,即部分节点的用户名密码不一致。需要联系 AutoMQ 服务方寻求帮助。

如果集群组下 NameServer、Broker 更换用户名密码,需要及时更新集群组主机访问秘钥配置。

管理集群组

前置条件

针对集群组进行接入、变更、取消等操作,需要满足如下条件:

  • 当前安装已经处于激活状态,且关联的订阅计划尚未过期。
  • 集群组的数量尚未达到当前安装关联的订阅计划权益约束。
  • 当前 RocketMQ Copilot 安装环境能够连通到 NameServer 集群。

接入集群组

在如下场景下需要接入新的集群组:

  • 全新 RocketMQ Copilot 安装激活完成,需要接入集群组以完成初始化配置。
  • 业务侧新部署了一套 NameServer 集群需要接入管理。

接入集群组的操作流程和注意事项如下:

  1. 登录RocketMQ Copilot,前往左上角侧菜单栏,点击查看集群组列表。
  2. 录入集群组的必要信息,注意确保所有信息无误,点击接入。
  3. 接入集群组需要完成若干校验和检查,接入完成后会自动查询当前 NameServer 集群下所有关联的 Broker 集群,提醒用户可以快捷添加集群或者直接返回集群组列表。

变更集群组

在如下场景下需要变更集群组配置:

  • 已有集群组 NameServer 列表发生变化,需要更新。
  • 已有集群组主机访问秘钥发生变化,需要更新。

变更集群组的操作流程和注意事项如下:

  1. 登录RocketMQ Copilot,前往左上角菜单栏,点击集群组列表下拉菜单。
  2. 找到目标集群组列表,查看详情,并编辑更新。

取消接入集群组

如果当前集群组对应的 NameServer 集群运维下线或者不再需要使用 RocketMQ Copilot,可以取消接入集群组。

取消接入集群的前提是,当前集群组下没有关联任何集群,如果集群非空,则需要先取消接入集群再操作。

取消接入集群组的操作如下:

  1. 登录RocketMQ Copilot,前往左上角菜单栏,点击集群组下拉列表。
  2. 找到目标集群组点击取消接入,进行二次确认后即可完成操作。