集群内 Broker 版本一致性检查
巡检规则
本文中提及的 RocketMQ Copilot 术语是 AutoMQ Copilot for RocketMQ 的简称,均特指安托盟丘(杭州)科技有限公司面向 Apache RocketMQ 设计实现的消息队列智能辅助运维系统。
检测数据源
集群内 Broker 版本一致性检查的检测数据源是目标集群的运行版本信息,通过读取目标集群所有节点的版本,判断是否存在差异。
检测周期
- 每 10 分钟一次。
- 不可关闭。
异常检测逻辑
相同 Cluster 下 所有 Broker的版本进行对比,出现版本差异,则产生异常事件。
事件和风险
RocketMQ Copilot 系统巡检会对检测不通过的规则产生异常事件和风险,异常事件遵循 概述▸ 。
异常事件
- 异常事件类型:copilot:cluster:BrokerVersionConsistencyInspectionFailed
- 关于事件的详细 schema 定义,异常事件:服务端版本不一致▸ 。
异常风险
- 关联的风险类型:服务端版本不一致。
风险分析
RocketMQ 中,Broker 往往以 Cluster 的形式被组织对外提供服务。
相同 Cluster 内的 Broker 如果版本不一致,会导致功能特性无法对齐,如果某个功能特性只在部分版本生效时,收发消息可能出现不稳定的异常现象。
如果版本跨度较大可能会导致未定义的后果。
运维建议
建议 1:生产环境集群内各节点保持相同版本
生产环境建议使用统一的版本运维方式,保证集群内版本一致。