CloudWatch 监控&报警
Metrics 是系统可观测非常重要的分析数据。AutoMQ 支持通过 CloudWatch 透出原生 Apache Kafka 的多项 Metrics 数据。
Metrics 采集、应用原理
AutoMQ 内部组件支持收集 Kafka Server 各项 Metrics 数据,但当前商业版本暂不提供内置的 Metrics 仪表盘和监控告警能力,用户可基于 AutoMQ 提供的集成功能实现自定义 Metrics 监控和分析,整体的架构参考下图:
参考上图,使用 Metrics 集成功能管理集成▸ 将 Metrics 数据转发到CloudWatch 服务。
CloudWatch Metrics 定义
上述集成中透出的相关 Metrics 的详细定义参考如下:
指标名称 | 指标说明 |
---|---|
kafka_controller_active_count |
|
kafka_network_io_bytes_in_sec |
|
kafka_network_io_bytes_out_sec |
|
kafka_server_connection_count |
|
kafka_partition_total_count |
|
kafka_topic_count |
|
kafka_conume_offset_lag |
|
kafka_message_count_in_sec |
|
kafka_partition_offline_count |
|
kafka_log_size |
|