标签:node_exporter

  • 监控与告警香港站群云主机稳定性保障的关键指标与工具

    1. 概述:目标与部署边界目标:保证香港站群云主机稳定性与可用性;小分段:a) 监控边界:主机、网络、服务、应用层;b) 可观测性:指标、日志、追踪;c) 部署原则:集中采集、分区告警(按机房/业务) 2. 关键指标清单(必须监控)小分段:a) 主机层:CPU 使用率、LoadAverage、内存/Swap、磁盘已用与 I/O、inode 使
    2026年6月3日