查看目录

集群总览

集群总览页面提供单个 Kubernetes 集群的健康状况与资源使用概览,包含统计卡片、资源图表和近期事件,帮助运维人员快速评估集群状态。

集群总览

集群总览页面提供单个 Kubernetes 集群的健康状况与资源使用概览,包含统计卡片、资源图表和近期事件,帮助运维人员快速评估集群状态。

集群总览页面

顶部统计卡片

页面顶部以四列卡片展示核心指标:

  • 集群健康 — 显示集群当前状态(运行中、创建中、失败、未知),以及 Ready 和 NotReady 节点数量。
  • 总 Pod 数 — 显示集群中 Pod 总数及其中处于 Running 状态的数量。
  • 总节点数 — 显示集群节点总数,以及控制平面节点与工作节点的分布。
  • 自动缩放 — 显示集群是否启用了 Autoscaling。启用时展示当前工作节点数与最大节点数的缩放区间;未启用时显示"当前为手动扩容"。

顶部统计卡片

资源利用率

以进度条形式展示 CPU(核心)、内存(GiB)和磁盘(GiB)的当前使用量与集群总容量。每项资源显示具体数值(如 2.50 / 8.00 核心)和对应的使用百分比进度条。

资源利用率

网络统计

展示集群网络流量与异常情况,包含以下指标:

  • 总流量 — 入站与出站流量总和(自动格式化为 B/KB/MB/GB/TB)。
  • 网络入流量(Rx) — 接收字节总量。
  • 网络出流量(Tx) — 发送字节总量。
  • 异常总数 — 所有错误与丢包计数的总和。

异常明细以四列网格展示,分别标注颜色:

  • 接收错误(Rx Errors) — 红色
  • 发送错误(Tx Errors) — 红色
  • 接收丢包(Rx Dropped) — 橙色
  • 发送丢包(Tx Dropped) — 橙色

错误或丢包计数持续增长时,建议检查集群网络配置和宿主机网络状态。

网络统计

节点负载均衡

以分组条形图展示每个节点的 CPU 与内存使用百分比。每个节点对应两组柱状条,分别表示 CPU 使用率和内存使用率,便于快速识别资源压力较大的节点。

节点负载均衡

Pod 状态分布

以环形图展示各状态 Pod 的分布:

  • Running — 运行中的 Pod
  • Pending — 等待调度的 Pod
  • Failed — 失败的 Pod
  • Unknown — 状态未知的 Pod

环形图中心显示 Pod 总数,底部显示健康比例(Running 状态 Pod 占总数的百分比)。

Pending 状态的 Pod 可能由资源不足或调度限制引起,建议检查节点资源和工作负载配置。Failed 状态的 Pod 需查看具体事件和日志定位原因。

Pod 状态分布

近期事件

列出集群中最近发生的事件,以颜色圆点区分等级:Warning(黄色)和 Normal(蓝色)。每条事件包含消息内容、时间戳、原因和来源组件。列表最多展示 8 条事件。

无事件时显示"暂无事件"的空状态提示。如需查看历史事件,请使用 kubectl 等命令行工具。

近期事件

注意事项

  • 资源利用率(CPU、内存、磁盘)和节点负载图表依赖 metrics-server。若集群未安装 metrics-server,相关指标显示为 N/A,节点负载图表将显示"指标数据不可用"提示。
  • 新创建的集群可能需要几分钟才能采集到完整的指标数据。
  • 页面数据会自动刷新:集群处于 Creating 或 Deleting 状态时每 5 秒刷新一次,正常运行时每 30 秒刷新一次。

相关文档

本文档更新于 2026-04-25 09:00