本文档采用自动化机器翻译技术翻译。 尽管我们力求提供准确的译文,但不对翻译内容的完整性、准确性或可靠性作出任何保证。 若出现任何内容不一致情况,请以原始 英文 版本为准,且原始英文版本为权威文本。

指标

K3s 提供用于监控集群健康和性能的指标。

大多数指标由各个组件提供。有关更多信息,请参阅以下特定组件的文档:

其他组件可能提供额外的指标。请查阅上游项目文档以获取未列出的任何组件的信息。

Supervisor 指标

当 K3s 使用 supervisor-metrics: true 启动时,指标由 K3s 进程公开,并可以通过每个节点的 /metrics 端点在端口 6443 访问:

kubectl get --server https://NODENAME:6443 --raw /metrics

K3s Supervisor 进程公开以下指标:

如果启用了 K3s 嵌入式注册表,K3s Supervisor 进程还会公开以下指标:

K3s 在主 K3s 进程中运行所有 Kubernetes 组件。由于 Kubernetes 每个进程使用一个单独的 Prometheus 指标注册表,因此所有组件的指标都可以通过所有暴露的指标端点获得。如果您抓取所有单独的指标端点,您可能会发现收集了重复的指标。只需抓取一个 K3s 指标端点即可获取所有嵌入式 Kubernetes 组件的指标。

K3s 集群管理指标

k3s_certificate_expiration_seconds

证书的剩余有效期(以秒为单位),按证书主题和用途标记。

  • 类型:仪表

  • 标签:subjectusage

k3s_loadbalancer_server_connections

当前连接到负载均衡服务器的数量,按负载均衡器名称和服务器地址标记。

  • 类型:仪表

  • 标签:nameserver

k3s_loadbalancer_server_health

负载均衡后端服务器的当前健康状态,按负载均衡器名称和服务器地址标记。

状态为枚举值:0=无效,1=失败,2=待机,3=未检查,4=恢复中,5=健康,6=首选,7=活动。

  • 类型:仪表

  • 标签:nameserver

k3s_loadbalancer_dial_duration_seconds

与后端服务器建立连接所需的时间(以秒为单位),按负载均衡器名称和成功/失败状态标记。

  • 类型:柱状图

  • 标签:namestatus

k3s_etcd_snapshot_save_duration_seconds

完成 etcd 快照处理所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status

k3s_etcd_snapshot_save_local_duration_seconds

保存本地快照文件所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status

k3s_etcd_snapshot_save_s3_duration_seconds

将快照文件上传到 S3 所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status

k3s_etcd_snapshot_reconcile_duration_seconds

同步 etcd 快照列表所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status

k3s_etcd_snapshot_reconcile_local_duration_seconds

列出本地快照文件所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status

k3s_etcd_snapshot_reconcile_s3_duration_seconds

列出 S3 快照文件所需的总时间(以秒为单位),按成功/失败状态标记。

  • 类型:直方图

  • 标签:status