本文档采用自动化机器翻译技术翻译。 尽管我们力求提供准确的译文,但不对翻译内容的完整性、准确性或可靠性作出任何保证。 若出现任何内容不一致情况,请以原始 英文 版本为准,且原始英文版本为权威文本。

什么是引导式故障排除?

概述

使用SUSE Observability进行引导式故障排除是一种强大的方法,因为它在整个故障排除过程中提供有针对性且可操作的见解,从而加速问题解决。通过利用先进的算法,SUSE Observability提供故障排除提示、可视化辅助和针对您特定环境的逐步指导。这不仅简化了识别和解决问题的过程,还使站点可靠性工程师(SRE)能够更好地支持他们的开发团队。

通过利用SUSE Observability的引导式修复,工程师可以确保服务的一致性和高质量,并与其他团队成员分享他们的专业知识。此外,我们的修复指南可以轻松扩展或修改,以适应您独特的环境,使其成为维护服务可靠性和性能的宝贵工具。

预配置的监控器关注正确的内容,并在适当的时间发出警报,配备清晰的提示,以帮助工程师修复问题。这些指导帮助每位工程师立即理解需要采取什么措施来进行修复。此外,在问题解决后,这些信息将支持无责备的事后分析过程,以确定需要改进的地方。

使用引导式故障排除修复问题

为了快速修复,SUSE Observability在单一屏幕中提供清晰的问题报告和修复指南。它包含以下项目:

  1. 简要描述,向对该问题不太熟悉的人解释问题。

  2. 一些与该问题相关的事实,例如健康状态、触发时间以及原因(如果存在)。

  3. 支持指标显示问题随时间的演变情况。

  4. 通常,问题并不是孤立发生的。有时它们会导致其他问题,或者真正的问题是由不同的组件引起的。SUSE Observability跟踪所有组件之间的关系,并警告您相关问题。

  5. 修复指南本身会逐步引导您解决问题。

guided troubleshooting

在故障排除时使用固定项目

您可以通过将修复指南添加到*固定项目*,在故障排除时随时使用。点击 添加到固定项目 按钮,将当前监控器的修复指南固定。现在,即使您关闭了触发的监控器,也可以按照逐步指导进行操作。您可以从固定项目菜单访问所有固定的修复指南。完成故障排除后,只需从菜单中取消固定该指南。

k8s pinned items