44 一般的なトラブルシューティングの原則 #
コンポーネント固有の問題に取りかかる前に、以下の一般的な原則を考慮してください。
ログの確認: ログは主要な情報源です。ほとんどの場合、エラーは説明不要で、何が失敗したかに関するヒントが含まれています。
クロックの確認: システム間にクロックの相違があると、あらゆる種類の異なるエラーが発生する可能性があります。クロックが同期していることを確認します。EIBにブート時にクロック同期を強制するように指示することができます。「OSの時刻の設定」(第3章 「Edge Image Builderを使用したスタンドアロンクラスタ」)を参照してください。
ブートの問題: システムがブート中に停止した場合、最後に表示されたメッセージをメモします。コンソール(物理的またはBMC経由)にアクセスして、ブートメッセージを確認します。
ネットワークの問題: ネットワークインタフェースの設定(
ip a
)、ルーティングテーブル(ip route
)、他のノードと外部サービスとの間のテスト接続(ping
、nc
)を確認します。ファイアウォールルールがネットワークポートをブロックしていないことを確認します。コンポーネントのステータスの確認: Kubernetesリソースの場合は、
kubectl get
とkubectl describe
を使用します。特定のKubernetesネームスペースのイベントを確認するには、kubectl get events --sort-by='.lastTimestamp' -n <namespace>
を使用します。サービスステータスの確認: systemdサービスの場合は、
systemctl status <service>
を使用します。構文の確認: ソフトウェアは設定ファイルに特定の構造と構文を想定しています。たとえばYAMLファイルの場合、
yamllint
や類似のツールを使用して、正しい構文を確認します。問題の特定: 問題を特定のコンポーネントまたはレイヤ(たとえば、ネットワーク、ストレージ、OS、Kubernetes、Metal3、Ironicなど)に絞り込みます。
ドキュメント: 詳細については、常に公式のSUSE Edgeドキュメントおよびアップストリームドキュメントを参照してください。
バージョン: SUSE Edgeは、さまざまなSUSEコンポーネントを独自に徹底的にテストしたバージョンです。SUSE Edgeリリースごとの各コンポーネントのバージョンは、SUSE Edgeサポートマトリックスで確認できます。
既知の問題: SUSE Edgeの各リリースには、リリースノートに「既知の問題」セクションがあり、今後のリリースで修正する予定だが、現在のリリースに影響する可能性のある問題に関する情報が記載されています。