この文書は自動機械翻訳技術を使用して翻訳されています。 正確な翻訳を提供するように努めておりますが、翻訳された内容の完全性、正確性、信頼性については一切保証いたしません。 相違がある場合は、元の英語版 英語 が優先され、正式なテキストとなります。

スケールレプリカ再構築

v1.11.0以降、SUSE Storageは*スケールレプリカ再構築*をサポートし、再構築中のレプリカが複数の正常なレプリカから同時にスナップショットデータを取得して再構築性能を向上させることができます。

概要

従来、SUSE Storageは失敗したレプリカを単一の正常なレプリカからすべてのスナップショットデータを取得することで再構築します。スケールレプリカ再構築を使用すると、再構築中のレプリカは複数のソースレプリカから同時にスナップショットデータを取得でき、再構築時間を短縮する可能性があります。

この機能は、ボリュームに散在する小さなデータチャンクやスナップショット内の穴が含まれている場合に特に有益であり、利用可能なネットワーク帯域幅と並列処理のより良い活用を可能にします。

機能のしくみ

スケールレプリカ再構築が有効になっている場合:

  1. 複数の正常なレプリカがスナップショットデータソースとしてsyncサーバーを起動します。

  2. 再構築中のレプリカは、異なるソースレプリカの異なるスナップショットから同時にスナップショットデータを取得します。

  3. 同時に使用するソースレプリカの数は、`replica-rebuild-concurrent-sync-limit`設定によって制御されます。

設定

グローバル設定:replica-rebuild-concurrent-sync-limit

この設定は、単一の再構築中のレプリカに対して同時にスナップショットデータをsyncできる正常なレプリカの最大数を制御します。

  • デフォルト1(スケールレプリカ再構築無効)

  • 範囲:`1`から`5`まで

`1`に設定されている場合、1回に1つのソースレプリカのみが再構築中のレプリカにsyncします(従来の動作)。`1`より大きい値はスケールレプリカ再構築を有効にし、複数のソースレプリカ(設定された制限まで)が再構築中のレプリカに同時にスナップショットデータをsyncできるようにします。

詳細については、設定リファレンスを参照してください。

ボリュームごとのオーバーライド

個々のボリュームに対してグローバル`replica-rebuild-concurrent-sync-limit`設定をオーバーライドできます:

  • SUSE Storage UIを使用:ボリュームを編集し、`Rebuild Concurrent Sync Limit`フィールドを変更します。

  • kubectlを使用する:`kubectl -n longhorn-system edit volume [volume-name]`を実行し、`spec.rebuildConcurrentSyncLimit`フィールドを修正します。

ボリュームごとの設定が`0`に設定されている場合、ボリュームはグローバル設定を使用します。そうでない場合、ボリュームごとの設定が優先されます。

パフォーマンスについて

スケールレプリカ再構築が役立つ場合

スケールレプリカ再構築は、以下のシナリオで大幅なパフォーマンス向上を提供します:

  • 散在する小さなデータチャンクを持つボリューム:スナップショットが間欠的な小さなデータチャンク(例えば、4Kブロック)と穴で構成されている場合、スケールレプリカ再構築は複数のソースレプリカを利用することで再構築時間を大幅に短縮できます。

  • ネットワーク帯域幅の利用可能性:従来の再構築中にネットワーク帯域幅が十分に活用されていない場合、より多くのソースレプリカを追加することで利用可能な帯域幅をより良く活用できます。

ベストプラクティス

  1. デフォルトから始める:`1`のデフォルト値(スケールレプリカ再構築無効)は保守的であり、ほとんどの環境に適しています。

  2. 増加前にテストする:制限を増加させる前に、非本番環境でテストして特定のワークロードに対するリソースの影響を理解してください。

  3. ワークロードを考慮する:

    • 散在する小さなデータチャンクを持つボリュームの場合:スケールレプリカ再構築を有効にすることを検討してください(`2`以上に設定)。

    • 連続した大きなデータチャンクを持つボリュームの場合:パフォーマンスの利点は最小限かもしれません。

  4. リソースの使用状況を監視する:スケールレプリカ再構築が有効になっている場合、ソースおよび宛先レプリカをホストしているノードのCPU使用率を監視し、十分なリソースが利用可能であることを確認してください。

  5. パフォーマンスとリソースのバランス:より高い同時sync制限は再構築速度を向上させる可能性がありますが、より多くのCPUリソースを消費します。クラスターのリソースの可用性と再構築の緊急性に基づいてトレードオフを考慮してください。

制限

  • 同時に使用できるソースレプリカの最大数は`5`に制限されています。

  • スケールレプリカ再構築は、予期しない高いリソース消費を避けるためにデフォルトで無効になっています。

  • 実際のパフォーマンスの改善は、ディスクI/Oパフォーマンス、ネットワーク帯域幅、データ分布パターン、および利用可能なCPUリソースなどの要因に依存します。

参考資料

関連する再構築機能に関する詳細情報については、 Longhorn #11331を参照してください。