この文書は自動機械翻訳技術を使用して翻訳されています。 正確な翻訳を提供するように努めておりますが、翻訳された内容の完全性、正確性、信頼性については一切保証いたしません。 相違がある場合は、元の英語版 英語 が優先され、正式なテキストとなります。

これは未公開の文書です SUSE® Storage 1.12 (Dev).

スナップショットデータの整合性チェック

Longhornはスナップショットディスクファイルのハッシュ化および定期的な整合性チェックを行うことができます。

概要

Longhornシステムはボリュームスナップショットをサポートし、スナップショットディスクファイルをローカルディスクに保存します。ただし、以前のスナップショットのチェックサムが不足しているため、スナップショットのデータ整合性をチェックすることは不可能です。その結果、基盤ストレージのビットロットなどによりデータが破損した場合、破損を検出し、レプリカを修復する方法がありません。この機能を適用した後、Longhornはスナップショットディスクファイルのハッシュ化と定期的な整合性チェックが可能です。1つのレプリカ内のスナップショットディスクファイルが破損した場合、Longhornは自動的に再構築処理を開始して修復を行います。

設定

グローバル設定

  • snapshot-data-integrity

    この設定により、ユーザーはスナップショットのハッシュ化とデータ整合性チェックを有効または無効にできます。使用できるオプションは次のとおりです:

    • 無効:スナップショットディスクファイルのハッシュ化とデータ整合性チェックを無効にします。

    • 有効:スナップショットディスクファイルの定期的なハッシュ化とデータ整合性チェックを有効にします。ビットロットやその他の問題によってスナップショットディスクファイルに発生するファイルシステム非対応の破損を検出するために、Longhornシステムは定期的にファイルをハッシュ化し、破損したものを見つけます。したがって、定期的なチェック中にシステムのパフォーマンスに影響が出ます。

    • 高速チェック:スナップショットディスクファイルのハッシュ化と高速データ整合性チェックを有効にします。Longhornシステムは、スナップショットディスクファイルがハッシュ化されていないか、変更時刻が変わった場合にのみハッシュ化します。このモードでは、ファイルシステム非対応の破損を検出することはできませんが、システムパフォーマンスへの影響を最小限に抑えることができます。

  • snapshot-data-integrity-immediate-check-after-snapshot-creation

    スナップショットディスクファイルのハッシュ化はシステムのパフォーマンスに影響を与えます。スナップショット作成後の影響を最小限に抑えるために、スナップショットディスクファイルの即時ハッシュ化およびチェックを無効にすることができます。

  • snapshot-data-integrity-cronjob

    unix-cron文字列形式を使用して定義されたスケジュールは、Longhornがスナップショットディスクファイルのデータ整合性をチェックするタイミングを指定します。

    スナップショットディスクファイルのハッシュ化はシステムのパフォーマンスに影響を与えます。データ整合性チェックは、ピーク時間外に実行することを推奨し、チェックの頻度を減らすことが望ましいです。

ボリュームごとの設定

Longhornは、Volume.Spec.SnapshotDataIntegrity`を設定することによってボリュームごとの設定もサポートしています。デフォルトでは値は`ignored`であり、データ整合性チェックはグローバル設定`snapshot-data-integrity`によって決定されます。`Volume.Spec.SnapshotDataIntegrity`は`ignoreddisabledenabled、および`fast-check`をサポートしています。各ボリュームは、そのデータ整合性チェック設定をカスタマイズできます。

パフォーマンスへの影響

データの破損を検出するためには、スナップショットディスクファイルのチェックサムを計算する必要があります。計算にはストレージと計算リソースが消費されます。したがって、ストレージパフォーマンスは悪影響を受けます。影響を明確に理解するために、ディスクファイルのチェックサムを計算する際のストレージパフォーマンスをベンチマークしました。読み取りIOPS、帯域幅、レイテンシは悪影響を受けます。

  • 使用環境

    • ホスト:AWS EC2 c5d.2xlarge

    • CPU:Intel® Xeon® Platinum 8124M CPU @ 3.00GHz

    • メモリ:16GB

    • ネットワーク:最大10Gbps

    • Kubernetes: v1.24.4+rke2r1

  • 結果

    • ディスク:200 GiB NVMe SSDをインスタンスストアとして使用

      • 100 GiB のスナップショット(完全なランダムデータ)

        イメージ
    • ディスク:200 GiB スループット最適化 HDD (st1)

      • 30 GiB のスナップショット(完全なランダムデータ)

        イメージ

推奨

この機能は、ボリュームのスナップショットディスクファイルにおけるデータの破損を検出するのに役立ちます。ただし、チェックサムの計算はストレージパフォーマンスに悪影響を及ぼします。影響を軽減するための推奨事項は以下の通りです。

  • チェックサム計算とスナップショットディスクファイルの確認は、グローバル設定 snapshot-data-integrity-cronjob によってオフピーク時間にスケジュールできます。

  • グローバル設定 snapshot-data-integrity-immediate-check-after-snapshot-creation を無効にしてください。