13 ソフトウェアRAIDのトラブルシューティング #
/proc/mdstat
ファイルをチェックして、RAIDパーティションが破損しているかどうかを調べます。ディスクに障害が発生した場合、破損したハードディスクを、同じようにパーティション化されている新しいディスクに交換します。次に、システムを再起動して、mdadm /dev/mdX --add
/dev/sdX
コマンドを入力します。X
「」を特定のデバイス識別子に置き換えてください。これにより、ハードディスクがRAIDシステムに自動的に統合され、そのRAIDシステムが完全に再構築されます(RAID 0を除くすべてのRAIDレベル)。
再構築中もすべてのデータにアクセスできますが、RAIDが完全に再構築されるまでは、パフォーマンスに問題が発生する場合があります。
13.1 ディスク障害復旧後の回復 #
RAIDアレイに含まれているディスクが障害を起こす理由はいくつかあります。最も一般的な理由を一覧にしました。
ディスクメディアに問題が発生
ディスクドライブコントローラに障害発生
ディスクへの接続に障害発生
ディスクメディアまたはディスクコントローラの障害の場合、デバイスを交換または修理する必要があります。RAID内でホットスペアが設定されていない場合、手動による介入作業が必要です。
最後の接続障害の場合、接続の修復後(自動的に修復する場合もあります)、mdadm
コマンドによって、障害が発生したデバイスは、自動的に再度追加されます。
md
/mdadm
は、ディスク障害の原因を正確に判断できないため、デバイスが正常であると明示的に指示されるまで、ディスクエラーを深刻なエラーと判断し、障害が発生しているデバイスを異常と見なします。
内部RAIDアレイを持つストレージデバイスなど、環境によっては、デバイス障害の原因の多くを接続の問題が占める場合があります。このような場合、mdadm
に対して、デバイスが表示されたら、そのデバイスを--re-add
によって自動的に再度追加しても問題ないと指示することができます。これには、以下の行を/etc/mdadm.conf
に追加します。
POLICY action=re-add
再表示されたらそのデバイスを自動的に再度追加できるのは、udev
ルールによって、mdadm -I
DISK_DEVICE_NAME
が、自動的に表示されたあらゆるデバイスで実行されるように設定されている場合(デフォルトの動作)、およびwrite-intentビットマップが設定されている場合(デフォルトの設定)に限られることに注意してください。
このポリシーを特定のデバイスにのみ適用し、他には適用しない場合、path=
オプションを/etc/mdadm.conf
内のPOLICY
行に追加して、選択したデバイスにのみデフォルトでないアクションを限定することができます。ワイルドカードを使用して、デバイスのグループを指定することができます。詳細については、man 5 mdadm.conf
を参照してください。