跳至內容跳至頁面導覽:上一頁 [access key p]/下一頁 [access key n]
documentation.suse.com / SUSE Linux Enterprise Server 文件 / 儲存管理指南 / 軟體 RAID / 軟體 RAID 疑難排解
適用範圍 SUSE Linux Enterprise Server 15 SP4

13 軟體 RAID 疑難排解

檢查 /proc/mdstat 檔案以確定 RAID 分割區是否已損毀。磁碟出現故障時,請關閉 Linux 系統並使用以相同方式磁碟分割的新硬碟來更換損壞的硬碟。然後重新啟動系統,並輸入 mdadm /dev/mdX --add /dev/sdX 指令。使用特定的裝置識別碼取代 X。這會自動將硬碟整合到 RAID 系統中,並將其完全重構 (適用於 RAID 0 以外的所有 RAID 層級)。

雖然您可以在重建期間存取所有資料,但是在完全重建 RAID 之前,可能會遇到一些效能問題。

13.1 修復故障磁碟之後進行還原

RAID 陣列中的磁碟可能會出於多種原因而發生故障。下面列出了最常見的原因:

  • 磁碟媒體出現問題。

  • 磁碟機控制器發生故障。

  • 與磁碟的連接斷開。

在發生磁碟媒體或控制器故障時,需要更換或維修裝置。如果未在 RAID 中設定熱備用,則需要手動干預。

對於後一種情況,可以在修復連接 (可能會自動修復) 之後,使用 mdadm 指令自動重新加入發生故障的裝置。

md/mdadm 不能可靠地判斷磁碟故障的原因,它會臆測發生了嚴重的磁碟錯誤,並一直將任何有故障的裝置視為有故障,直到明確獲知該裝置可靠。

在某些情況下 (例如,儲存裝置包含內部 RAID 陣列),連接問題往往是裝置發生故障的原因。在這種情況下,您可以告知 mdadm,在裝置出現後,可以放心地使用 --re-add 自動重新加入該裝置。為此,您可以將以下行新增到 /etc/mdadm.conf 中:

POLICY action=re-add

請注意,僅當 udev 規則導致 mdadm -I DISK_DEVICE_NAME 在自發性出現的任何裝置上執行 (預設行為),並且已設定 write-intent 點陣圖 (預設已設定) 時,才會在裝置重新出現後自動重新加入該裝置。

如果您希望此規則只會套用至某些裝置而不會套用至其他一些裝置,可以將 path= 選項新增到 /etc/mdadm.conf 中的 POLICY 行,以限制為只對所選裝置執行非預設動作。可以使用萬用字元來識別裝置群組。如需詳細資訊,請參閱 man 5 mdadm.conf