適用項目 SUSE Linux Enterprise High Availability Extension 15 SP4

17 保守タスクの実行 #

クラスタノードで保守タスクを実行するには、そのノードで実行中のリソースを停止し、それらを移動するか、あるいはそのノードをシャットダウンするか再起動する必要がある場合があります。また、クラスタからリソースの制御を一時的に引き継ぐか、またはリソースを実行中のままにしてクラスタサービスを停止することも必要な場合があります。

この章では、負の影響を及ぼすことなくクラスタノードを手動で切断する方法について説明します。また、クラスタスタックが保守タスクを実行するために提供するさまざまなオプションの概要についても説明します。

17.1 クラスタノードを切断する意味 #

SUSE Linux Enterprise Server High Availability Extension 15 SP2では、クラスタサービスの開始および停止方法が変更されました。SUSEでは、crmシェルの使用を推奨しています。systemctlを使用した古いコマンドはまだ使用できますが、熟練ユーザにのみ推奨されます。詳細については、SUSEのブログ記事「https://www.suse.com/c/suse-high-availability-cluster-services-how-to-stop-start-or-view-the-status/」を参照してください。

ステータスを開始、停止、または表示するための推奨される方法は次のとおりです。

crm cluster start: 1つのノードでクラスタサービスを開始します
crm cluster stop: 1つのノードでクラスタサービスを停止します
crm cluster restart: 1つのノードでクラスタサービスを再起動します
crm cluster status: 1つのノードでクラスタスタックのステータスを表示します

先に示したコマンドは、ユーザroot、または必要な権限を持つユーザとして実行します。

クラスタノードをシャットダウンまたは再起動する(またはノード上でPacemakerサービスを停止する)場合、次のプロセスがトリガされます。

ノード上で実行されているリソースは停止されるか、ノードから移動します。
リソースの停止が失敗するか、タイムアウトする場合、STONITHメカニズムはノードをフェンシングし、シャットダウンします。

手順 17.1: クラスタノードの手動による再起動 #

ノードをシャットダウンまたは再起動する前に、順序だった方法でノードのサービスをオフにしたい場合は、次の操作を実行します。

再起動またはシャットダウンするノードで、rootまたは同等な権限でログインします。
ノードをstandbyモードにします。
```
root # crm -w node standby
```
このようにすると、サービスはPacemakerクラスタサービスのシャットダウンタイムアウトによって制限されることなく、ノードをオフに移行できます。
以下を使用してクラスタの状態を確認します。
```
root # crm status
```
standbyモード状態の各ノードが示されます。
```
[...]
Node bob: standby
[...]
```
そのノードでクラスタサービスを停止します。
```
root # crm cluster stop
```
ノードを再起動します。

ノードが再びクラスタに参加しているかどうかを確認するには:

rootまたは同等の権限でノードにログインします。
クラスタサービスが開始されているかどうかを確認します。
```
root # crm cluster status
```
開始されていない場合は、開始します。
```
root # crm cluster start
```
以下を使用してクラスタの状態を確認します。
```
root # crm status
```
ノードが再びオンラインになっていることが示されます。

17.2 保守タスクのためのさまざまなオプション #

Pacemakerはシステム保守を実行するためのさまざまなオプションを提供しています。

クラスタを保守モードにする

グローバルクラスタプロパティmaintenance-modeにより、すべてのリソースを瞬時に保守状態にします。クラスタはモニタリングを停止し、ステータスが追跡されなくなります。Pacemakerによるリソース管理のみが無効になっていることに注意してください。CorosyncとSBDはまだ機能しています。クラスタリソースに関連するタスクには、保守モードを使用します。ストレージやネットワークなどのインフラストラクチャに関連するタスクで最も安全な方法は、クラスタサービスを完全に停止することです。クラスタ全体のクラスタサービスを停止するを参照してください。

クラスタ全体のクラスタサービスを停止する

すべてのノードでクラスタサービスを一度に停止すると、各ノードを1つずつシャットダウンした場合に発生するリソースの大量マイグレーションを回避しながら、クラスタをシャットダウンできます。マイグレート先のノードがないため、すべてのリソースが停止します。

ノードを保守モードにする

このオプションにより、特定のノードで実行されているすべてのリソースを瞬時に保守状態にすることができます。クラスタはモニタリングを停止し、ステータスが追跡されなくなります。

ノードをスタンバイモードにする

スタンバイモードのノードはリソースを実行できなくなります。ノード上で実行されているすべてのリソースは移動するか停止されます(他のノードがリソースを実行する資格がない場合)。また、ノード上のすべての監視操作は停止されます(role="Stopped"に設定された操作を除く)。

別のノードで実行されているサービスを提供し続けながら、クラスタ内の1台のノードを停止する必要がある場合は、このオプションを使用できます。

リソースを保守モードにする

リソースに対してこのモードが有効な場合、リソースの監視操作はトリガされません。

このリソースで管理されるサービスに手動で介入する必要があり、その間にリソースの監視操作をクラスタに実行させない場合は、このオプションを使用します。

リソースを非管理対象モードにする

is-managedメタ属性により、リソースを一時的にクラスタスタックによって管理されている状態から「解放」することができます。これは、このリソースによって管理されるサービスに手動で介入できることを意味します(たとえば、コンポーネントを調整するなど)。ただし、クラスタはリソースの「監視」と障害の報告を継続して行います。

クラスタによるリソースの「監視」を停止したい場合は、代わりにリソース単位の保守モードを使用します(リソースを保守モードにするを参照してください)。

17.3 保守作業の準備と終了 #

警告: データ損失の危険

テストまたは保守作業を実行する必要がある場合は、以下の一般的な手順に従います。

従わない場合、リソースが順序だった方法で起動できない、クラスタノード間でCIBが同期されない、データ損失などの、望ましくない負の影響が及ぼされるリスクがあります。

開始する前に、17.2項で概説されている、自分の状況に適したオプションを選択します。
Hawk2またはcrmshを使用してこのオプションを適用します。
保守タスクまたはテストを実行します。
終了したら、リソース、ノードまたはクラスタを「通常」の操作状態に戻します。

17.4 クラスタを保守モードにする #

警告: 保守モードはPacemakerのみを無効にする

クラスタを保守モードにすると、Pacemakerによるリソース管理のみが無効になります。CorosyncとSBDはまだ機能しています。保守タスクによっては、これがフェンス操作につながる可能性があります。

クラスタリソースに関連するタスクには、保守モードを使用します。ストレージやネットワークなどのインフラストラクチャに関連するタスクで最も安全な方法は、クラスタサービスを完全に停止することです。17.5項「クラスタ全体のクラスタサービスを停止する」を参照してください。

クラスタをcrmシェル上で保守モードにするには、次のコマンドを使用します。

root # crm configure property maintenance-mode=true

保守作業が完了した後で、クラスタを通常のモードに戻すには、次のコマンドを使用します。

root # crm configure property maintenance-mode=false

手順 17.2: クラスタをHawk2を使用して保守モードにする #

7.2項「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、クラスタ設定を選択します。
CRMの環境設定グループで、空のドロップダウンボックスからmaintenance-mode属性を選択し、プラスアイコンをクリックして追加します。
maintenance-mode=trueを設定するには、maintenance-modeの隣のチェックボックスをオンにして、変更を確認します。
クラスタ全体の保守作業が完了したら、maintenance-mode属性の隣のチェックボックスをオフにします。
この時点から、High Availability Extensionはクラスタ管理をもう一度引き継ぎます。

17.5 クラスタ全体のクラスタサービスを停止する #

すべてのノードで一度にクラスタサービスを停止するには、次のコマンドを使用します。

root # crm cluster stop --all

保守作業が完了した後でクラスタサービスを再開するには、次のコマンドを使用します。

root # crm cluster start --all

警告: 正常なシャットダウンは保証されない

--allオプションだけでは、アプリケーションレベルでリソース停止障害によってトリガーされる可能性のある予期しないフェンシングのため、クラスタの正常なシャットダウンは保証されません。アプリケーションが重要な場合は、クラスタ全体のクラスタサービスを停止する前に、アプリケーションを停止することを検討してください。

17.6 ノードを保守モードにする #

crmシェル上でノードを保守モードにするには、次のコマンドを使用します。

root # crm node maintenance NODENAME

保守作業が完了した後で、ノードを通常のモードに戻すには、次のコマンドを使用します。

root # crm node ready NODENAME

手順 17.3: ノードをHawk2を使用して保守モードにする #

7.2項「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、クラスタステータスを選択します。
個々のノードのビューのいずれかで、ノードの隣のレンチアイコンをクリックして、保守を選択します。
保守タスクが終了したら、ノードの横にあるレンチアイコンをクリックして、準備完了を選択します。

17.7 ノードをスタンバイモードにする #

ノードをcrmシェル上でスタンバイモードにするには、次のコマンドを使用します。

root # crm node standby NODENAME

保守作業が完了した後でノードをオンライン状態に戻すには、次のコマンドを使用します。

root # crm node online NODENAME

手順 17.4: ノードをHawk2を使用してスタンバイモードにする #

7.2項「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、クラスタステータスを選択します。
個々のノードのビューのいずれかで、ノードの隣のレンチアイコンをクリックして、スタンバイを選択します。
ノードの保守タスクを完了します。
スタンバイモードを無効化するには、そのノードの隣のレンチアイコンをクリックして準備完了を選択します。

17.8 リソースを保守モードにする #

crmシェル上でリソースを保守モードにするには、次のコマンドを使用します。

root # crm resource maintenance RESOURCE_ID true

保守作業が完了した後で、リソースを通常のモードに戻すには次のコマンドを使用します。

root # crm resource maintenance RESOURCE_ID false

手順 17.5: リソースをHawk2を使用して保守モードにする #

7.2項「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、リソースを選択します。
保守モードまたは非管理対象モードにするリソースを選択し、そのリソースの隣のレンチアイコンをクリックして、リソースの編集を選択します。
メタ属性カテゴリが開きます。
空のドロップダウンリストからmaintenance属性を選択し、プラスアイコンをクリックして追加します。
maintenanceの隣のチェックボックスをオンにして、maintenance属性をyesに設定します。
変更内容を確認します。
該当するリソースの保守作業が完了したら、そのリソースのmaintenance属性の隣のチェックボックスをオフにします。
リソースは、この時点から再びHigh Availability Extensionソフトウェアによって管理されます。

17.9 リソースを非管理対象モードにする #

crmシェル上でリソースを非管理対象モードにするには、次のコマンドを使用します。

root # crm resource unmanage RESOURCE_ID

保守作業が完了した後で再び管理対象モードにするには、次のコマンドを使用します。

root # crm resource manage RESOURCE_ID

手順 17.6: リソースをHawk2を使用して非管理対象モードにする #

7.2項「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左ナビゲーションバーから、状態を選択し、リソースリストに移動します。
操作列で、変更したいリソースの横にある下矢印アイコンをクリックして編集を選択します。
リソース設定画面が開きます。
メタ属性の下で、空のドロップダウンボックスからis-managedエントリを選択します。
その値をNoに設定し、適用をクリックします。
保守タスクが終了した後で、is-managedをYesに設定し(デフォルト値です)、変更を適用します。
リソースは、この時点から再びHigh Availability Extensionソフトウェアによって管理されます。

17.10 保守モード中のクラスタノードの再起動 #

注記: 意味

クラスタまたはノードが保守モードの場合、クラスタリソースを任意に停止したり再起動したりできます。High Availability Extensionはこれらを再起動しようとしません。ノード上のPacemakerサービスを停止する場合、(Pacemakerの管理対象クラスタリソースとして最初に起動された)すべてのデーモンとプロセスの実行は継続されます。

クラスタまたはノードが保守モードのときに、ノード上でPacemakerサービスを起動しようとする場合、Pacemakerはリソースごとに1つのワンショット監視操作(「probe」)を開始し、そのノードで現在どのリソースが実行されているかを評価します。ただし、リソースのステータスを決定する以外の操作は行いません。

クラスタまたはノードが保守モードのときにノードを切断する場合は、次のようにします。

再起動またはシャットダウンするノードで、rootまたは同等な権限でログインします。
DLMリソース(またはDLMに依存するその他のリソース)が存在するときは、Pacemakerサービスを停止する前にそれらのリソースを明示的に停止してください。
```
crm(live)resource# stop RESOURCE_ID
```
その理由は、Pacemakerを停止すると、DLMが依存するメンバーシップとメッセージングサービスを持つCorosyncサービスも停止するからです。Corosyncが停止した場合、DLMリソースではスプリットブレインシナリオが発生したと見なされ、フェンシング操作がトリガされます。
そのノードでPacemakerサービスを停止します。
```
root # crm cluster stop
```
ノードをシャットダウンするか再起動します。