17 保守タスクの実行 #
クラスタノードで保守タスクを実行するには、そのノードで実行中のリソースを停止し、それらを移動するか、あるいはそのノードをシャットダウンするか再起動する必要がある場合があります。また、クラスタからリソースの制御を一時的に引き継ぐか、またはリソースを実行中のままにしてクラスタサービスを停止することも必要な場合があります。
この章では、負の影響を及ぼすことなくクラスタノードを手動で切断する方法について説明します。また、クラスタスタックが保守タスクを実行するために提供するさまざまなオプションの概要についても説明します。
17.1 クラスタノードを切断する意味 #
SUSE Linux Enterprise Server High Availability Extension 15 SP2では、クラスタサービスの開始および停止方法が変更されました。SUSEでは、crmシェルの使用を推奨しています。systemctl
を使用した古いコマンドはまだ使用できますが、熟練ユーザにのみ推奨されます。詳細については、SUSEのブログ記事「https://www.suse.com/c/suse-high-availability-cluster-services-how-to-stop-start-or-view-the-status/」を参照してください。
ステータスを開始、停止、または表示するための推奨される方法は次のとおりです。
crm cluster start
1つのノードでクラスタサービスを開始します
crm cluster stop
1つのノードでクラスタサービスを停止します
crm cluster restart
1つのノードでクラスタサービスを再起動します
crm cluster status
1つのノードでクラスタスタックのステータスを表示します
先に示したコマンドは、ユーザroot
、または必要な権限を持つユーザとして実行します。
クラスタノードをシャットダウンまたは再起動する(またはノード上でPacemakerサービスを停止する)場合、次のプロセスがトリガされます。
ノード上で実行されているリソースは停止されるか、ノードから移動します。
リソースの停止が失敗するか、タイムアウトする場合、STONITHメカニズムはノードをフェンシングし、シャットダウンします。
ノードをシャットダウンまたは再起動する前に、順序だった方法でノードのサービスをオフにしたい場合は、次の操作を実行します。
再起動またはシャットダウンするノードで、
root
または同等な権限でログインします。ノードを
standby
モードにします。root #
crm -w node standbyこのようにすると、サービスはPacemakerクラスタサービスのシャットダウンタイムアウトによって制限されることなく、ノードをオフに移行できます。
以下を使用してクラスタの状態を確認します。
root #
crm statusstandby
モード状態の各ノードが示されます。[...] Node bob: standby [...]
そのノードでクラスタサービスを停止します。
root #
crm cluster stopノードを再起動します。
ノードが再びクラスタに参加しているかどうかを確認するには:
root
または同等の権限でノードにログインします。クラスタサービスが開始されているかどうかを確認します。
root #
crm cluster status開始されていない場合は、開始します。
root #
crm cluster start以下を使用してクラスタの状態を確認します。
root #
crm statusノードが再びオンラインになっていることが示されます。
17.2 保守タスクのためのさまざまなオプション #
Pacemakerはシステム保守を実行するためのさまざまなオプションを提供しています。
- クラスタを保守モードにする
グローバルクラスタプロパティ
maintenance-mode
により、すべてのリソースを瞬時に保守状態にします。クラスタはモニタリングを停止し、ステータスが追跡されなくなります。Pacemakerによるリソース管理のみが無効になっていることに注意してください。CorosyncとSBDはまだ機能しています。クラスタリソースに関連するタスクには、保守モードを使用します。ストレージやネットワークなどのインフラストラクチャに関連するタスクで最も安全な方法は、クラスタサービスを完全に停止することです。クラスタ全体のクラスタサービスを停止するを参照してください。- クラスタ全体のクラスタサービスを停止する
すべてのノードでクラスタサービスを一度に停止すると、各ノードを1つずつシャットダウンした場合に発生するリソースの大量マイグレーションを回避しながら、クラスタをシャットダウンできます。マイグレート先のノードがないため、すべてのリソースが停止します。
- ノードを保守モードにする
このオプションにより、特定のノードで実行されているすべてのリソースを瞬時に保守状態にすることができます。クラスタはモニタリングを停止し、ステータスが追跡されなくなります。
- ノードをスタンバイモードにする
スタンバイモードのノードはリソースを実行できなくなります。ノード上で実行されているすべてのリソースは移動するか停止されます(他のノードがリソースを実行する資格がない場合)。また、ノード上のすべての監視操作は停止されます(
role="Stopped"
に設定された操作を除く)。別のノードで実行されているサービスを提供し続けながら、クラスタ内の1台のノードを停止する必要がある場合は、このオプションを使用できます。
- リソースを保守モードにする
リソースに対してこのモードが有効な場合、リソースの監視操作はトリガされません。
このリソースで管理されるサービスに手動で介入する必要があり、その間にリソースの監視操作をクラスタに実行させない場合は、このオプションを使用します。
- リソースを非管理対象モードにする
is-managed
メタ属性により、リソースを一時的にクラスタスタックによって管理されている状態から「解放」することができます。これは、このリソースによって管理されるサービスに手動で介入できることを意味します(たとえば、コンポーネントを調整するなど)。ただし、クラスタはリソースの「監視」と障害の報告を継続して行います。クラスタによるリソースの「監視」を停止したい場合は、代わりにリソース単位の保守モードを使用します(リソースを保守モードにするを参照してください)。
17.3 保守作業の準備と終了 #
テストまたは保守作業を実行する必要がある場合は、以下の一般的な手順に従います。
従わない場合、リソースが順序だった方法で起動できない、クラスタノード間でCIBが同期されない、データ損失などの、望ましくない負の影響が及ぼされるリスクがあります。
開始する前に、17.2項で概説されている、自分の状況に適したオプションを選択します。
Hawk2またはcrmshを使用してこのオプションを適用します。
保守タスクまたはテストを実行します。
終了したら、リソース、ノードまたはクラスタを「通常」の操作状態に戻します。
17.4 クラスタを保守モードにする #
クラスタを保守モードにすると、Pacemakerによるリソース管理のみが無効になります。CorosyncとSBDはまだ機能しています。保守タスクによっては、これがフェンス操作につながる可能性があります。
クラスタリソースに関連するタスクには、保守モードを使用します。ストレージやネットワークなどのインフラストラクチャに関連するタスクで最も安全な方法は、クラスタサービスを完全に停止することです。17.5項 「クラスタ全体のクラスタサービスを停止する」を参照してください。
クラスタをcrmシェル上で保守モードにするには、次のコマンドを使用します。
root #
crm
configure property maintenance-mode=true
保守作業が完了した後で、クラスタを通常のモードに戻すには、次のコマンドを使用します。
root #
crm
configure property maintenance-mode=false
7.2項 「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、
を選択します。maintenance-mode=true
を設定するには、maintenance-mode
の隣のチェックボックスをオンにして、変更を確認します。クラスタ全体の保守作業が完了したら、
maintenance-mode
属性の隣のチェックボックスをオフにします。この時点から、High Availability Extensionはクラスタ管理をもう一度引き継ぎます。
17.5 クラスタ全体のクラスタサービスを停止する #
すべてのノードで一度にクラスタサービスを停止するには、次のコマンドを使用します。
root #
crm
cluster stop --all
保守作業が完了した後でクラスタサービスを再開するには、次のコマンドを使用します。
root #
crm
cluster start --all
--all
オプションだけでは、アプリケーションレベルでリソース停止障害によってトリガーされる可能性のある予期しないフェンシングのため、クラスタの正常なシャットダウンは保証されません。アプリケーションが重要な場合は、クラスタ全体のクラスタサービスを停止する前に、アプリケーションを停止することを検討してください。
17.6 ノードを保守モードにする #
crmシェル上でノードを保守モードにするには、次のコマンドを使用します。
root #
crm
node maintenance NODENAME
保守作業が完了した後で、ノードを通常のモードに戻すには、次のコマンドを使用します。
root #
crm
node ready NODENAME
7.2項 「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、
を選択します。個々のノードのビューのいずれかで、ノードの隣のレンチアイコンをクリックして、
を選択します。保守タスクが終了したら、ノードの横にあるレンチアイコンをクリックして、
を選択します。
17.7 ノードをスタンバイモードにする #
ノードをcrmシェル上でスタンバイモードにするには、次のコマンドを使用します。
root #
crm node standby NODENAME
保守作業が完了した後でノードをオンライン状態に戻すには、次のコマンドを使用します。
root #
crm node online NODENAME
7.2項 「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、
を選択します。個々のノードのビューのいずれかで、ノードの隣のレンチアイコンをクリックして、
を選択します。ノードの保守タスクを完了します。
スタンバイモードを無効化するには、そのノードの隣のレンチアイコンをクリックして
を選択します。
17.8 リソースを保守モードにする #
crmシェル上でリソースを保守モードにするには、次のコマンドを使用します。
root #
crm
resource maintenance RESOURCE_ID true
保守作業が完了した後で、リソースを通常のモードに戻すには次のコマンドを使用します。
root #
crm
resource maintenance RESOURCE_ID false
7.2項 「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左のナビゲーションバーで、
を選択します。保守モードまたは非管理対象モードにするリソースを選択し、そのリソースの隣のレンチアイコンをクリックして、
を選択します。空のドロップダウンリストから
属性を選択し、プラスアイコンをクリックして追加します。maintenance
の隣のチェックボックスをオンにして、maintenance属性をyes
に設定します。変更内容を確認します。
該当するリソースの保守作業が完了したら、そのリソースの
maintenance
属性の隣のチェックボックスをオフにします。リソースは、この時点から再びHigh Availability Extensionソフトウェアによって管理されます。
17.9 リソースを非管理対象モードにする #
crmシェル上でリソースを非管理対象モードにするには、次のコマンドを使用します。
root #
crm
resource unmanage RESOURCE_ID
保守作業が完了した後で再び管理対象モードにするには、次のコマンドを使用します。
root #
crm
resource manage RESOURCE_ID
7.2項 「ログイン」で説明したように、Webブラウザを起動してクラスタにログインします。
左ナビゲーションバーから、
を選択し、 リストに移動します。リソース設定画面が開きます。
その値を
No
に設定し、 をクリックします。保守タスクが終了した後で、
をYes
に設定し(デフォルト値です)、変更を適用します。リソースは、この時点から再びHigh Availability Extensionソフトウェアによって管理されます。
17.10 保守モード中のクラスタノードの再起動 #
クラスタまたはノードが保守モードの場合、クラスタリソースを任意に停止したり再起動したりできます。High Availability Extensionはこれらを再起動しようとしません。ノード上のPacemakerサービスを停止する場合、(Pacemakerの管理対象クラスタリソースとして最初に起動された)すべてのデーモンとプロセスの実行は継続されます。
クラスタまたはノードが保守モードのときに、ノード上でPacemakerサービスを起動しようとする場合、Pacemakerはリソースごとに1つのワンショット監視操作(「probe」)を開始し、そのノードで現在どのリソースが実行されているかを評価します。ただし、リソースのステータスを決定する以外の操作は行いません。
クラスタまたはノードが保守モード
のときにノードを切断する場合は、次のようにします。
再起動またはシャットダウンするノードで、
root
または同等な権限でログインします。DLMリソース(またはDLMに依存するその他のリソース)が存在するときは、Pacemakerサービスを停止する前にそれらのリソースを明示的に停止してください。
crm(live)resource#
stop RESOURCE_IDその理由は、Pacemakerを停止すると、DLMが依存するメンバーシップとメッセージングサービスを持つCorosyncサービスも停止するからです。Corosyncが停止した場合、DLMリソースではスプリットブレインシナリオが発生したと見なされ、フェンシング操作がトリガされます。
そのノードでPacemakerサービスを停止します。
root #
crm cluster stopノードをシャットダウンするか再起動します。