基本的な3ノード高可用性クラスタのインストール

適用項目 SUSE Linux Enterprise High Availability 16.0

HA用語集 #

CIB (クラスタ情報ベース) #

クラスタの設定とステータス(クラスタオプション、ノード、リソース、制約、相互の関係性)の全体的なXML表現。CIBマネージャ(pacemaker-based)はクラスタ全体でCIBの同期を保ち、CIBの変更要求を処理します。

cluster #

高可用性クラスタは、データ、アプリケーション、およびサービスの可用性を最大にすることを第一に設計されたサーバ(物理または仮想)のグループです。アプリケーションの負荷を分散してより高速な結果を実現する高性能クラスタと混同しないでください。

Cluster Logical Volume Manager (Cluster LVM) #

Cluster LVMという用語は、LVMがクラスタ環境で使用されていることを示しています。このため、共有ストレージ上のLVMメタデータを保護するには、設定調整が必要になります。

Corosync #

Corosyncは、クラスタのメッセージング、メンバーシップ、クォーラムに関する信頼性の高い情報を提供します。具体的には、グループ通信システムであるCorosyncクラスタエンジンがその処理を担っています。

CRM (クラスタリソースマネージャ) #

高可用性クラスタにおける外部とのやり取りをすべて統括する管理エンティティ。SUSE Linux Enterprise High AvailabilityはPacemakerをCRMとして使用します。多数のコンポーネント(CRM自身のノードとその他のノードのローカルエグゼキュータ、非ローカルCRM、管理コマンド、フェンシング機能、メンバーシップ層)と対話します。

crmsh (CRMシェル) #

コマンドラインユーティリティcrmshは、クラスタ、ノード、およびリソースを管理します。

Csync2 #

クラスタ内のすべてのノード全体に設定ファイルを複製するための同期ツール。

DC (指定コーディネータ) #

pacemaker-controldデーモンは、あらゆるアクションを統括するクラスタコントローラです。このデーモンは各クラスタノード上にインスタンスを持つが、DCとして動作するように選出されるのは1つのインスタンスのみです。DCは、クラスタサービスの開始時、または現在のDCに障害が発生した場合、またはクラスタから離脱した場合に選出されます。DCは、ノードのフェンシングやリソースの移動など、クラスタ全体の変更を実行する必要があるかどうかを決定します。

DLM (分散ロックマネージャ) #

DLMはクラスタ内の共有リソースへのアクセスを調整します。たとえば、クラスタ化されたファイルシステムのファイルロックを管理することで、パフォーマンスと可用性を向上させます。

DRBD #

DRBD®は、高可用性クラスタを構築するためのブロックデバイスです。プライマリデバイス上のデータをセカンダリデバイスに、データのすべてのコピーが同一に保たれるような方法で複製します。

failover #

リソースまたはノードが1台のマシンで失敗し、影響を受けるリソースが別のノードに移動するときに発生します。

GFS2 #

Global File System 2 (GFS2)は、Linuxコンピュータクラスタ用の共有ディスクファイルシステムです。GFS2により、すべてのノードが同じ共有ブロックストレージに直接同時にアクセスすることができます。GFS2には、非接続運用モードがなく、クライアント役割やサーバ役割もありません。GFS2クラスタのすべてのノードがピアとして機能します。GFS2は、クラスタノードを32台までサポートします。クラスタでGFS2を使用する場合は、ハードウェアが共有ストレージへのアクセスを許可し、ロックマネージャがストレージへのアクセスを制御する必要があります。

Hawk (HA Web Konsole) #

高可用性クラスタをLinuxまたは非Linuxマシンから監視および管理するためのユーザフレンドリなWebベースのインタフェース。Hawkには、グラフィカルなWebブラウザを使用して、クラスタノードに接続できる任意のマシンからアクセスできます。

knet (kronosnet) #

ネットワークリンクの冗長性、セキュリティ、耐障害性、高速フェールオーバーをサポートするネットワーク抽象化レイヤ。SUSE Linux Enterprise High Availability 16では、knetがCorosync通信チャネルのデフォルトのトランスポートプロトコルです。

location #

クラスタ全体のコンテキストでは、場所はノードの物理的な位置を表します(たとえば、すべてのノードが同じデータセンター内の場所に配置されている場合があります)。場所の制約のコンテキストでは、場所は、リソースを実行できるまたは実行できないノードを表します。

Pacemaker #

Pacemakerは、SUSE Linux Enterprise High AvailabilityのCRM (クラスタリソースマネージャ) であり、クラスタで発生するイベントに反応する「頭脳」です。イベントとは、クラスタにおけるノードの加入と離脱、リソースでの障害発生、保守などの計画的なアクティビティのことを指します。pacemakerdデーモンは、その他のあらゆる関連デーモンの起動と監視を行います。

QDevice #

QDeviceとQNetd はクォーラムの決定に参加します。corosync-qdeviceデーモンは、各クラスタノード上で実行され、QNetdと通信して設定可能な投票数を提供することにより、クラスタが標準のクォーラムルールで許可されているよりも多くのノード障害に耐えられるようにします。

QNetd #

QNetdはクラスタの外部で動作するアービトレータです。corosync-qnetdデーモンは各ノードのcorosync-qdeviceデーモンに投票権を提供し、クォーラムの決定に参加できるようにします。

RA (リソースエージェント) #

プロキシとして機能してリソースを管理する(リソースの開始、停止、監視などを行う)スクリプト。SUSE Linux Enterprise High Availabilityはさまざまなリソースエージェントをサポートします。

ReaR (Relaxおよび回復) #

災害復旧イメージを作成するための管理ツールセット。

SBD (STONITHブロックデバイス) #

SBDは共有ブロックストレージを介したメッセージの交換を通じて、ノードフェンシングメカニズムを提供します。また、ディスクレスモードで使用することもできます。どちらの場合も、動作異常のノードが本当に停止したかどうかを確認するために、各ノードではハードウェアまたはソフトウェアのwatchdogが必要です。

SPOF (シングルポイント障害) #

失敗するとクラスタ全体の障害をトリガしてしまう、クラスタのコンポーネント。

STONITH #

shoot the other node in the headの略です。動作異常のノードをシャットダウンすることでクラスタに問題を発生させないようにするフェンシングメカニズムを指しています。Pacemakerクラスタでは、STONITHはフェンシングサブシステムpacemaker-fencedによって管理されます。

watchdog #

SBD (STONITHブロックデバイス)では、動作異常のノードが本当に停止したかどうかを確認するために、各ノードでウォッチドッグが必要です。SBDはウォッチドッグに定期的にサービスパルスを書き込むことでウォッチドッグに「フィード」します。SBDがウォッチドッグへのフィードを停止すると、ハードウェアでシステムが強制的に再起動されます。この機能は、SBDプロセス自体の障害(I/Oエラーでスタックするなど)に対する保護を提供します。

アクティブ/アクティブ、アクティブ/パッシブ #

リソースがノード上でどのように実行されるか。アクティブ/パッシブとは、リソースはアクティブノードでのみ実行されるが、アクティブノードに障害が発生した場合はパッシブノードに移動できることを意味します。アクティブ/アクティブとは、すべてのノードが一度にアクティブになり、リソースはクラスタ内のどのノードでも実行(および移動)できることを意味します。

アービトレータ #

アービトレータは、クラスタの計算に追加のインスタンスを提供するためにクラスタの外部で実行されるマシンです。たとえば、QNetd は、QDeviceがクォーラムの決定に参加できるように投票権を提供します。

クォーラム #

クラスタパーティションは、ノード(「投票」)の過半数を保有する場合、クォーラムを持つ(定足数に達している)と定義されます。クォーラムはただ1つのパーティションで識別されます。これは、複数の切断されたパーティションまたはノード(「スプリットブレイン」)が処理を続行してデータおよびサービスが破損されないようにする、アルゴリズムの一部です。クォーラムはフェンシングの前提条件で、このためクォーラムは一意になります。

クラスタスタック #

クラスタを構成するソフトウェア技術およびコンポーネント一式。

クラスタパーティション #

1つ以上のノードとその他のクラスタ間で通信が失敗した場合は、クラスタパーティションが発生します。ノードはパーティションに分割されますが、アクティブなままです。これらは同じパーティション内のノードのみと通信可能で、切り離されたノードは認識しません。これはスプリットブレインシナリオとして知られています。

グループ #

リソースグループには、一緒の場所で見つけ、連続して開始し、逆の順序で停止する必要のある複数のリソースが含まれます。

コロケーション制約 #

ノード上でどのリソースを同時に実行できるか、または実行できないかを指定するリソースの制約の一種。

スイッチオーバー #

クラスタ内の他のノードへの、予定されたリソースの移動。failoverも参照してください。

スケジューラ #

スケジューラはpacemaker-schedulerdとして実装されています。クラスタ遷移が必要になると、pacemaker-schedulerdは、クラスタの予想される次の状態を計算し、次の状態を達成するためにどのようなアクションをスケジュールする必要があるかを決定します。

スプリットブレイン #

クラスタノードが(ソフトウェアまたはハードウェア障害によって)互いに認識しない2つ以上のグループに分割される場合のシナリオです。STONITHは、スプリットブレインシナリオがクラスタ全体に悪影響を及ぼすのを防ぎます。パーティションされたクラスタシナリオとも呼ばれます。

スプリットブレインという用語は、DRBDでも使用されますが、ノードに異なるデータが含まれることを意味します。

ネットワークデバイスボンディング #

ネットワークデバイスボンディングは、帯域幅を増やしたり、冗長性を提供したりするために、2つ以上のネットワークインタフェースを1つのボンドデバイスに組み合わせるものです。Corosyncの使用時は、クラスタソフトウェアでボンドデバイスが管理されることはありません。したがって、ボンドデバイスにアクセスする可能性のあるクラスタノードごとに、ボンドデバイスを設定する必要があります。

ノード #

クラスタのメンバーである任意のサーバ(物理または仮想)。

パラメータ(インスタンス属性) #

パラメータは、リソースが制御するサービスのインスタンスを決定します。

ヒューリスティックス #

QDeviceは、クラスタサービスの起動時、クラスタメンバーシップの変更時、QNetdサーバへの接続の成功時にローカルで実行されるか、オプションで定期的に実行される一連のコマンド(ヒューリスティックス)の使用をサポートしています。結果は、クォーラムを持つパーティションを決定するための計算に使用されます。

フェンシング #

孤立または失敗したクラスタメンバーによる共有リソースへのアクセスを防止します。フェンシングには、リソースレベルフェンシングおよびノードレベルフェンシングという、2つのクラスがあります。リソースレベルのフェンシングにより、リソースへの排他的アクセスが保証されます。ノードレベルフェンシングでは、障害が発生したノードから共有リソースにアクセスできなくなります。また、リソースから、ステータスが不明なノードを実行できなくなります。これは通常、ノードをリセットするか電源を切ることによって行われます。

フェールオーバードメイン #

ノード障害の発生時にリソースを実行することができる、指定されたクラスタノードのサブセット。

プリミティブ #

プリミティブリソースは、クラスタリソースの中で最も基本的なタイプです。

プロモータブルクローン #

プロモータブルクローンは、昇格できる特別なタイプの複製リソースです。これらのリソースのアクティブなインスタンスは、昇格と非昇格(「アクティブとパッシブ」または「プライマリとセカンダリ」とも呼ばれる)の2つの状態に分けられます。

メタ属性(リソースオプション) #

CRM (クラスタリソースマネージャ)に対して特定のリソースの処理方法を伝えるパラメータ。たとえば、リソースの優先度やターゲットロールを定義できます。

メトロクラスタ #

すべてのサイトがファイバチャンネルで接続された、複数の建物またはデータセンターにわたってストレッチできる単一のクラスタ。ネットワークの遅延は通常低いです。ストレージはミラーリングまたは同期レプリケーションを使用して頻繁にレプリケートされます。

リソース #

Pacemakerが認識するサービスまたはアプリケーションの任意の種類。たとえば、IPアドレス、ファイルシステム、データベース。リソースという用語は、DRBDでも使用されており、レプリケーション用の一般的な接続を使用しているブロックデバイスのセットの名前を表します。

リソースの制約 #

リソースの制約は、リソースを実行可能なクラスタノード、リソースのロード順序、特定のリソースが依存している他のリソースを指定します。

コロケーション制約、場所の制約、および順序の制約も参照してください。

リソースセット #

場所、コロケーション、または順序の制約を定義するための別のフォーマットとして、リソースセットを使用することができます。リソースセットでは、プリミティブが1つのセットでグループ化されます。制約を作成する際に、制約を適用するリソースを複数指定することができます。

リソーステンプレート #

類似した設定のリソースを多数作成するために、リソーステンプレートを定義することができます。リソーステンプレートを定義した後は、プリミティブの中や、特定のタイプの制約で参照できるようになります。プリミティブ内でテンプレートを参照すると、そのテンプレートで定義されている操作、インスタンス属性(パラメータ)、メタ属性、使用属性がすべてプリミティブに継承されます。

ローカルエグゼキュータ #

ローカルエクゼキュータは、Pacemakerと各ノードのリソースの間に配置されます。pacemaker-execdデーモンにより、Pacemakerでのリソースの起動、停止、監視が可能になります。

ローカルクラスタ #

1つのロケーション内の単一のクラスタ(たとえば、すべてのノードが1つのデータセンターにある)。ネットワークの遅延は最小限です。ストレージは通常、すべてのノードに同時にアクセスされます。

利用率 #

特定のリソースがノードから要求する容量をCRMに指示します。

同時実行違反 #

クラスタ内の1つのノードだけで実行する必要があるリソースが、複数のノード上で実行されています。

場所の制約 #

リソースを実行できるまたは実行できないノードを定義するリソースの制約の一種。

既存のクラスタ #

既存のクラスタという用語は、1つ以上のノードで構成されるクラスタを指すものとして使用されます。既存のクラスタは、通信チャネルを定義する基本的なCorosync設定を持ちますが、必ずしもリソース設定を持つとは限りません。

災害復旧 #

障害発生後、機能を通常どおりの、安定した状態に修復するプロセス。

複製 #

クローンは、既存のノードの同一コピーで、複数のノードの展開を簡単にするために使用されます。

クラスタリソースのコンテキストでは、クローンは複数のノードでアクティブにできるリソースです。リソースエージェントがサポートしていれば、どのようなリソースもクローン化できます。

障害 #

自然、人、ハードウェアのエラー、ソフトウェアのバグなどによって引き起こされる重要なインフラストラクチャの想定外の障害。

障害復旧プラン #

ITインフラストラクチャへの影響を最小限に抑えながら障害から復旧する戦略。

順序の制約 #

アクションの順序を定義するリソースの制約の一種。