用語集 #
- AutoYaST #
AutoYaSTは、ユーザの介入なしで、1つ以上のSUSE Linux Enterpriseシステムを自動的にインストールするためのシステムです。
- bindnetaddr (バインドネットワークアドレス) #
Corosyncエグゼクティブのバインド先のネットワークアドレス。
- boothd (ブースデーモン) #
Geoクラスタ内のそれぞれの参加クラスタおよびアービトレータが、サービスである
boothd
を実行します。これは、別のサイトで実行しているブースデーモンに接続し、接続性の詳細を交換します。- CIB (クラスタ情報ベース) #
クラスタの設定とステータス(クラスタオプション、ノード、リソース、制約、相互の関係性)の全体的な表現。XMLで作成され、メモリに常駐します。プライマリCIBは、DC (指定コーディネータ)で保持および保守され、他のノードに複製されます。CIBに対する通常の読み書き操作は、プライマリCIBによってシリアルに処理されます。
- cluster #
ハイパフォーマンスクラスタは、結果を早く出すためにアプリケーション負荷を共有するコンピュータ(実際または仮想のコンピュータ)のグループです。高可用性クラスタは、サービスの可用性を最大にすることを第一に設計されています。
- Cluster Logical Volume Manager (Cluster LVM) #
Cluster LVM
という用語は、LVMがクラスタ環境で使用されていることを示しています。このため、共有ストレージ上のLVMメタデータを保護するには、ある程度の設定調整が必要になります。- conntrackツール #
カーネル内の接続トラッキングシステムとやり取りできるようにして、iptablesでのステートフルなパケット検査を可能にします。SUSE Linux Enterprise High Availabilityによって使用され、クラスタノード間の接続ステータスを同期します。
- Corosync #
Corosyncは、クラスタのメッセージング、メンバーシップ、クォーラムに関する信頼性の高い情報を提供します。具体的には、グループ通信システムであるCorosyncクラスタエンジンがその処理を担っています。
- CRM (クラスタリソースマネージャ) #
高可用性クラスタにおける外部とのやり取りをすべて統括する管理エンティティ。SUSE Linux Enterprise High AvailabilityはPacemakerをCRMとして使用します。
pacemaker-controld
として実装されるCRMは、多数のコンポーネント(CRM自身のノードとその他のノード両方のローカルリソースマネージャ、非ローカルCRM、管理コマンド、フェンシング機能、メンバーシップ層)と対話します。crm
シェル(crmsh) #コマンドラインユーティリティcrmshは、クラスタ、ノード、およびリソースを管理します。
- Csync2 #
クラスタ内のすべてのノード、およびGeoクラスタ全体に設定ファイルを複製するために使用できる同期ツールです。
- DC (指定コーディネータ) #
DCは、クラスタ内にあるすべてのノードの中から選択されます。この操作は、DCがまだ指定されていない場合や、現在のDCが何らかの理由でクラスタを離脱した場合に行われます。DCは、ノードのフェンシングやリソースの移動など、クラスタ全体に及ぶ変更が必要かどうかを判断できる、クラスタ内で唯一のエンティティです。その他すべてのノードは、現在のDCから設定とリソース割り当て情報を取得します。
- DLM (分散ロックマネージャ) #
DLMは、クラスタファイルシステムのディスクアクセスを調整し、ファイルロッキングを管理して、パフォーマンスと可用性を向上します。
- DRBD #
DRBD®は、高可用性クラスタを構築するためのブロックデバイスです。ブロックデバイス全体が専用ネットワーク経由でミラーリングされ、ネットワークRAID-1として認識されます。
- failover #
リソースまたはノードが1台のマシンで失敗し、影響を受けるリソースが別のノードで起動されたときに発生します。
- Geoクラスタ(地理的に離れたクラスタ) #
それぞれにローカルクラスタを持つ、複数の地理的に離れたサイトで構成されます。サイトはIPによって交信します。サイト全体のフェールオーバーはより高いレベルのエンティティ(ブース)によって調整されます。Geoクラスタは限られたネットワーク帯域幅および高レイテンシに対応する必要があります。ストレージは同期的にレプリケートされます。
- GFS2 #
Global File System 2 (GFS2)は、Linuxコンピュータクラスタ用の共有ディスクファイルシステムです。GFS2により、すべてのノードが同じ共有ブロックストレージに直接同時にアクセスすることができます。GFS2には、非接続運用モードがなく、クライアント役割やサーバ役割もありません。GFS2クラスタのすべてのノードがピアとして機能します。GFS2は、クラスタノードを32台までサポートします。クラスタでGFS2を使用する場合は、ハードウェアが共有ストレージへのアクセスを許可し、ロックマネージャがストレージへのアクセスを制御する必要があります。
- Hawk2 #
High AvailabilityクラスタをLinuxまたは非Linuxマシンから同様に監視および管理することができる、ユーザフレンドリなWebベースのインタフェース。Hawk2には、(グラフィカルな)Webブラウザを使用して、クラスタの内部または外部の任意のマシンからアクセスできます。
- location #
クラスタ全体のコンテキストでは、「場所」はノードの物理的な位置を表します(たとえば、すべてのノードが同じデータセンター内の場所に配置されている場合があります)。
場所の制約のコンテキストでは、「場所」は、リソースを実行できるまたは実行できないノードを表します。
- LRM (ローカルリソースマネージャ) #
ローカルリソースマネージャは、各ノードのPacemaker層とリソース層の間に存在し、
pacemaker-execd
デーモンとして実装されます。このデーモンにより、Pacemakerでのリソースの起動、停止、監視が可能になります。- mcastaddr (マルチキャストアドレス) #
Corosyncエグゼクティブによるマルチキャストに使用されるIPアドレス。このIPアドレスはIPv4またはIPv6のいずれかに設定できます。
- mcastport (マルチキャストポート) #
クラスタ通信に使用されるポート。
- multicast (マルチキャスト) #
ネットワーク内で一対多数の通信に使用される技術で、クラスタ通信に使用できます。Corosyncはマルチキャストとユニキャストの両方をサポートしています。
- OCFS2 #
Oracle Cluster File System 2 (OCFS2)は汎用のジャーナリングファイルシステムであり、アプリケーションのバイナリファイル、データファイル、およびデータベースを共有ストレージ上のデバイスに保存することができます。クラスタ内のすべてのノードは、ファイルシステムに同時に読み取りアクセスと書き込みアクセスを行えます。ユーザスペース管理デーモンは、クローンリソースを介して管理され、HAスタック(特に、CorosyncおよびDLM (Distributed Lock Manager))との統合を実現します。
- pacemaker-controld (クラスタコントローラデーモン) #
CRMは、
pacemaker-controld
デーモンとして実装されます。 crmdは各クラスタノード上にインスタンスを持ちます。プライマリとして動作するpacemaker-controldインスタンスを1つ選択することにより、クラスタのすべての意思決定が一元化されます。選択したpacemaker-controldプロセス(またはそのプロセスが実行されているノード)で障害が発生したら、新しいpacemaker-controldプロセスが確立されます。- PE (ポリシーエンジン) #
ポリシーエンジンは、
pacemaker-schedulerd
デーモンとして実装されます。クラスタ遷移が必要になると、pacemaker-schedulerd
はクラスタの現在の状態と設定を基に、クラスタの次の状態を計算します。また、次の状態を達成するためにどんなアクションを行う必要があるかも決定します。- QDevice (
corosync-qdevice
) # QDeviceおよびQNetdはクォーラムの決定に参加します。アービトレータ
corosync-qnetd
からの支援により、corosync-qdevice
は設定可能な投票数を提供するため、クラスタは標準のクォーラムルールで許可されているよりも多くのノード障害に耐えることができます。- QNetd (
corosync-qnetd
) # クラスタの一部ではないsystemdサービス(デーモン、「QNetdサーバ」)。QNetdは
corosync-qdevice
デーモンに投票を提供し、クォーラムの決定に参加できるようにします。- RA (リソースエージェント) #
プロキシとして機能してリソースを管理する(リソースの開始、停止、監視などを行う)スクリプト。SUSE Linux Enterprise High Availabilityはさまざまなリソースエージェントをサポートします。詳細については、10.2項 「サポートされるリソースエージェントクラス」を参照してください。
- ReaR (Relaxおよび回復) #
障害復旧イメージを作成するための管理ツールセット。
- RRP (冗長リングプロトコル) #
ネットワーク障害の一部または全体に対する災害耐性のために、複数の冗長ローカルエリアネットワークが使用できるようになります。この方法では、1つのネットワークが作動中である限り、クラスタ通信を維持できます。Corosyncはトーテム冗長リングプロトコルをサポートします。
- SBD (STONITHブロックデバイス) #
共有ブロックストレージ(SAN、iSCSI、FCoEなど)を介したメッセージの交換を通じて、ノードフェンシングメカニズムを提供します。ディスクレスモードでも使用できます。動作異常のノードが本当に停止したかどうかを確認するために、各ノードではハードウェアまたはソフトウェアのウォッチドッグが必要です。
- SFEX (共有ディスクファイル排他制御) #
SFEXはSANにおけるストレージ保護機能を提供します。
- SPOF (シングルポイント障害) #
失敗するとクラスタ全体の障害をトリガしてしまう、クラスタのコンポーネント。
- STONITH #
「Shoot the other node in the head」の略です。動作異常のノードをシャットダウンすることでクラスタに問題を発生させないようにするフェンシングメカニズムを指しています。Pacemakerクラスタにおけるノードレベルフェンシングの実装は、STONITHです。このPacemakerにはフェンシングサブシステム
pacemaker-fenced
が内蔵されています。- YaST #
一般的なシステムインストールおよび管理用グラフィカルユーザインタフェース。『インストールとセットアップクイックスタート』で説明されているように、YaSTを使用して、SUSE Linux Enterprise High AvailabilityをSUSE Linux Enterprise Server上にインストールします。
- アクティブ/アクティブ、アクティブ/パッシブ #
サービスがノード上で実行される方法の概念。アクティブ/パッシブシナリオでは、1つ以上のサービスがアクティブノード上で実行され、パッシブノードはアクティブノードの失敗を待機します。アクティブ/アクティブでは、各ノードがアクティブであると同時にパッシブです。たとえば、一部のサービスは実行されていますが、それ以外のサービスは他のノードから引き継ぐことができます。DRBDのプライマリ/セカンダリとデュアルプライマリに類似しています。
- アービトレータ #
Geoクラスタ内の追加インスタンスで、サイト間にまたがるリソースのフェールオーバーなどの決定に関する合意の形成を手助けします。アービトレータは専用モードで1つまたは複数のブースインスタンスを実行する単一のマシンです。
通常のクラスタでは、「アービトレータ」はQNetdを指すこともあります。QNetdをQDeviceとともに設定して、偶数個のノードのクラスタでクォーラムの決定に参加することができます。
- クォーラム #
クラスタでは、クラスタパーティションは、ノード(投票)の大多数を保有する場合、クォーラムを持つ(「定数に達している」)と定義されます。クォーラムはただ1つのパーティションで識別されます。複数の切断されたパーティションまたはノードが処理を続行してデータおよびサービスが破損されないようにする、アルゴリズムの一部です(スプリットブレイン)。クォーラムはフェンシングの前提条件で、このためクォーラムは一意になります。
- クラスタサイト #
Geoクラスタリングでは、クラスタサイト(または単に「サイト」)は、ブースによって管理される同じ物理的場所にあるノードのグループです。
- クラスタスタック #
クラスタを構成するソフトウェア技術およびコンポーネント一式。
- クラスタパーティション #
1つ以上のノードとその他のクラスタ間で通信が失敗した場合は、常にクラスタパーティションが発生します。クラスタのノードはパーティションに分割されますが、アクティブなままです。これらは同じパーティション内のノードのみと通信可能で、切り離されたノードは認識しません。つまり、他のパーティションのノードの損失は確認できないため、スプリットブレインシナリオが作成されます(スプリットブレインも参照)。
- グループ #
リソースグループには、一緒の場所で見つけ、連続して開始し、逆の順序で停止する必要のある複数のリソースが含まれます。
- コロケーション制約 #
コロケーション制約は、ノード上で一緒に実行可能な、または一緒に実行することが禁止されているリソースをクラスタに伝えます。リソースの制約も参照してください。
- スイッチオーバー #
クラスタ内の他のノードへの、予定されたオンデマンドのサービス移動。failoverを参照してください。
- スプリットブレイン #
クラスタノードが(ソフトウェアまたはハードウェア障害によって)互いに認識しない2つ以上のグループに分割される場合のシナリオです。STONITHによって、スプリットブレインがクラスタ全体に悪影響を及ぼさなくなります。「パーティションされたクラスタ」シナリオとも呼ばれます。
split brain
という用語は、DRBDでも使用されますが、2つのノードに異なるデータが含まれることを意味します。- チケット #
Geoクラスタで使用されるコンポーネント。チケットは指定のクラスタサイトの特定のリソースを実行する権利を付与します。チケットは1度に1つのサイトだけが所有できます。リソースを特定のチケットに依存させることができます。定義されたチケットがサイトで使用できる場合のみそれぞれのリソースが始動します。その逆に、チケットが削除されると、そのチケットに依存するリソースが自動的に停止します。
- ネットワークデバイスボンディング #
ネットワークデバイスボンディングは、帯域幅を増やしたり、冗長性を提供したりするために、2つ以上のネットワークインタフェースを1つのボンドデバイスに組み合わせるものです。Corosyncの使用時は、クラスタソフトウェアでボンディングデバイスが管理されることはありません。したがって、ボンディングデバイスにアクセスする可能性のあるクラスタノードごとに、ボンディングデバイスを設定する必要があります。
- ノード #
クラスタのメンバーで、ユーザには見えない(実際または仮想の)コンピュータ。
- パラメータ(インスタンス属性) #
パラメータは、リソースが制御するサービスのインスタンスを決定します。
- ヒューリスティックス #
QDeviceは一連のコマンド(「heuristics」)をサポートしています。コマンドは、クラスタサービスの起動、クラスタメンバーシップの変更、QNetdサーバへの接続の成功時にローカルで実行されるか、オプションで定期的に実行されます。すべてのコマンドが正常に実行された場合にのみ、ヒューリスティックスは合格したとみなされ、そうでない場合は、失敗したとみなされます。ヒューリスティックスの結果は、QNetdサーバに送信され、そこでクォーラムに達するパーティションを決定するための計算に使用されます。
- フェンシング #
孤立または失敗したクラスタメンバーによる共有リソースへのアクセス防止の概念を示しています。フェンシングには、リソースレベルフェンシングおよびノードレベルフェンシングという、2つのクラスがあります。リソースレベルのフェンシングにより、特定のリソースへの排他的アクセスが保証されます。ノードレベルフェンシングでは、障害が発生したノードから共有リソースに完全にアクセスできなくなります。また、リソースから、ステータスが不明なノードを実行できなくなります。このことは通常、そのノードをリセットする、または電源オフにするというような、極端な手段で行われます。
- フェールオーバードメイン #
ノード障害の発生時にクラスタサービスを実行することができる、指定されたクラスタノードのサブセット。
- ブース #
Geoクラスタのサイト間のフェールオーバープロセスを管理するインスタンス。その目的は、1つのサイトのみでマルチサイトリソースをアクティブにすることです。これは、サイトをダウンする必要のある場合、クラスタサイト間のフェールオーバードメインとして処理される、いわゆるチケットを使用することで可能になります。
- プリミティブ #
プリミティブリソースは、クラスタリソースの中で最も基本的なタイプです。
- プロモータブルクローン #
プロモータブルクローン(マルチステートリソースとも呼ばれていました)は、昇格できる特別なタイプの複製リソースです。このリソースのアクティブインスタンスは、アクティブとパッシブという2つの状態に分けられます。これらはプライマリとセカンダリと呼ばれる場合もあります。
- メタ属性(リソースオプション) #
CRMに対して特定のリソースの処理方法を伝えるパラメータ。たとえば、優先度や対象となる役割などです。
- メトロクラスタ #
すべてのサイトがファイバチャネルで接続された、複数の建物またはデータセンターにわたってストレッチできる単一のクラスタ。ネットワークの遅延時間は通常は短くなります(約20マイルの距離で5ms未満)。ストレージは頻繁にレプリケートされます(ミラーリングまたは同期レプリケーション)
- ユニキャスト #
1つのあて先ネットワークにメッセージを送信する技術Corosyncはマルチキャストとユニキャストの両方をサポートしています。Corosyncでは、ユニキャストはUDP-unicast (UDPU)として実装されます。
- リソース #
Pacemakerに認識されている、任意のタイプのサービスまたはアプリケーション。IPアドレス、ファイルシステム、データベースなどです。
「リソース」という用語は、DRBDでも使用されており、レプリケーション用の一般的な接続を使用しているブロックデバイスのセットの名前を表します。
- リソースの制約 #
リソースの制約を指定して、リソースを実行可能なクラスタノード、リソースのロード順序、特定のリソースが依存している他のリソースを指定することができます。
- リソースセット #
場所、コロケーション、または順序の制約を定義するための別のフォーマットとして、リソースセットを使用することができます。リソースセットでは、プリミティブが1つのセットでグループ化されます。制約を作成する際に、制約を適用するリソースを複数指定することができます。
- リソーステンプレート #
類似した設定のリソースを多く作成する最も簡単な方法は、リソーステンプレートを定義することです。リソーステンプレートを定義した後は、プリミティブの中や、特定のタイプの制約で参照できるようになります。プリミティブ内でテンプレートを参照すると、そのテンプレートで定義されている操作、インスタンス属性(パラメータ)、メタ属性、使用属性がすべてプリミティブに継承されます。
- ローカルクラスタ #
1つのロケーション内の単一のクラスタ(たとえば、すべてのノードが1つのデータセンターにある)。ネットワークの遅延時間は無視できます。ストレージは通常、すべてのノードに同時にアクセスされます。
- 利用率 #
特定のリソースがノードから要求する容量をCRMに指示します。
- 同時実行違反 #
クラスタ内の1つのノードだけで実行する必要があるリソースが、複数のノード上で実行されています。
- 場所の制約 #
場所の制約はリソースを実行できるノード、できないノード、または実行に適したノードを定義するものです。リソースの制約も参照してください。
- 既存のクラスタ #
「既存のクラスタ」という用語は、1つ以上のノードで構成されるクラスタを指すものとして使用されます。既存のクラスタは、通信チャネルを定義する基本的なCorosync設定を持ちますが、必ずしもリソース設定を持つとは限りません。
- 複製 #
クローンとは、既存のノードの同一のコピーを指します。ノードのクローンを作成すると、複数のノードを簡単に展開できます。
クラスタリソースのコンテキストでは、クローンは複数のノードでアクティブにできるリソースです。対応するリソースエージェントがサポートしていれば、どのようなリソースもクローン化できます。プロモータブルクローン(マルチステートリソースとも呼ばれていました)は、昇格できる特別なタイプのクローンリソースです。
- 負荷分散 #
複数のサーバを同じサービスに参加させて、同じ作業を行わせる機能。
- 障害 #
自然、人、ハードウェアのエラー、ソフトウェアのバグなどによって引き起こされる重要なインフラストラクチャの想定外の障害
- 障害復旧 #
障害復旧は、障害発生後、ビジネス機能を通常どおりの、安定した状態に修復するプロセスです。
- 障害復旧プラン #
ITインフラストラクチャへの影響を最小限に抑えながら障害から復旧する戦略。
- 順序の制約 #
アクションの順序を定義する、順序の制約です。リソースの制約も参照してください。