3 管理节点 HA 设置 #
管理节点是运行 Salt Master 服务的 Ceph 集群节点。它管理着集群的其余节点,它会查询这些节点的 Salt Minion 服务并向其发出指示。它通常也会包含其他服务,例如 Grafana 仪表盘(由 Prometheus 监控工具包提供支持)。
如果管理节点发生故障,通常需要为该节点提供新的工作硬件,并通过最近的备份恢复完整的集群配置堆栈。这种方法很费时,并会导致集群故障。
为防止出现由于管理节点故障导致的 Ceph 集群性能下降,建议您为 Ceph 管理节点使用高可用性 (HA) 集群。
3.1 管理节点的 HA 集群概述 #
HA 集群的原理是,当其中一个集群节点发生故障时,由另一个节点自动接管其职责,包括虚拟化管理节点。使用此方法时,其他 Ceph 集群节点将不会知道管理节点发生故障。
管理节点的极简 HA 解决方案需要以下硬件:
两台能够运行具有高可用性扩展的 SUSE Linux Enterprise 以及虚拟化管理节点的裸机服务器。
两个或多个冗余网络通讯路径,例如通过网络设备绑定。
用于托管管理节点虚拟机磁盘映像的共享存储。必须能够通过这两台服务器访问共享存储。例如,共享存储可以是 NFS 导出项、Samba 共享或 iSCSI 目标。
有关集群要求的更多详细信息,请访问 https://documentation.suse.com/sle-ha/15-SP2/html/SLE-HA-all/art-sleha-install-quick.html#sec-ha-inst-quick-req。
3.2 构建具有管理节点的 HA 集群 #
以下过程汇总了构建将管理节点虚拟化的 HA 集群的几个最重要的步骤。有关详细信息,请参见指定链接。
设置一个具有共享存储的基本双节点 HA 集群,如 https://documentation.suse.com/sle-ha/15-SP2/html/SLE-HA-all/art-sleha-install-quick.html 中所述。
在两个集群节点上,安装运行 KVM 超级管理程序和
libvirt
工具包所需的所有程序包,如 https://documentation.suse.com/sles/15-SP2/html/SLES-all/cha-vt-installation.html#sec-vt-installation-kvm 中所述。在第一个集群节点上,使用
libvirt
创建新的 KVM 虚拟机 (VM),如 https://documentation.suse.com/sles/15-SP2/html/SLES-all/cha-kvm-inst.html#sec-libvirt-inst-virt-install 中所述。使用预配置的共享存储来存储 VM 的磁盘映像。VM 设置完成后,将其配置导出到共享存储上的 XML 文件。使用以下语法:
root #
virsh dumpxml VM_NAME > /path/to/shared/vm_name.xml为管理节点 VM 创建资源。有关创建 HA 资源的一般信息,请参见 https://documentation.suse.com/sle-ha/15-SP2/html/SLE-HA-all/cha-conf-hawk2.html。http://www.linux-ha.org/wiki/VirtualDomain_%28resource_agent%29 中提供了有关为 KVM 虚拟机创建资源的详细信息。
在新创建的 VM guest 中,部署管理节点,包括您需要在其上使用的其他服务。执行第 5.2 节 “部署 Salt”中的相关步骤。同时,在非 HA 集群服务器上部署其余 Ceph 集群节点。