|
本文档采用自动化机器翻译技术翻译。 尽管我们力求提供准确的译文,但不对翻译内容的完整性、准确性或可靠性作出任何保证。 若出现任何内容不一致情况,请以原始 英文 版本为准,且原始英文版本为权威文本。 |
从 v1.6.x 升级到 v1.6.y
一般信息
已知问题
升级卡在 "预排空" 状态
在某些情况下,实例管理器可能无法清理引擎实例,即使引擎 CR 的状态已更改为 "已停止"。升级过程卡在 "预排空" 状态,因为在相应的 PodDisruptionBudget (PDB) 仍然存在时,实例管理器 pod 无法被删除。
解决方法是在确保所有卷都健康后删除实例管理器 PDB。
来宾集群卡在 "更新中" 状态
在 SUSE Virtualization 升级后,RKE2 来宾集群可能会卡在 "更新中" 状态。在 SUSE Virtualization UI 上显示以下错误消息:
Configuring etcd node(s) rke2-pool1-xdvfc-qf4vb: Node condition MemoryPressure is Unknown. Node condition DiskPressure is Unknown. Node condition PIDPressure is Unknown. Node condition Ready is Unknown, waiting for probes: calico, etcd, kube-apiserver, kube-controller-manager
当来宾节点的IP地址在升级后发生变化时,会导致etcd出现故障。很可能底层虚拟机已重启多次,并从DHCP服务器获取了新的IP地址。
为了解决此问题,请执行以下步骤:
-
在 Rancher UI 上,从来宾集群中删除导致错误的节点。
-
在 SUSE Virtualization UI 上,检查底层虚拟机的状态。
-
如有必要,请重启虚拟机。
虚拟机被移除,来宾集群尝试创建一个新节点。一旦节点创建,来宾集群的状态将变为“活动”。
相关问题: #8950
已停止的虚拟机卡在“启动”状态。
在实时迁移后,SUSE Storage卷可能在“分离中”和“已分离”状态之间波动。由于卷尚未准备好,相关的虚拟机无法完全启动。
解决方法是使用以下命令清除卷的`status.currentMigrationNodeID`:
kubectl patch -n longhorn-system volume <volume> \
--type=merge \
--subresource status \
-p '{"status":{"currentMigrationNodeID":""}}'
4.升级到v1.6.1-rc2卡在“预排空”状态。
如果遵循以下特定的升级路径,升级过程可能会无限期地卡在“预排空”状态:
-
集群首先从v1.5.1升级到v1.6.0。
-
随后尝试从 v1.6.0 升级到 v1.6.1-rc2。
当您检查 SUSE Virtualization 控制器时,可能会看到以下错误消息:
harvester-899b4df79-mzgkx apiserver time="2025-10-11T07:21:17Z" level=error msg="error syncing 'fleet-local/custom-a8796656aa4c-machine-plan': handler harvester-upgrade-secret-controller: jobs.batch \"hvst-upgrade-7zqp7-post-drain-hp-113-tink-system\" already exists, requeuing"
harvester-899b4df79-mzgkx apiserver time="2025-10-11T07:23:17Z" level=error msg="error syncing 'fleet-local/custom-a8796656aa4c-machine-plan': handler harvester-upgrade-secret-controller: jobs.batch \"hvst-upgrade-7zqp7-post-drain-hp-113-tink-system\" already exists, requeuing"
harvester-899b4df79-mzgkx apiserver time="2025-10-11T07:25:17Z" level=error msg="error syncing 'fleet-local/custom-a8796656aa4c-machine-plan': handler harvester-upgrade-secret-controller: jobs.batch \"hvst-upgrade-7zqp7-post-drain-hp-113-tink-system\" already exists, requeuing"
这是一个罕见的同步失败:作业已创建,但升级对象未更新。
解决方法是删除现有的排水后作业,然后等待 Upgrade Controller 重新创建它。
相关问题: #9293