本文档采用自动化机器翻译技术翻译。尽管我们力求提供准确的译文，但不对翻译内容的完整性、准确性或可靠性作出任何保证。若出现任何内容不一致情况，请以原始英文版本为准，且原始英文版本为权威文本。

从 v1.4.1 或 v1.4.2 升级到 v1.4.3

一般信息

每当有新的 SUSE Virtualization 版本可供升级时，升级按钮会出现在 仪表板 屏幕上。有关更多信息，请参见开始升级。

SUSE Virtualization v1.4.2 和 v1.4.3 使用相同的小版本 SUSE® Rancher Prime: RKE2（v1.31）。这允许您直接从 v1.4.1 升级到 v1.4.3。

对于隔离环境，请参见准备隔离升级。

已知问题

1.隔离升级在 Fluentd 和 Fluent Bit pod 中遇到 `ImagePullBackOff` 错误

升级可能在过程的最开始就卡住，表现为 0% 进度和在 SUSE Virtualization UI 的升级对话框中标记为 待处理 的项目。

具体来说，Fluentd 和 Fluent Bit pod 可能会卡在 ImagePullBackOff 状态。要检查 pod 的状态，请运行以下命令：

$ kubectl -n harvester-system get upgrades -l harvesterhci.io/latestUpgrade=true
NAME                 AGE
hvst-upgrade-x2hz8   7m14s

$ kubectl -n harvester-system get upgradelogs -l harvesterhci.io/upgrade=hvst-upgrade-x2hz8
NAME                            UPGRADE
hvst-upgrade-x2hz8-upgradelog   hvst-upgrade-x2hz8

$ kubectl -n harvester-system get pods -l harvesterhci.io/upgradeLog=hvst-upgrade-x2hz8-upgradelog
NAME                                                        READY   STATUS             RESTARTS   AGE
hvst-upgrade-x2hz8-upgradelog-downloader-6cdb864dd9-6bw98   1/1     Running            0          7m7s
hvst-upgrade-x2hz8-upgradelog-infra-fluentbit-2nq7q         0/1     ImagePullBackOff   0          7m42s
hvst-upgrade-x2hz8-upgradelog-infra-fluentbit-697wf         0/1     ImagePullBackOff   0          7m42s
hvst-upgrade-x2hz8-upgradelog-infra-fluentbit-kd8kl         0/1     ImagePullBackOff   0          7m42s
hvst-upgrade-x2hz8-upgradelog-infra-fluentd-0               0/2     ImagePullBackOff   0          7m42s

这是因为以下容器镜像既没有在集群节点中预加载，也没有从互联网拉取：

ghcr.io/kube-logging/fluentd:v1.15-ruby3
ghcr.io/kube-logging/config-reloader:v0.0.5
fluent/fluent-bit:2.1.8

要解决此问题，请执行以下任一操作：

更新日志 CR 以使用已经在集群节点中预加载的镜像。为此，请在集群上运行以下命令：

# Get the Logging CR names
OPERATOR_LOGGING_NAME=$(kubectl get loggings -l app.kubernetes.io/name=rancher-logging -o jsonpath="{.items[0].metadata.name}")
INFRA_LOGGING_NAME=$(kubectl get loggings -l harvesterhci.io/upgradeLogComponent=infra -o jsonpath="{.items[0].metadata.name}")

# Gather image info from operator's Logging CR
FLUENTD_IMAGE_REPO=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentd.image.repository}")
FLUENTD_IMAGE_TAG=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentd.image.tag}")

FLUENTBIT_IMAGE_REPO=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentbit.image.repository}")
FLUENTBIT_IMAGE_TAG=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentbit.image.tag}")

CONFIG_RELOADER_IMAGE_REPO=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentd.configReloaderImage.repository}")
CONFIG_RELOADER_IMAGE_TAG=$(kubectl get loggings $OPERATOR_LOGGING_NAME -o jsonpath="{.spec.fluentd.configReloaderImage.tag}")

# Patch the Logging CR
kubectl patch logging $INFRA_LOGGING_NAME --type=json -p="[{\"op\":\"replace\",\"path\":\"/spec/fluentbit/image\",\"value\":{\"repository\":\"$FLUENTBIT_IMAGE_REPO\",\"tag\":\"$FLUENTBIT_IMAGE_TAG\"}}]"
kubectl patch logging $INFRA_LOGGING_NAME --type=json -p="[{\"op\":\"replace\",\"path\":\"/spec/fluentd/image\",\"value\":{\"repository\":\"$FLUENTD_IMAGE_REPO\",\"tag\":\"$FLUENTD_IMAGE_TAG\"}}]"
kubectl patch logging $INFRA_LOGGING_NAME --type=json -p="[{\"op\":\"replace\",\"path\":\"/spec/fluentd/configReloaderImage\",\"value\":{\"repository\":\"$CONFIG_RELOADER_IMAGE_REPO\",\"tag\":\"$CONFIG_RELOADER_IMAGE_TAG\"}}]"

Fluentd 和 Fluent Bit pod 的状态应在片刻内更改为 Running，并且在更新日志 CR 后，升级过程应继续。如果 Fluentd pod 的状态仍为 ImagePullBackOff，您可以删除该 pod 以强制其重启。

UPGRADE_NAME=$(kubectl -n harvester-system get upgrades -l harvesterhci.io/latestUpgrade=true -o jsonpath='{.items[0].metadata.name}')
UPGRADELOG_NAME=$(kubectl -n harvester-system get upgradelogs -l harvesterhci.io/upgrade=$UPGRADE_NAME -o jsonpath='{.items[0].metadata.name}')

kubectl -n harvester-system delete pods -l harvesterhci.io/upgradeLog=$UPGRADELOG_NAME,harvesterhci.io/upgradeLogComponent=aggregator

在可以访问互联网的计算机上，拉取所需的容器镜像，然后将其导出为 TAR 文件。接下来，将 TAR 文件传输到集群节点，然后在每个节点上运行以下命令以导入镜像：

# Pull down the three container images
docker pull ghcr.io/kube-logging/fluentd:v1.15-ruby3
docker pull ghcr.io/kube-logging/config-reloader:v0.0.5
docker pull fluent/fluent-bit:2.1.8

# Export the images to a tar file
docker save \
  ghcr.io/kube-logging/fluentd:v1.15-ruby3 \
  ghcr.io/kube-logging/config-reloader:v0.0.5 \
  fluent/fluent-bit:2.1.8 > upgradelog-images.tar

# After transferring the tar file to the cluster nodes, import the images (need to be run on each node)
ctr -n k8s.io images import upgradelog-images.tar

在镜像预加载后，升级过程应继续。

（不推荐）在禁用日志记录的情况下重新启动升级过程。确保在*升级*对话框中*启用日志记录*复选框未被选中。

2.超大卷

在SUSE Virtualization v1.4.3中，使用SUSE Storage v1.7.3，超大卷（例如，大小为999999 Gi）被标记为_未准备好_，无法删除。

要解决此问题，请执行以下步骤：

暂时去除PVC webhook规则。

RULE_INDEX=$(kubectl get \
  validatingwebhookconfiguration longhorn-webhook-validator -o json \
  | jq '.webhooks[0].rules | map(.resources[0] == "persistentvolumeclaims") | index(true)')

if [ -n "$RULE_INDEX" -a "$RULE_INDEX" != "null" ]; then
  kubectl patch validatingwebhookconfiguration longhorn-webhook-validator \
    --type='json' \
    -p="[{'op': 'remove', 'path': '/webhooks/0/rules/$RULE_INDEX'}]"
fi

等待相关的PVC被删除。

恢复PVC webhook规则以重新启用验证。

kubectl patch validatingwebhookconfiguration longhorn-webhook-validator \
  --type='json' \
  -p='[{"op": "add", "path": "/webhooks/0/rules/-", "value": {"apiGroups":[""],"apiVersions":["v1"],"operations":["UPDATE"],"resources":["persistentvolumeclaims"],"scope":"Namespaced"}}]'

该问题将在SUSE Storage v1.8.2中解决，可能会包含在SUSE Virtualization v1.5.1中。

3.来宾集群中的非 root 用户无法访问RWX卷

来宾集群中的非 root 用户在访问RWX卷时遇到意外的“没有权限”错误。这是由于在`nfs-ganesha` v6.0+中存在的https://github.com/nfs-ganesha/nfs-ganesha/issues/1132[回归问题]，影响了`longhorn-share-manager`镜像的v1.7.3。

您可以通过用热修复镜像`longhorn-share-manager:v1.7.3-hotfix-1`替换`longhorn-share-manager:v1.7.3`来解决该问题。

如果您不受该问题影响，请不要使用热修复镜像。

通过运行以下命令编辑`longhorn-manager` DaemonSet：

  kubectl -n longhorn-system edit daemonset/longhorn-manager

在`spec.containers.command`字段中，将`--share-manager-image`更改为`longhornio/longhorn-share-manager:v1.7.3-hotfix-1`。

  ...
    spec:
      containers:
      - command:
        - longhorn-manager
        - -d
        - daemon
        - --engine-image
        - longhornio/longhorn-engine:v1.7.3
        - --instance-manager-image
        - longhornio/longhorn-instance-manager:v1.7.3
        - --share-manager-image
        - longhornio/longhorn-share-manager:v1.7.3-hotfix-1
        - --backing-image-manager-image
        - longhornio/backing-image-manager:v1.7.3
        - --support-bundle-manager-image
        - longhornio/support-bundle-kit:v0.0.51
        - --manager-image
        - longhornio/longhorn-manager:v1.7.3
        - --service-account
        - longhorn-service-account
        - --upgrade-version-check
  ...

一旦应用更新，重启使用RWX卷的工作负载。

如果您正在使用热修复镜像并想要升级SUSE Virtualization v1.5.x，您必须编辑`longhorn-manager` DaemonSet并在开始升级之前恢复到`longhorn-share-manager:v1.7.3`镜像。

4.使用可迁移RWX卷的虚拟机意外重启

使用可迁移RWX卷的虚拟机在 CSI 插件 Pod 被重启时会意外重启。此问题影响SUSE Virtualization v1.4.x、v1.5.0 和 v1.5.1。

解决方法是在升级之前，在SUSE Storage UI上禁用设置意外分离卷时自动删除工作负载 Pod。升级完成后，您必须再次启用该设置。

该问题将在SUSE Storage v1.8.3、v1.9.1及更高版本中修复。SUSE Virtualization v1.6.0将包含SUSE Storage v1.9.1。