|
Este documento ha sido traducido utilizando tecnología de traducción automática. Si bien nos esforzamos por proporcionar traducciones precisas, no ofrecemos garantías sobre la integridad, precisión o confiabilidad del contenido traducido. En caso de discrepancia, la versión original en inglés prevalecerá y constituirá el texto autorizado. |
Solución de problemas de reinicio
Cada MachineInventory con la anotación elemental.cattle.io/resettable: "true" activará la ejecución de un plan de reinicio, tras la eliminación.
El finalizador machineinventory.elemental.cattle.io se eliminará solo después de que el plan haya sido ejecutado con éxito por el elemental-system-agent que se está ejecutando en la máquina.
Puedes investigar por qué un MachineInventory aún no ha sido eliminado, examinándolo:
apiVersion: elemental.cattle.io/v1beta1
kind: MachineInventory
metadata:
# deletionTimestamp has been set. This object has been marked for deletion.
deletionTimestamp: "2023-08-04T08:41:25Z"
annotations:
# `resettable` annotation is enabled.
# This means the machine has to go through reset, before deletion of this object.
elemental.cattle.io/resettable: "true"
# `machineinventory.elemental.cattle.io` finalizer is set.
# The `elemental-operator` is going to create a reset plan for the machine to execute.
# After successful execution of the reset plan, the finalizer is removed and the object will be deleted.
finalizers:
- machineinventory.elemental.cattle.io
status:
conditions:
# Most recent condition shows that the MachineInventory is waiting for a plan to be applied.
- lastTransitionTime: "2023-08-04T08:41:25Z"
message: waiting for plan to be applied
reason: WaitingForPlan
status: "False"
type: Ready
# The plan to be executed is referenced.
# Normally it has the same name of the MachineInventory and lives within the same namespace.
plan:
checksum: 5aba8b6b3161bc52d8953b2428e54ecda3b59e8e0043b49d761d1e79174eded6
secretRef:
name: m-bf1008a1-61d6-4355-b5f5-f7d1c527affe
namespace: fleet-default
También puedes examinar el plan referenciado Secret.
Ten en cuenta que el elemental-system-agent que se está ejecutando en la máquina está observando este secreto y debería ejecutar el plan.
También puedes monitorear su progreso desde los registros de la máquina: journalctl -u elemental-system-agent -f.
apiVersion: v1
kind: Secret
# This is a `elemental.cattle.io/plan` secret plan.
type: elemental.cattle.io/plan
metadata:
annotations:
# This is a `reset` plan type.
elemental.cattle.io/plan.type: reset
labels:
elemental.cattle.io/managed: "true"
name: m-bf1008a1-61d6-4355-b5f5-f7d1c527affe
namespace: fleet-default
# It is owned by the `MachineInventory` waiting for deletion.
ownerReferences:
- apiVersion: elemental.cattle.io/v1beta1
controller: true
kind: MachineInventory
name: m-bf1008a1-61d6-4355-b5f5-f7d1c527affe
uid: 5aa3863c-63a5-4cb9-91fd-7a45191d4842
data:
# The plan has not been applied yet.
applied-checksum: ""
# It also hasn't failed.
failed-checksum: ""
# The actual plan to be executed, base64 encoded.
plan: eyJmaWxlcyI6W3siY29udGVudCI6ImJtRnRaVG9nUld4bGJXVnVkR0ZzSUZKbGMyVjBDbk4wWVdkbGN6b0tJQ0FnSUc1bGRIZHZjbXN1WVdaMFpYSTZDaUFnSUNBZ0lDQWdMU0JqYjIxdFlXNWtjem9LSUNBZ0lDQWdJQ0FnSUNBZ0xTQmxiR1Z0Wlc1MFlXd3RjbVZuYVhOMFpYSWdMUzFrWldKMVp5QXRMWEpsYzJWMENpQWdJQ0FnSUNBZ0lDQnBaam9nSjFzZ0xXWWdMM0oxYmk5amIzTXZjbVZqYjNabGNubGZiVzlrWlNCZEp3b2dJQ0FnSUNBZ0lDQWdibUZ0WlRvZ1VuVnVjeUJsYkdWdFpXNTBZV3dnY21WelpYUUsiLCJwYXRoIjoiL29lbS9yZXNldC1jbG91ZC1jb25maWcueWFtbCIsInBlcm1pc3Npb25zIjoiMDYwMCJ9XSwiaW5zdHJ1Y3Rpb25zIjpbeyJuYW1lIjoiY29uZmlndXJlIG5leHQgYm9vdCB0byByZWNvdmVyeSBtb2RlIiwiYXJncyI6WyIvb2VtL2dydWJlbnYiLCJzZXQiLCJuZXh0X2VudHJ5PXJlY292ZXJ5Il0sImNvbW1hbmQiOiJncnViMi1lZGl0ZW52In0seyJuYW1lIjoic2NoZWR1bGUgcmVib290IiwiYXJncyI6WyItciIsIisxIl0sImNvbW1hbmQiOiJzaHV0ZG93biJ9XX0K
El plan creado por el elemental-operator debería contener las siguientes instrucciones:
{
"files": [
// A cloud-init config file is created on the default /oem directory.
// This config will be executed once in recovery mode.
{
"content": "bmFtZTogRWxlbWVudGFsIFJlc2V0CnN0YWdlczoKICAgIG5ldHdvcmsuYWZ0ZXI6CiAgICAgICAgLSBjb21tYW5kczoKICAgICAgICAgICAgLSBlbGVtZW50YWwtcmVnaXN0ZXIgLS1kZWJ1ZyAtLXJlc2V0CiAgICAgICAgICBpZjogJ1sgLWYgL3J1bi9jb3MvcmVjb3ZlcnlfbW9kZSBdJwogICAgICAgICAgbmFtZTogUnVucyBlbGVtZW50YWwgcmVzZXQK",
"path": "/oem/reset-cloud-config.yaml",
"permissions": "0600"
}
],
"instructions": [
{
"name": "configure next boot to recovery mode",
"args": [
"/oem/grubenv",
"set",
"next_entry=recovery"
],
"command": "grub2-editenv"
},
{
"name": "schedule reboot",
"args": [
"-r",
"+1"
],
"command": "shutdown"
}
]
}
Si el elemental-system-agent ejecutó con éxito el plan, el finalizador machineinventory.elemental.cattle.io en el MachineInventory será eliminado y el MachineInventory será eliminado.
Ten en cuenta que esto no es una indicación de que la máquina haya sido completamente reiniciada aún.
Esta es una limitación de la implementación actual y eventualmente mejorará, de modo que será posible rastrear completamente el estado de reinicio.
Sin embargo, en esta etapa esperamos que el host se reinicie y arranque en modo de recuperación.
Una vez en modo de recuperación, el cos-setup-network debería ejecutar la configuración de cloud-init que se ha escrito en /oem/reset-cloud-config.yaml.
Puedes monitorear el estado con journalctl -u cos-setup-network -f.
Las instrucciones de cloud-init deberían verse como las siguientes:
name: {elemental-product-name} Reset
stages:
network.after:
- if: '[ -f /run/cos/recovery_mode ]'
name: Runs elemental reset
commands:
- systemctl start elemental-register-reset
El CLI del elemental-register se registrará con el elemental-operator como una nueva máquina. Esto llevará a la creación de un nuevo objeto MachineInventory.
La configuración remota MachineRegistration también se obtendrá para aplicar las opciones de reinicio, por ejemplo reset-persistent, reset-oem, o la configuración de energía, ya sea reboot o power-off.
Después del reinicio, dependiendo de la configuración, la máquina debería apagarse o reiniciarse y estar lista para ser adoptada dentro de un nuevo clúster.
Eliminando forzosamente un MachineInventory que está en proceso de reinicio
Si la máquina no puede ejecutar las instrucciones de reinicio y el MachineInventory relacionado no se elimina, hay dos formas equivalentes de solucionar el problema manualmente.
-
Elimina la anotación
elemental.cattle.io/resettable: "true"delMachineInventory. -
Elimina el finalizador
machineinventory.elemental.cattle.iodelMachineInventory.
Recuerda también cuidar de la máquina en sí, reprovisionándola completamente o reiniciando en modo de recuperación y utilizando el comando elemental reset directamente.