Este documento foi traduzido usando tecnologia de tradução automática de máquina. Sempre trabalhamos para apresentar traduções precisas, mas não oferecemos nenhuma garantia em relação à integridade, precisão ou confiabilidade do conteúdo traduzido. Em caso de qualquer discrepância, a versão original em inglês prevalecerá e constituirá o texto official.

Restaurar um cluster usando um instantâneo do Rancher

Suposições:

  • A maior parte dos dados e os discos subjacentes ainda existem no cluster antes da restauração e podem ser reutilizados diretamente.

  • Existe um repositório de backup que contém todos os dados dos volumes.

  • A configuração Disable Revision Counter é falsa. (É falsa por padrão.) Caso contrário, os usuários precisam verificar manualmente se os dados entre as réplicas dos volumes estão consistentes, ou restaurar os volumes diretamente do backup.

Expectativa:

  • Todas as configurações e as configurações de nós e discos serão restauradas.

  • Desde que os dados válidos ainda existam, os volumes podem ser recuperados sem usar um backup. Em outras palavras, tentaremos evitar restaurar backups, o que pode ajudar a reduzir o Tempo de Recuperação Objetivo (RTO) e também economizar largura de banda.

  • Detectar as réplicas inválidas ou fora de sincronia, desde que o volume relacionado ainda contenha uma réplica válida após a restauração.

Comportamentos e Requisitos da restauração do Rancher

  • Você precisa reiniciar os componentes do Kubernetes em todos os nós. Caso contrário, haverá muitos conflitos de atualização de recursos no Longhorn.

Ações após a restauração

  • Reinicie todos os componentes do Kubernetes para todos os nós. Veja o link acima para mais detalhes.

  • Mate todos os pods do Longhorn Manager, e o Kubernetes os reiniciará automaticamente. Aguarde os conflitos nos pods do Longhorn Manager desaparecerem.

  • Todos os volumes podem ser reanexados. Se um volume Longhorn for usado por um único pod, os usuários precisam desligá-lo e, em seguida, recriá-lo. Para Implantações (Deployments) ou Statefulsets, o Longhorn irá automaticamente encerrar e reiniciar os pods relacionados.

  • Se o seguinte acontecer após o instantâneo e antes da restauração do cluster:

    • Um volume não é alterado: Os usuários não precisam fazer nada.

    • Os dados são atualizados: Os usuários normalmente não precisam fazer nada. O Longhorn irá automaticamente falhar as réplicas que não contêm os dados mais recentes.

    • Um novo volume é criado: Este volume desaparecerá após a restauração. Os usuários precisam recriar um novo volume, lançar um volume de réplica única com base na réplica do volume desaparecido e, em seguida, transferir os dados para o novo volume.

    • Um volume é excluído: Como os dados são limpos quando o volume é removido, o volume restaurado não contém dados. Os usuários podem precisar excluí-lo novamente.

    • Para volumes de DR: Os usuários não precisam fazer nada. O Longhorn irá refazer uma restauração completa.

    • Algumas operações são aplicadas a um volume:

      • Backup: As informações de backup do volume devem ser ressincronizadas automaticamente.

      • Instantâneo: As informações do instantâneo do volume devem ser ressincronizadas assim que o volume for anexado.

      • Reconstrução de réplica e remoção de réplica:

        • Se houver novas réplicas reconstruídas, essas réplicas desaparecerão do sistema Longhorn após a restauração. Os usuários precisam limpar os dados da réplica manualmente ou usar os diretórios de dados dessas réplicas para exportar um único volume de réplica e, em seguida, fazer a recuperação de dados, se necessário.

        • Se houver algumas réplicas falhadas/removidas e houver pelo menos uma réplica saudável, essas réplicas falhadas/removidas voltarão após a restauração. Então, o Longhorn pode detectar que essas réplicas restauradas não contêm dados e copiar os dados mais recentes da réplica saudável para essas réplicas.

        • Se todas as réplicas forem substituídas por novas réplicas após o instantâneo, o volume conterá apenas réplicas inválidas após a restauração. Então, os usuários precisam exportar um volume de réplica única para a recuperação de dados.

      • Atualização da imagem do mecanismo: Os usuários precisam refazer o upgrade.

      • Expansão: O tamanho especificado do volume será menor do que o tamanho atual. Isso é como alguém solicitando a redução do volume, mas na verdade o Longhorn se recusará a lidar com isso internamente. Para recuperar o volume, os usuários precisam reduzir as cargas de trabalho e refazer a expansão.

    • Aviso: Se os usuários não souberem como recuperar um volume problemático, a maneira mais simples é sempre restaurar um novo volume a partir do backup.

  • Se o sistema Longhorn for atualizado após o instantâneo, as novas configurações e as modificações na configuração do nó desaparecerão. Os usuários precisam refazer o upgrade, e então modificar novamente as configurações e as configurações do nó.

  • Se um nó for excluído do sistema Longhorn após o instantâneo, o nó não voltará, mas os pods no nó removido serão restaurados. Os usuários precisam limpá-los manualmente, pois esses pods podem ficar presos no estado Terminating.

  • Se um nó for adicionado ao sistema Longhorn após o instantâneo, o Longhorn deve relançar automaticamente todas as cargas de trabalho necessárias no nó após a restauração do cluster. Mas os usuários devem estar cientes de que todas as novas réplicas ou mecanismos neste nó serão removidos após a restauração.

Referências