Solução de problemas

Guia rápido de solução de problemas

Aqui está um guia rápido para solucionar a inicialização do SUSE Observability:

Verifique se a instalação foi concluída com sucesso e se a versão está listada:
```
helm list --namespace suse-observability
```
Verifique se todos os pods no namespace do SUSE Observability estão em execução:
```
kubectl get pods
```
Em uma primeira implantação, pode ser que os contêineres em vários pods reiniciem algumas vezes, pois estão aguardando outros pods iniciarem e estarem no estado ready. Isso pode ser atrasado devido a agendamento e atrasos no download da imagem do docker.

Pods que estão no estado pending geralmente indicam um problema:
- O pod não pode ser agendado devido à falta de recursos no cluster. Se um autoescalador de cluster estiver ativo, ele geralmente conseguirá resolver isso automaticamente; caso contrário, é necessária intervenção manual para adicionar mais nós ao cluster.
- O pod não pode ser agendado, existem nós nos quais ele se encaixaria, mas esses nós têm taints que o pod não tolera. Para resolver isso, mais nós podem ser adicionados que não têm as taints, mas o SUSE Observability também pode ser configurado para tolerar certas taints e rodar nos nós com taints.
- O pod está aguardando que os Volumes Persistentes (PVs) sejam montados. Uma causa pode ser que o Helm chart do SUSE Observability não especifique um storageClassName, mas dependa do cluster ter uma classe de armazenamento padrão. Quando não há padrão para o cluster, é necessário especificar uma classe de armazenamento através dos valores do Helm do SUSE Observability.
  
  Para pods com estado ImagePullBackOff, verifique também a mensagem de erro exata; causas comuns são:
- Um nome de usuário/senha incorretos usados para puxar as imagens
- A conexão com o registro do docker falhou, isso pode ser devido a problemas de autenticação ou problemas de conectividade (gateways de segurança, instalações air-gapped)
- Um erro de digitação na URL do registro de imagem do docker substituído
Para descobrir uma causa mais detalhada para os estados Pending, ImagePullBackOff ou CrashLoopBackOff, use este comando:

+
```
kubectl describe pod <pod-name>
```
+ A saída contém uma seção event no final que geralmente contém o problema. Ele também possui uma seção State para cada contêiner que contém mais detalhes sobre a terminação do contêiner.
Quando você é um cliente prime, entre em contato com o suporte da SUSE Observability pelo https://scc.suse.com/ para obter ajuda na configuração do SUSE Observability em seu cluster local. Use Pacote de Suporte (Logs) para coletar informações sobre sua instância para a equipe de suporte.
Se o problema estiver relacionado ao desempenho, execute Pacote de Suporte (Desempenho) para investigar ativamente o desempenho.
Caso os passos acima não tenham resolvido o problema, há um Guia Avançado de Solução de Problemas disponível.