Este documento foi traduzido usando tecnologia de tradução automática de máquina. Sempre trabalhamos para apresentar traduções precisas, mas não oferecemos nenhuma garantia em relação à integridade, precisão ou confiabilidade do conteúdo traduzido. Em caso de qualquer discrepância, a versão original em inglês prevalecerá e constituirá o texto official.

Monitoramento da saúde do disco

Métricas de saúde do disco

A partir da versão SUSE Storage v1.11.0, as métricas de monitoramento da saúde do disco estão disponíveis para os motores de dados V1 e V2. Essas métricas fornecem insights sobre o status da saúde do disco.

  • SUSE Storage coleta dados de saúde a cada 10 minutos.

  • Certos ambientes virtualizados ou em nuvem (por exemplo, AWS EBS) não expõem todos os dados SMART, resultando em valores zero para certos atributos.

  • Os atributos de saúde disponíveis variam dependendo do tipo de disco e do hardware.

  • O conjunto completo de dados de saúde coletados está disponível em nodes.longhorn.io recursos personalizados (CRs).

Fontes de dados

  • Motor de dados V1: Os dados de saúde são coletados usando a ferramenta de monitoramento SMART (smartctl).

  • Motor de dados V2:

    • Discos NVMe: Os dados de saúde são recuperados através do SPDK.

    • Discos AIO: Os dados de saúde são coletados usando a ferramenta de monitoramento SMART (smartctl).

Os dados de saúde são obtidos de maneira diferente dependendo do tipo de disco:

  • Discos V1 e discos AIO V2: via SMART

  • Discos NVMe V2: via SPDK

Os atributos e formatos disponíveis variam conforme o tipo de disco e hardware. Para obter detalhes:

Atributos de saúde

A métrica longhorn_disk_health_attribute_raw expõe valores brutos de atributos com os seguintes rótulos:

  • attribute: Nome do atributo.

  • attribute_id: ID do atributo, quando fornecido pelo método de coleta.

  • disk: Identificador do disco Longhorn.

  • node: Nome do nó.

Os dados SMART podem não estar disponíveis em todas as plataformas, especialmente em provedores de nuvem. Se o SMART não for suportado, as métricas de saúde aparecem como 0.

Referências

  • Problema relacionado no GitHub #12016.