Ce document a été traduit à l'aide d'une technologie de traduction automatique. Bien que nous nous efforcions de fournir des traductions exactes, nous ne fournissons aucune garantie quant à l'exhaustivité, l'exactitude ou la fiabilité du contenu traduit. En cas de divergence, la version originale anglaise prévaut et fait foi.

Surveillance de l’état de santé du disque

Métriques de santé du disque

À partir de SUSE Storage v1.11.0, les métriques de surveillance de la santé du disque sont disponibles pour les moteurs de données V1 et V2. Ces métriques fournissent des informations sur l’état de santé du disque.

  • SUSE Storage collecte des données de santé toutes les 10 minutes.

  • Certains environnements virtualisés ou cloud (par exemple, AWS EBS) n’exposent pas toutes les données SMART, ce qui entraîne des valeurs nulles pour certains attributs.

  • Les attributs de santé disponibles varient en fonction du type de disque et du matériel.

  • L’ensemble complet des données de santé collectées est disponible dans les nodes.longhorn.io ressources personnalisées (CR).

Sources de données

  • Moteur de données V1: Les données de santé sont collectées à l’aide de l’outil de surveillance SMART (smartctl).

  • Moteur de données V2:

    • Disques NVMe: Les données de santé sont récupérées via SPDK.

    • Disques AIO: Les données de santé sont collectées à l’aide de l’outil de surveillance SMART (smartctl).

Les données de santé sont obtenues différemment selon le type de disque :

  • Disques V1 et disques AIO V2 : via SMART

  • Disques NVMe V2 : via SPDK

Les attributs et formats disponibles varient selon le type de disque et le matériel. Pour plus de détails :

Attributs de santé

La métrique longhorn_disk_health_attribute_raw expose les valeurs d’attribut brutes avec les étiquettes suivantes :

  • attribute : Nom de l’attribut.

  • attribute_id : ID d’attribut, lorsqu’il est fourni par la méthode de collecte.

  • disk : Identifiant de disque Longhorn.

  • node : Nom du nœud.

Les données SMART peuvent ne pas être disponibles sur toutes les plateformes, en particulier chez les fournisseurs de cloud. Si SMART n’est pas pris en charge, les métriques de santé apparaissent comme 0.

Références

  • Problème GitHub associé #12016.