Comment détecter les pannes de SSD grâce aux commandes SMART avancées

Dernière mise à jour: 01/12/2025

  • SMART vous permet d'anticiper les pannes prévisibles des disques SSD/HDD en lisant les attributs critiques et en exécutant des autotests courts et longs.
  • Windows, macOS et Linux offrent des méthodes et applications natives (CrystalDiskInfo, GSmartControl) pour vérifier l'état et la température.
  • SMART ne couvre pas toutes les pannes : il combine la surveillance avec les sauvegardes, la redondance et les remplacements planifiés.
Détectez les défauts de votre SSD grâce aux commandes SMART.

Si la santé de votre stockage vous préoccupe, vous êtes au bon endroit : avec le Technologie SMART Vous pouvez anticiper les pannes critiques de vos disques SSD et HDD et sauvegarder vos données à temps. Cet article vous l'explique. Comment détecter les défauts de votre SSD à l'aide des commandes SMART.

Au-delà de la simple curiosité, la surveillance de l'état du disque est essentielle pour garantir la disponibilité de l'information Prévoyez la capacité et les performances. Une panne inattendue de disque dur peut perturber vos services, nuire à votre réputation et vous coûter de l'argent. Et même si un SSD est plus silencieux qu'un disque dur, ses symptômes existent bel et bien : baisses de vitesse, erreurs de frappe ou une perte de données due à l'usure de la cellule.

Qu'est-ce que SMART et que peut (et ne peut pas) faire ?

SMART est un acronyme pour Technologie d’autosurveillance, d’analyse et de rapportUne série de routines du micrologiciel surveillent les variables internes du disque et émettent des alertes en cas de risque de panne. Leur objectif est clair : vous donner le temps de sauvegarder vos données et de remplacer le disque avant que le problème ne survienne.

Pour l'utiliser, il est nécessaire que le carte mère (BIOS/UEFI) Le disque lui-même est compatible SMART et cette fonctionnalité est activée. Aujourd'hui, il est quasiment universel en SATA, SAS, SCSI et NVMe, et les systèmes d'exploitation modernes interagissent avec lui sans problème.

Les paramètres qu'il mesure comprennent tout : température, secteurs réaffectés, erreurs CRCTemps de démarrage du moteur, erreurs de lecture/écriture non corrigibles, nombre de secteurs en attente, vitesse d'accès et des dizaines d'autres attributs. Chaque constructeur définit et normalise ses propres tableaux, avec des seuils et des valeurs acceptables.

Important : SMART ne fait pas de magie. Il vous avertit seulement. défaillances prévisibles (usure, problèmes mécaniques progressifs, blocs NAND détériorés). Il ne peut pas l'anticiper. événements abrupts comme les surtensions ou les dommages électroniques soudains. Des études telles que celles menées par Google et Backblaze montrent que certaines fonctionnalités sont utiles, mais Elles ne couvrent pas 100 % des pannes..

Détection des pannes SSD avec les commandes SMART

Linux : smartmontools, commandes clés et tests

Sous Linux, le paquet smartmontools comprend deux parties : smartctl (outil console pour les requêtes et les tests) et intelligent (Un démon qui surveille et alerte via syslog ou par e-mail). Il est gratuit et compatible avec SATA, SCSI, SAS et NVMe.

Installation (exemple Debian/Ubuntu) : sudo apt install smartmontoolsDans d'autres distributions, il utilise le gestionnaire correspondant ; sa disponibilité sous Linux et BSD est répandue et Cela ne devrait pas vous poser de problèmes..

Contenu exclusif - Cliquez ici  Lenovo présente ses lunettes IA Visual AI Glasses V1

Commencez par localiser les unités. Vous pouvez lister les assemblages avec df -h ou identifier les disques et les partitions avec sudo fdisk -lN'oubliez pas : smartctl agit sur le périphérique, et non sur la partition ; c'est-à-dire sur /dev/sdX ou /dev/nvmeXnY.

Commandes essentielles avec smartctl pour commencer pour travailler avec SMART sur un disque spécifique :

  • Vérifier le support et l'état SMART: sudo smartctl -i /dev/sda
  • Activez SMART S'il est désactivé : sudo smartctl -s on /dev/sda
  • Afficher tous les attributs et les journaux: sudo smartctl -a /dev/sda
  • Autotest court (rapide): sudo smartctl -t short /dev/sda
  • Autotest long (exhaustif) : sudo smartctl -t long /dev/sda
  • Résumé de santé: sudo smartctl -H /dev/sda

Planifiez le test court chaque semaine et le test long chaque mois avec cron pour minimiser l'impact et disposer de données historiquesEffectuez les tests tôt le matin ou pendant les périodes de faible charge ; lors d’un test long, vous remarquerez augmentation de la latence et baisse des IOPS.

Conventions d'appellation des périphériques sous Linux

Selon le contrôleur et l'interface, différents chemins s'afficheront. Voici quelques exemples courants pour la reconnaissance des lecteurs et des contrôleurs : /dev/sd, /dev/nvmen, /dev/sg*Outre les routes spécifiques sur les contrôleurs 3ware ou HP (cciss/hpsa), la compréhension de la route exacte permet d'éviter analyser le dispositif incorrect.

Erreurs et journaux typiques (ATA/SCSI/NVMe)

SMART conserve un historique des erreurs récentes et les affiche sous forme décodée. ATA Vous verrez les cinq dernières erreurs avec leurs statuts et codes ; dans SCSI Les compteurs d'échecs de lecture, d'écriture et de vérification sont répertoriés ; dans NVMe Les entrées du journal des erreurs sont imprimées (par défaut les 16 plus récentes).

Abréviations courantes dans les messages d'erreur (utiles pour un diagnostic rapide) : ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPS'ils apparaissent de manière répétée, il y a un problème physique ou de connexion enquêter.

Il est également important d'identifier les attributs critiques par leur identifiant, qui sont souvent corrélés à des défaillances imminentes : 05, 10, 183, 184, 188, 196, 197, 198, 201, 230Une augmentation durable de l'un de ces indicateurs est un mauvais signe.

Attributs SMART : comment les interpréter et lesquels privilégier

Les programmes affichent chaque paramètre avec plusieurs champs. Cela inclut généralement Identifiant (1-250), seuil, valeur, pire et données brutes, en plus des indicateurs (critique, statistique, etc.). La valeur normalisée commence à une valeur élevée et diminue avec l'utilisationLe dépassement du seuil déclenche l'avertissement.

Parmi les attributs les plus utiles pour détecter l'usure ou les dommages, on peut citer : Secteur_relocalisé_Ct (secteurs réaffectés), Secteur en attente actuel (secteurs en attente instables), Hors ligne_Non corrigible (erreurs sans correction hors ligne), Nombre d'événements déplacés (événements de réaffectation) et, sur disque dur, Nombre de tentatives de rotation (tentatives de redémarrage du moteur). Ces tentatives concernent les disques SSD. Nombre de nivellement d'usure y Échecs de programmation/effacement.

Contenu exclusif - Cliquez ici  Comment débloquer le clavier d'un HP Elitebook ?

La température fait débat, mais maintenir l'unité en dessous 60 ° C Cela réduit le risque d'erreurs. Vérifiez la circulation d'air du châssis et, si nécessaire, ajoutez des dissipateurs thermiques NVMe aux disques M.2. éviter la limitation de débit et la dégradation.

Vérifiez le disque

Windows : WMIC, PowerShell et CHKDSK

Pour une vérification rapide sur les systèmes Windows, vous pouvez utiliser la console classique avec WMIC ou PowerShell, sans rien installer de plus, et compléter ensuite avec un outil SMART plus complet si nécessaire.

Avec l'invite de commandes en tant qu'administrateur, exécutez : wmic diskdrive get model, statusSi la réponse est « OK », l’état SMART est correct ; si vous voyez Échec de la prévisionIl existe des paramètres critiques et c'est pertinent Faites-en une copie et réfléchissez à un remplacement..

Dans PowerShell, démarrez en tant qu'administrateur et lancez : Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatus. La campagne État de santé vous indiquera si c'est bon pour la santé, si c'est un avertissement ou si c'est mauvais pour la santé, ce qui est utile pour détecter les problèmes en un coup d'œil.

Pour rechercher et corriger les erreurs logiques du système de fichiers, utilisez CHKDSK. Exécutez la commande suivante dans la console avec des privilèges élevés : chkdsk C: /f /r /x pour diagnostiquer les erreurs, localiser les secteurs défectueux et démonter le disque si nécessaire ; si vous avez besoin d’un guide pour Réparer Windows après une infection virale graveDécouvrez-le dès maintenant. Sous NTFS, vous pouvez utiliser chkdsk /scan pour l'analyse en ligne.

macOS : Utilitaire de disque et Terminal

Sur un Mac, vous avez deux solutions très simples. D'une part, Utilitaire de disque (Applications > Utilitaires) : Sélectionnez le lecteur physique et appuyez sur Premiers secours pour réparer le système de fichiers ; de plus, vous verrez le Statut SMART par exemple : Vérifié ou Échec.

Si vous préférez le Terminal, exécutez diskutil info /Volumes/NombreDeTuDisco et cherchez la ligne de État SMARTSi la mention « Vérifié » apparaît, respirez ; mais… sauvegarde immédiate et envisagez un changement.

Suppléments Linux : dmesg, /sys et interface graphique avec GSmartControl

Outre smartctl, il est utile de consulter le journal du noyau pour rechercher les éléments suivants : Erreurs d'E/S ou les délais d'attente du contrôleur. Un filtre rapide serait : dmesg | grep -i erroret le complète avec des termes comme failed o timeout.

Pour obtenir des informations de base sur l'appareil, vous pouvez consulter les chemins système tels que : /sys/block/sdX/device/model ou des statistiques de /sys/block/sdX/statUtile quand vous le souhaitez vérifier l'activité et le modèle sans outils externes.

Si vous préférez une interface graphique, installez Contrôle intelligent G (par exemple: sudo apt install -y gsmartcontrol) et exécutez-le avec des privilèges d'administrateur. Cela vous permet de Consultez les attributs, exécutez des tests courts/longs et exportez des rapports en quelques clics.

HD Tune

Outils tiers recommandés

Pour aller au-delà des fonctions de base lors de la détection des défauts de votre SSD avec les commandes SMART, vous disposez de quelques utilitaires très populaires :

  • CrystalDiskInfo (Windows) est gratuit, clair et compatible avec les disques SATA et NVMe internes et externes ; il affiche les attributs SMART, les températures et les heures d'utilisation.
  • HD Tune Il ajoute des cartes sectorielles et des tests de vitesse (il existe une version payante).
  • Disque dur Sentinel Elle se concentre sur la surveillance continue, les alertes avancées et les rapports ; sa version gratuite est limitée mais très performante pour l’interprétation des données SMART.
  • Contrôle intelligent G Il est gratuit et permet d'exécuter des tests et de visualiser des attributs grâce à une interface graphique.
Contenu exclusif - Cliquez ici  Comment connecter une batterie de voiture

Signes indiquant que votre SSD ou HDD est en fin de vie

Liste des symptômes courants : Démarrages lents, arrêts inattendus, écrans bleus de la mort (BSOD ou panique du noyau)Des fichiers qui ne s'ouvrent pas ou qui sont corrompus, l'impossibilité d'installer ou de mettre à jour, et des disques qui disparaissent du système ou du BIOS/UEFI.

Sur les disques durs, les bruits mécaniques (clics, grincements, bourdonnements) sont mauvais signe. Sur les SSD, vérifiez la présence d'erreurs d'écriture. erreurs lors du montage des volumes et une augmentation du nombre de secteurs réaffectés ou du taux de roulement du personnel. Si les problèmes sont intermittents, ne vous reposez pas sur vos lauriers : Faites-en une copie maintenant.

Acheter intelligemment : ce qu'il faut rechercher lors du choix de nouveaux disques

Elle valorise les marques jouissant d'une bonne réputation (Seagate, WD, Toshiba, Samsung), type d'unité (SSD pour la vitesse, HDD pour la capacité), interface (SATA, NVMe en M.2/PCIe), cache et dissipation thermique. capacidad Il est conseillé de le surestimer légèrement par rapport à vos besoins réels.

Vérifiez le durabilité déclarée (TBW sur SSD, garanties, MTBF à prendre avec précaution), le utilisation prévue (Les modèles NAS sont souvent plus performants et gèrent mieux le RAID) et le budget : parfois, payer un peu plus cher vous permet de… la tranquillité d'esprit et une vie utile.

Limites de SMART : contexte et études

SMART est utile mais imparfait : il existe incohérences entre les fabricants Dans les définitions et les normalisations, certains attributs sont très précieux (réaffecté, en attente, non corrigible), tandis que d'autres sont peu utiles. Backblaze souligne que seuls une poignée d'attributs Cela présente une forte corrélation avec les échecs, et Google a montré des cas de défaillances sans préavis.

Qu'est-ce que cela signifie ? Cela signifie que SMART aide à anticiper de nombreux problèmes, mais votre stratégie doit les combiner. surveillance, redondance (RAID), sauvegardes et restaurationNe vous fiez pas uniquement à un feu vert.

Si l'outil ou le système signale Avertissement/Échec prévisible/Mauvais pour la santé1) Copiez autant que possible maintenant, 2) Validez avec un autre utilitaire pour confirmer, 3) Planifiez le remplacement immédiatAprès avoir effectué la modification, vérifiez le RAID si nécessaire pour éviter risques de reconstruction.

S'en tenir à l'essentiel aide à : SMART vous avertit de nombreux problèmes à venir.Mais pas toutes ; la méthode la plus efficace consiste à la combiner avec des tests planifiés, des sauvegardes fiables et une politique de remplacement claire lorsque les indicateurs critiques commencent à évoluer.

Comment nettoyer le registre Windows sans rien casser
Article connexe:
Comment nettoyer le registre Windows sans rien casser