Sådan registrerer du SSD-fejl med avancerede SMART-kommandoer

Sidste ændring: 01/12/2025
Forfatter: Daniel Terrasa

  • SMART giver dig mulighed for at forudse forudsigelige SSD/HDD-fejl ved at aflæse kritiske attributter og køre korte og lange selvtests.
  • Windows, macOS og Linux tilbyder native metoder og apps (CrystalDiskInfo, GSmartControl) til at kontrollere tilstand og temperatur.
  • SMART dækker ikke alle fejl: det kombinerer overvågning med sikkerhedskopier, redundans og planlagte udskiftninger.
Find fejl i din SSD med SMART-kommandoer

Hvis du er bekymret for din lagerplads, er du kommet til det rette sted: med SMART-teknologi Du kan forudse kritiske SSD- og HDD-fejl og redde dine data i tide. Denne artikel forklarer. Sådan finder du fejl på din SSD ved hjælp af SMART-kommandoer.

Ud over ren nysgerrighed er det vigtigt at overvåge diskens tilstand. garantere tilgængeligheden af ​​information og planlæg for kapacitet og ydeevne. En harddisk, der uventet svigter, kan forstyrre tjenester, skade dit omdømme og koste dig penge. Og selvom en SSD ikke larmer lige så meget som en harddisk, findes der symptomer: hastighedsfald, skrivefejl eller datatab på grund af celleslid.

Hvad er SMART, og hvad kan (og ikke kan) gøre

SMART er et akronym for Teknologi til selvovervågning, analyse og rapporteringEn række rutiner i firmwaren overvåger interne diskvariabler og udsender advarsler, når de registrerer en risiko for fejl. Deres mål er klart: at give dig tid til at sikkerhedskopiere dine data og udskifte drevet, før katastrofen rammer.

For at bruge det er det nødvendigt, at bundkort (BIOS/UEFI) og selve drevet understøtter og har SMART aktiveret. I dag er det praktisk talt universelt i SATA, SAS, SCSI og NVMe, og moderne operativsystemer interagerer med det uden problemer.

De parametre, den måler, omfatter alt: temperatur, omtildelte sektorer, CRC-fejlMotorens omdrejningstid, ukorrigerbare læse-/skrivefejl, antal ventende sektorer, søgehastighed og dusinvis af andre attributter. Hver producent definerer og standardiserer sine tabeller med tærskler og acceptable værdier.

Vigtigt: SMART udfører ikke magi. Den advarer dig kun. forudsigelige fejl (slid, progressive mekaniske problemer, forringede NAND-blokke). Den kan ikke forudse pludselige begivenheder såsom strømstød eller pludselig elektronisk skade. Undersøgelser som dem fra Google og Backblaze viser, at nogle funktioner er nyttige, men De dækker ikke 100% af fejlene.

Registrer SSD-fejl med SMART-kommandoer

Linux: smartmontools, nøglekommandoer og tests

I Linux indeholder smartmontools-pakken to dele: smartctl (konsolværktøj til forespørgsler og tests) og smartd (en daemon, der overvåger og advarer via syslog eller e-mail). Den er gratis og kompatibel med SATA, SCSI, SAS og NVMe.

Installation (eksempel Debian/Ubuntu): sudo apt install smartmontoolsI andre distributioner bruger den den tilsvarende manager; tilgængeligheden i Linux og BSD er udbredt og Det burde ikke give dig nogen problemer..

Eksklusivt indhold - Klik her  Sådan konfigureres Google Home Mini

Find først enhederne. Du kan liste samlinger med df -h eller identificer diske og partitioner med sudo fdisk -lHusk: smartctl virker på enheden, ikke på partitionen; det vil sige på /dev/sdX eller /dev/nvmeXnY.

Vigtige kommandoer med smartctl til starten at arbejde med SMART på en specifik disk:

  • Tjek SMART-support og status: sudo smartctl -i /dev/sda
  • Aktivér SMART Hvis den er deaktiveret: sudo smartctl -s on /dev/sda
  • Se alle attributter og logfiler: sudo smartctl -a /dev/sda
  • Kort selvtest (hurtig): sudo smartctl -t short /dev/sda
  • Lang selvtest (omfattende): sudo smartctl -t long /dev/sda
  • Sundhedsoversigt: sudo smartctl -H /dev/sda

Planlæg den korte test hver uge og den lange test hver måned med cron til minimere påvirkningen og have historiske dataKør testene tidligt om morgenen eller i perioder med lav belastning; under en lang test vil du bemærke øget latenstid og fald i IOPS.

Navngivningskonventioner for enheder i Linux

Afhængigt af controlleren og grænsefladen vil du se forskellige stier. Nogle almindelige eksempler på genkendelse af drev og controllere: /dev/sd, /dev/nvmen, /dev/sg*Ud over specifikke ruter på 3ware- eller HP-controllere (cciss/hpsa) forhindrer forståelsen af ​​den nøjagtige rute analyser den forkerte enhed.

Typiske fejl og logfiler (ATA/SCSI/NVMe)

SMART gemmer logfiler over nylige fejl og viser dem i afkodet form. ATA Du vil se de sidste fem fejl med statusser og koder; i SCSI Læse-, skrive- og verifikationsfejltællere er angivet; NVMe Fejllogposter udskrives (som standard de 16 seneste).

Almindelige forkortelser i fejloutput (nyttigt til hurtig diagnose): ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPHvis de optræder gentagne gange, er der en fysisk problem eller forbindelsesproblem at undersøge.

Det er også vigtigt at identificere kritiske attributter ved hjælp af ID, som ofte korrelerer med forestående fejl: 05, 10, 183, 184, 188, 196, 197, 198, 201, 230En vedvarende stigning i nogen af ​​dem er et dårligt tegn.

SMART-attributter: hvordan man læser dem, og hvilke man skal være opmærksom på

Programmerne viser hver parameter med flere felter. Det inkluderer normalt Identifikator (1-250), tærskel, værdi, værste og rådata, udover flag (uanset om det er kritisk, statistisk osv.). Den normaliserede værdi starter højt og aftager med brugOverskridelse af tærsklen udløser advarslen.

Blandt de mest nyttige egenskaber til at detektere slid eller skader kan man se på: Flyttet_sektor_Ct (omfordelte sektorer), Aktuel_afventende_sektor (ustabile ventende sektorer), Offline_Ukorrigerbar (fejl uden offline-korrektion), Antal_flyttede_hændelser (gentildelingshændelser) og, på harddisken, Antal_genforsøg_forsøg (genstartforsøg på motoren). Disse er relevante på SSD'er. Slidniveauantal y Program-/sletningsfejl.

Eksklusivt indhold - Klik her  Sådan åbner du Enhedshåndtering?: Trinbrugsvejledning

Temperaturen er kontroversiel, men at holde enheden under 60 ° C Dette reducerer sandsynligheden for fejl. Kontroller kabinettets luftgennemstrømning, og tilføj om nødvendigt NVMe-køleplader til M.2-drevene. undgå nedregulering og forringelse.

check disk

Windows: WMIC, PowerShell og CHKDSK

For en hurtig kontrol af Windows-systemer kan du bruge den klassiske konsol med Wmic eller PowerShell, uden at installere noget yderligere, og derefter supplere med et mere omfattende SMART-værktøj, hvis det er nødvendigt.

Med kommandoprompten som administrator, kør: wmic diskdrive get model, statusHvis den returnerer OK, er SMART-status korrekt; hvis du ser Forudgående fejlDer er kritiske parametre, og det er relevant Lav en kopi og overvej en erstatning..

I PowerShell skal du starte som administrator og køre: Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatusFeltet Sundhedsstatus vil vise dig Sund, Advarsel eller Usund, nyttigt for opdage problemer med et hurtigt blik.

For at kontrollere og reparere fejl i logiske filsystemer skal du bruge CHKDSK. Kør følgende kommando i konsollen med forhøjede rettigheder: chkdsk C: /f /r /x til at foretage fejlfinding, finde dårlige sektorer og adskille drevet, hvis det er nødvendigt; hvis du har brug for en vejledning til Reparer Windows efter en alvorlig virusTjek det ud nu. I NTFS kan du bruge chkdsk /scan til onlineanalyse.

macOS: Diskværktøj og Terminal

På en Mac har du to meget simple muligheder. På den ene side, Diskværktøj (Programmer > Hjælpeprogrammer): Vælg det fysiske drev, og tryk på førstehjælp at reparere filsystemet; derudover vil du se SMART-status såsom Bekræftet eller Mislykket.

Hvis du foretrækker Terminal, så kør diskutil info /Volumes/NombreDeTuDisco og kig efter linjen af SMART-statusHvis Verificeret er angivet, så træk vejret; men, øjeblikkelig backup og overvej at foretage en ændring.

Linux-ekstra: dmesg, /sys og GUI med GSmartControl

Ud over smartctl er det nyttigt at tjekke kernelloggen for et af følgende: I/O-fejl eller timeouts for controllere. Et hurtigt filter ville være: dmesg | grep -i errorog supplerer det med udtryk som failed o timeout.

For grundlæggende enhedsoplysninger kan du læse systemstier som f.eks. /sys/block/sdX/device/model eller statistikker over /sys/block/sdX/statNyttig når du vil verificer aktivitet og model uden eksterne værktøjer.

Hvis du foretrækker en grafisk brugerflade, skal du installere GSmartControl (for eksempel: sudo apt install -y gsmartcontrol) og køre det med administratorrettigheder. Det giver dig mulighed for at Se attributter, kør korte/lange tests og eksporter rapporter med et par klik.

HD Tune

Anbefalede tredjepartsværktøjer

For at gå ud over det grundlæggende, når du registrerer fejl i din SSD med SMART-kommandoer, har du nogle meget populære værktøjer:

  • CrystalDiskInfo (Windows) er gratis, overskuelig og kompatibel med intern og ekstern SATA og NVMe; den viser SMART-attributter, temperaturer og brugstimer.
  • HD Tune Den tilføjer sektorkort og hastighedstest (den har en betalt version).
  • Hard Disk Sentinel Den fokuserer på kontinuerlig overvågning, avancerede advarsler og rapporter; den gratis version er begrænset, men meget effektiv til at fortolke SMART.
  • GSmartControl Det er gratis og giver dig mulighed for at køre tests og se attributter med en grafisk brugerflade.
Eksklusivt indhold - Klik her  Sådan tilslutter du og bruger et trådløst headset med mikrofon på din PlayStation 4

Tegn på, at din SSD eller harddisk er ved at være på sit sidste ben

Angiv almindelige symptomer: Langsom opstart, uventede nedlukninger, blå skærme (BSoD eller kernel panic)Filer der ikke kan åbnes eller bliver beskadiget, manglende evne til at installere eller opdatere, og drev der forsvinde fra systemet eller BIOS/UEFI.

På harddiske er mekaniske lyde (klik, knirken, summen) et dårligt tegn. På SSD'er skal du kigge efter skrivefejl. fejl ved montering af volumener og en stigning i omfordelte sektorer eller frafald. Hvis problemerne er periodiske, skal du ikke være selvtilfreds: Lav en kopi nu.

Køb smart: Hvad skal man kigge efter, når man vælger nye plader

Den værdsætter mærker med et godt omdømme (Seagate, WD, Toshiba, Samsung), tipo de unidad (SSD for hastighed, HDD for kapacitet), interface (SATA, NVMe i M.2/PCIe), cache og varmeafledning. kapacitet Det er tilrådeligt at overvurdere det en smule i forhold til dine faktiske behov.

Kontroller deklareret holdbarhed (TBW på SSD, garantier, MTBF med forsigtighed), den anvendelsesformål (NAS-modeller yder og håndterer ofte RAID bedre) og budget: nogle gange giver det dig lidt mere at betale ro i sindet og et nyttigt liv.

SMARTs begrænsninger: kontekst og studier

SMART er nyttigt, men ufuldkomment: der er uoverensstemmelser mellem producenter I definitioner og standardiseringer er nogle attributter meget værdifulde (omfordelte, afventende, ukorrigerbare), mens andre bidrager lidt. Backblaze påpeger, at kun en håndfuld attributter Det korrelerer godt med fejl, og Google viste eksempler på fejl uden forudgående varsel.

Hvad betyder det? Det betyder, at SMART hjælper med at forudse mange problemer, men din strategi skal kombinere overvågning, redundans (RAID), backup og gendannelseStol ikke bare på et grønt trafiklys.

Hvis værktøjet eller systemet rapporterer Advarsel/Forudsigelig fejl/Usund1) Kopier så meget som muligt nu, 2) Valider med et andet værktøj for at bekræfte, 3) Planlæg øjeblikkelig udskiftningEfter ændringen skal du kontrollere RAID'en om nødvendigt for at undgå rekonstruktionsrisici.

At holde sig til det væsentlige hjælper: SMART advarer dig om mange af de problemer, der er på vej.Men ikke alle; den smarte måde at arbejde på er at kombinere det med planlagte tests, gode sikkerhedskopier og en klar udskiftningspolitik, når kritiske indikatorer begynder at bevæge sig.

Sådan renser du Windows-registreringsdatabasen uden at ødelægge noget
relateret artikel:
Sådan renser du Windows-registreringsdatabasen uden at ødelægge noget