SSD-hibák észlelése fejlett SMART parancsokkal

Utolsó frissítés: 2023.10.03.

  • A SMART lehetővé teszi az előre látható SSD/HDD hibák előrejelzését a kritikus attribútumok kiolvasásával és rövid, valamint hosszú önellenőrzések futtatásával.
  • A Windows, a macOS és a Linux natív metódusokat és alkalmazásokat (CrystalDiskInfo, GSmartControl) kínál az állapot és a hőmérséklet ellenőrzésére.
  • A SMART nem fed le minden meghibásodást: a monitorozást biztonsági mentésekkel, redundanciával és tervezett cserékkel ötvözi.
SSD-hibák észlelése SMART parancsokkal

Ha aggódik a tárhelye állapota miatt, jó helyen jár: a Intelligens technológia Előre jelezheti a kritikus SSD és HDD meghibásodásokat, és időben mentheti adatait. Ez a cikk elmagyarázza. Hogyan észlelhetők hibák az SSD-n SMART parancsok segítségével.

A puszta kíváncsiságon túl a lemez állapotának ellenőrzése kulcsfontosságú garantálja az információk elérhetőségét és tervezzen a kapacitás és a teljesítmény tekintetében. Egy váratlanul meghibásodó merevlemez megzavarhatja a szolgáltatásokat, károsíthatja a hírnevét, és pénzbe kerülhet. És bár egy SSD nem ad ki akkora zajt, mint egy HDD, a tünetei mégis fennállnak: sebességcsökkenés, gépelési hibák vagy adatvesztés a cellák kopása miatt.

Mi az SMART, és mit tud (és mit nem tud) csinálni?

A SMART egy mozaikszó, ami a következőt jelenti: Önmegfigyelési, elemzési és jelentéskészítési technológiaA firmware-ben található rutinok sorozata figyeli a belső lemezváltozókat, és figyelmeztetéseket ad ki, ha meghibásodás kockázatát észlelik. Céljuk egyértelmű: időt adni az adatok biztonsági mentésére és a meghajtó cseréjére, mielőtt bekövetkezik a katasztrófa.

Használatához szükséges, hogy a alaplap (BIOS/UEFI) és maga a meghajtó támogatja és engedélyezve van a SMART. Ma már gyakorlatilag univerzális SATA, SAS, SCSI és NVMe szabványokban, és a modern operációs rendszerek problémamentesen kommunikálnak vele.

A mért paraméterek mindent tartalmaznak: hőmérséklet, áthelyezett szektorok, CRC hibákMotor felpörgési idő, javíthatatlan olvasási/írási hibák, függőben lévő szektorok száma, keresési sebesség és tucatnyi további attribútum. Minden gyártó meghatározza és szabványosítja táblázatait küszöbértékekkel és elfogadható értékekkel.

Fontos: A SMART nem hajt végre varázslatot. Csak figyelmeztet. kiszámítható kudarcok (kopás, progresszív mechanikai problémák, elhasználódott NAND blokkok). Nem tudja előre látni hirtelen események például áramcsúcsok vagy hirtelen elektronikus károk. A Google és a Backblaze tanulmányaihoz hasonló tanulmányok azt mutatják, hogy egyes funkciók hasznosak, de Nem fedezik a hibák 100%-át.

SSD hibák észlelése SMART parancsokkal

Linux: smartmontools, billentyűparancsok és tesztek

Linux alatt a smartmontools csomag két részből áll: smartctl (konzol eszköz lekérdezésekhez és tesztekhez) és okos (egy démon, amely rendszernaplón vagy e-mailen keresztül figyeli és riasztásokat küld). Ingyenes és kompatibilis a következővel: SATA, SCSI, SAS és NVMe.

Telepítés (például Debian/Ubuntu): sudo apt install smartmontoolsMás disztribúciókban a megfelelő kezelőt használja; Linux és BSD rendszereken széles körben elérhető, és Nem szabadna, hogy gondot okozzon..

Exkluzív tartalom – Kattintson ide  8 Asus alaplap hibakódja és jelentése

Először keresse meg az egységeket. Felsorolhatja az összeállításokat a df -h vagy azonosítsa a lemezeket és partíciókat sudo fdisk -lNe feledd: a smartctl az eszközre hat, nem a partícióra; azaz a /dev/sdX vagy /dev/nvmeXnY.

A smartctl alapvető parancsai kezdődik egy adott lemezen a SMART programmal való munkavégzéshez:

  • Ellenőrizze a SMART támogatást és állapotot: sudo smartctl -i /dev/sda
  • Aktiválja az SMART-ot Ha le van tiltva: sudo smartctl -s on /dev/sda
  • Az összes attribútum és napló megtekintése: sudo smartctl -a /dev/sda
  • Rövid önvizsgálat (gyors): sudo smartctl -t short /dev/sda
  • Hosszú önvizsgálat (átfogó): sudo smartctl -t long /dev/sda
  • Egészségügyi összefoglaló: sudo smartctl -H /dev/sda

Ütemezze be a rövid tesztet minden héten és a hosszú tesztet minden hónapban a cron használatával minimalizálja a hatást és rendelkezzen korábbi adatokkalVégezze el a teszteket kora reggel vagy alacsony terhelésű időszakokban; egy hosszú teszt során észre fogja venni megnövekedett késleltetés és IOPS-csökkenés.

Eszközelítési konvenciók Linuxban

A vezérlőtől és az interfésztől függően különböző elérési utakat fog látni. Néhány gyakori példa a meghajtók és vezérlők felismerésére: /dev/sd, /dev/nvmen, /dev/sg*A 3ware vagy HP vezérlőkön (cciss/hpsa) található specifikus útvonalakon túl a pontos útvonal ismerete megakadályozza a elemezze a helytelen eszközt.

Tipikus hibák és naplók (ATA/SCSI/NVMe)

A SMART naplózza a legutóbbi hibákat, és dekódolt formában jeleníti meg azokat. ATA Az utolsó öt hibát állapotokkal és kódokkal együtt fogja látni; SCSI Az olvasási, írási és ellenőrzési hibaszámlálók fel vannak sorolva; NVMe A hibanapló-bejegyzések kinyomtatásra kerülnek (alapértelmezés szerint a 16 legutóbbi).

Gyakori rövidítések a hibakimenetekben (gyors diagnózishoz hasznos): ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPHa ismételten megjelennek, akkor van egy fizikai vagy csatlakozási probléma hogy nyomozzon.

Fontos a kritikus attribútumok azonosítása is azonosító alapján, amelyek gyakran korrelálnak a közelgő hibákkal: 05, 10, 183, 184, 188, 196, 197, 198, 201, 230Bármelyikük tartós növekedése rossz jel.

SMART attribútumok: hogyan kell értelmezni őket, és melyikre kell figyelni

A programok minden paramétert több mezővel jelenítenek meg. Ez általában a következőket tartalmazza: Azonosító (1-250), Küszöbérték, Érték, Legrosszabb és Nyers adatok, a jelzők mellett (legyen szó kritikus, statisztikai stb.) A normalizált érték magasan kezdődik, és használattal csökkenA küszöbérték túllépése riasztást vált ki.

A kopás vagy sérülés észlelésének leghasznosabb jellemzői között a következőket érdemes figyelembe venni: Áthelyezett_Szektor_Ct (átcsoportosított szektorok), Jelenlegi_Függőben_Szektor (instabil függőben lévő szektorok), Offline_Javíthatatlan (offline javítás nélküli hibák), Áthelyezett_Esemény_Szám (áthozzárendelési események) és merevlemezen Pörgetés_Újrapróbálkozások_Számla (motorindítási újrapróbálkozások). Ezek SSD-k esetén relevánsak. Kopásszint-számláló y Programozási/törlési hibák.

Exkluzív tartalom – Kattintson ide  Hogyan telepítsek Windows 10-et egy MSI Gaming GE75-re?

A hőmérséklet vitatott, de a készülék tartása az alatt van 60 °C Ez csökkenti a hibák valószínűségét. Ellenőrizze a ház légáramlását, és ha szükséges, szereljen fel NVMe hűtőbordákat az M.2 meghajtókra. elkerülje a korlátozást és a degradációt.

lemez ellenőrzése

Windows: WMIC, PowerShell és CHKDSK

Windows rendszerek gyors ellenőrzéséhez használhatja a klasszikus konzolt a következővel: WMIC vagy PowerShell segítségével, további dolgok telepítése nélkül, majd szükség esetén kiegészíthető egy átfogóbb SMART eszközzel.

A Parancssorból rendszergazdaként futtassa a következőt: wmic diskdrive get model, statusHa az eredmény OK, akkor a SMART állapot helyes; ha a következőt látja: Pred FailVannak kritikus paraméterek, és ez releváns Készíts egy másolatot, és gondold át a cserét..

A PowerShellben indítsd el rendszergazdaként, és add meg: Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatus. Terület Egészségügyi állapot Egészséges, Figyelmeztető vagy Egészségtelen állapotot fog mutatni, hasznos a következők számára problémák észlelése egy pillantással.

A logikai fájlrendszer hibáinak kereséséhez és javításához használja a CHKDSK parancsot. Futtassa a következő parancsot a konzolon emelt szintű jogosultságokkal: chkdsk C: /f /r /x a hibák elhárításához, a hibás szektorok megtalálásához és szükség esetén a meghajtó szétszereléséhez; ha útmutatóra van szüksége Windows javítása súlyos vírusfertőzés utánNézd meg most. NTFS-ben használhatod chkdsk /scan online elemzéshez.

macOS: Lemezkezelő és Terminál

Macen két nagyon egyszerű útvonal közül választhatsz. Egyrészt, Lemezkezelő (Alkalmazások > Segédprogramok): Jelölje ki a fizikai meghajtót, és nyomja meg a gombot. Elsősegély a fájlrendszer javításához; ezen felül látni fogja a következőt: SMART állapot például Ellenőrzött vagy Sikertelen.

Ha a Terminált részesíted előnyben, futtasd diskutil info /Volumes/NombreDeTuDisco és keresd a sort SMART állapotHa a „Verified” szerepel a listán, lélegezz; de, azonnali biztonsági mentés és fontold meg a változtatást.

Linux extra: dmesg, /sys és grafikus felhasználói felület GSmartControl-lal

A smartctl mellett hasznos lehet a kernel naplóját is ellenőrizni a következők bármelyikére vonatkozóan: I/O hibák vagy vezérlő időtúllépések. Egy gyors szűrő a következő lenne: dmesg | grep -i errorés olyan kifejezésekkel egészíti ki, mint failed o timeout.

Az alapvető eszközadatokért elolvashatja a rendszerútvonalakat, például /sys/block/sdX/device/model vagy statisztikák /sys/block/sdX/statHasznos, amikor csak akarod ellenőrizze a tevékenységet és a modellt külső eszközök nélkül.

Ha grafikus felületet szeretne, telepítse GSmartControl (például: sudo apt install -y gsmartcontrol) és futtassa rendszergazdai jogosultságokkal. Lehetővé teszi a következőket: Attribútumok megtekintése, rövid/hosszú tesztek futtatása és jelentések exportálása pár kattintással.

HD hangolás

Ajánlott harmadik féltől származó eszközök

Az SSD hibáinak SMART parancsokkal történő észlelésekor az alapokon túl néhány nagyon népszerű segédprogram áll rendelkezésére:

  • CrystalDiskInfo (Windows) ingyenes, letisztult és kompatibilis a belső és külső SATA és NVMe meghajtókkal; megjeleníti a SMART attribútumokat, hőmérsékleteket és a használati órák számát.
  • HD hangolás Szektortérképeket és sebességteszteket ad hozzá (fizetős verziója van).
  • Merevlemez-őrszem A folyamatos monitorozásra, a fejlett riasztásokra és jelentésekre összpontosít; az ingyenes verziója korlátozott, de nagyon hatékony a SMART értelmezésében.
  • GSmartControl Ingyenes, és lehetővé teszi tesztek futtatását és az attribútumok megtekintését grafikus felületen.
Exkluzív tartalom – Kattintson ide  Hogyan cseréljük ki az LCD kijelzőt egy iPhone 4S-en?

Jelek, hogy az SSD vagy HDD a végét járja

Sorolja fel a gyakori tüneteket: Lassú rendszerindítások, váratlan leállások, kék képernyők a halálból (BSoD vagy kernel panic)Nem megnyitható vagy megsérülő fájlok, telepítési vagy frissítési nehézségek, valamint meghajtók, amelyek eltűnik a rendszerből vagy a BIOS/UEFI-ből.

HDD-ken a mechanikai zajok (kattanások, nyikorgás, zümmögés) rossz jelnek számítanak. SSD-ken írási hibákat keress. hibák kötetek csatolásakor és az áthelyezett szektorok vagy a lemorzsolódási számok növekedése. Ha a problémák időszakosak, ne legyünk önelégültek: Készítsen másolatot most.

Okos vásárlás: mire figyeljünk új lemezek vásárlásakor

Értékeli a jó hírnévvel rendelkező márkákat (Seagate, WD, Toshiba, Samsung), a tipo de unidad (SSD a sebességért, HDD a kapacitásért), csatlakozófelület (SATA, NVMe M.2/PCIe csatlakozóban), gyorsítótár és hőelvezetés. képesség Célszerű kissé túlbecsülni a tényleges igényeid felett.

Ellenőrizze a deklarált tartósság (TBW SSD-n, garanciák, MTBF óvatosan), a rendeltetésszerű használat (A NAS modellek gyakran jobban teljesítenek és kezelik a RAID-et) és a költségvetés: néha egy kicsit többet fizetve többet kapsz nyugalom és hasznos élet.

A SMART korlátai: kontextus és tanulmányok

A SMART hasznos, de tökéletlen: vannak ellentmondások a gyártók között A definíciókban és szabványosításokban egyes attribútumok nagyon értékesek (újrahozott, függőben lévő, javíthatatlan), míg mások csekély mértékben járulnak hozzá. Backblaze rámutat, hogy csak egy maroknyi tulajdonság Jól korrelál a hibákkal, és a Google olyan eseteket is bemutatott, előzetes értesítés nélküli meghibásodások.

Mit jelent ez? Azt jelenti, hogy a SMART számos probléma előrejelzésében segít, de a stratégiának ötvöződnie kell monitorozás, redundancia (RAID), biztonsági mentések és helyreállításNe csak a zöld lámpának bízz.

Ha az eszköz vagy a rendszer jelzi Figyelmeztetés/Előre látható hiba/Nem megfelelő állapot1) Másoljon le annyit, amennyit csak lehetséges, 2) Érvényesítse egy másik segédprogrammal a megerősítéshez, 3) Ütemezze be a azonnali csereA módosítás elvégzése után szükség esetén ellenőrizze a RAID-et a probléma elkerülése érdekében. rekonstrukciós kockázatok.

A lényeghez való ragaszkodás segít: A SMART figyelmeztet a felmerülő problémák nagy részére.De nem mindegyiket; az okos munkamódszer az, ha ütemezett tesztekkel, jó biztonsági mentésekkel és egyértelmű cserepolitikával kombináljuk, amikor a kritikus indikátorok elkezdenek mozogni.

Hogyan tisztítsuk meg a Windows rendszerleíró adatbázist anélkül, hogy bármit is megsértenénk
Kapcsolódó cikk:
Hogyan tisztítsuk meg a Windows rendszerleíró adatbázist anélkül, hogy bármit is megsértenénk