Paano matukoy ang mga pagkabigo sa SSD gamit ang mga advanced na SMART command

Huling pag-update: 01/12/2025

  • Binibigyang-daan ka ng SMART na mahulaan ang mahuhulaan na mga pagkabigo sa SSD/HDD sa pamamagitan ng pagbabasa ng mga kritikal na katangian at pagpapatakbo ng maikli at mahabang pagsusuri sa sarili.
  • Nag-aalok ang Windows, macOS, at Linux ng mga katutubong pamamaraan at app (CrystalDiskInfo, GSmartControl) para sa pagsuri sa kalusugan at temperatura.
  • Hindi saklaw ng SMART ang lahat ng mga pagkabigo: pinagsasama nito ang pagsubaybay sa mga backup, redundancy, at nakaplanong pagpapalit.
Mag-detect ng mga fault sa iyong SSD gamit ang mga SMART command

Kung nag-aalala ka tungkol sa kalusugan ng iyong storage, nasa tamang lugar ka: kasama ang SMART na teknolohiya Maaari mong asahan ang mga kritikal na pagkabigo sa SSD at HDD at i-save ang iyong data sa oras. Ipinapaliwanag ng artikulong ito. Paano matukoy ang mga pagkakamali sa iyong SSD gamit ang mga SMART na utos.

Higit pa sa kuryusidad lamang, ang pagsubaybay sa kondisyon ng disc ay susi sa ginagarantiyahan ang pagkakaroon ng impormasyon at plano para sa kapasidad at pagganap. Ang isang hard drive na nabigo nang hindi inaasahan ay maaaring makagambala sa mga serbisyo, makasira sa iyong reputasyon, at magdudulot sa iyo ng pera. At habang ang isang SSD ay hindi gumagawa ng ingay ng isang HDD, ang mga sintomas nito ay umiiral: bumababa ang bilis, mga error sa pag-type o pagkawala ng data dahil sa pagkasuot ng cell.

Ano ang SMART at kung ano ang maaari (at hindi) gawin

Ang SMART ay isang acronym para sa Self-Monitoring, Analysis at Reporting TechnologyAng isang serye ng mga gawain sa firmware ay sumusubaybay sa mga internal na variable ng disk at nagbibigay ng mga babala kapag natukoy nila ang isang panganib ng pagkabigo. Malinaw ang kanilang layunin: bigyan ka ng oras para i-back up ang iyong data at palitan ang drive bago dumating ang sakuna.

Upang magamit ito, kinakailangan na ang motherboard (BIOS/UEFI) at ang drive mismo ay sumusuporta at pinagana ang SMART. Ngayon ito ay halos pangkalahatan sa SATA, SAS, SCSI at NVMe, at ang mga modernong operating system ay nakikipag-ugnayan dito nang walang problema.

Kasama sa mga parameter na sinusukat nito ang lahat: temperatura, muling itinalagang mga sektor, mga error sa CRCOras ng pag-spin-up ng engine, hindi naitatama na mga error sa pagbasa/pagsusulat, nakabinbing bilang ng sektor, bilis ng paghahanap, at dose-dosenang higit pang mga katangian. Tinutukoy at ini-standardize ng bawat tagagawa ang mga talahanayan nito, na may mga threshold at katanggap-tanggap na mga halaga.

Mahalaga: Ang SMART ay hindi nagsasagawa ng mahika. Binabalaan ka lang nito. predictable failures (pagsuot, progresibong mga problema sa makina, lumalalang mga bloke ng NAND). Hindi nito mahuhulaan mga biglaang pangyayari gaya ng power surges o biglaang pagkasira ng electronic. Ipinapakita ng mga pag-aaral tulad ng Google at Backblaze na kapaki-pakinabang ang ilang feature, ngunit Hindi nila saklaw ang 100% ng mga pagkabigo.

I-detect ang mga pagkabigo ng SSD gamit ang mga SMART command

Linux: smartmontools, mga pangunahing command at pagsubok

Sa Linux, ang pakete ng smartmontools ay may kasamang dalawang bahagi: smartctl (console tool para sa mga query at pagsubok) at smartd (isang daemon na sumusubaybay at nag-aalerto sa pamamagitan ng syslog o email). Ito ay libre at tugma sa SATA, SCSI, SAS at NVMe.

Pag-install (halimbawa Debian/Ubuntu): sudo apt install smartmontoolsSa iba pang mga distribusyon, ginagamit nito ang kaukulang tagapamahala; Ang kakayahang magamit sa Linux at BSD ay laganap at Hindi ito dapat magdulot sa iyo ng anumang problema..

Eksklusibong nilalaman - Mag-click Dito  Paano pumili ng pinakamahusay na processor para sa PC gaming: mga core, thread, IPC, at presyo

Hanapin muna ang mga yunit. Maaari kang maglista ng mga pagtitipon na may df -h o tukuyin ang mga disk at partisyon na may sudo fdisk -lTandaan: gumagana ang smartctl sa device, hindi sa partition; ibig sabihin, sa /dev/sdX o /dev/nvmeXnY.

Mahahalagang utos na may smartctl para sa magsimula upang gumana sa SMART sa isang partikular na disk:

  • Suriin ang suporta at katayuan ng SMART: sudo smartctl -i /dev/sda
  • I-activate ang SMART Kung ito ay hindi pinagana: sudo smartctl -s on /dev/sda
  • Tingnan ang lahat ng katangian at log: sudo smartctl -a /dev/sda
  • Maikling pagsusuri sa sarili (mabilis): sudo smartctl -t short /dev/sda
  • Mahabang pagsusuri sa sarili (komprehensibo): sudo smartctl -t long /dev/sda
  • Buod ng Kalusugan: sudo smartctl -H /dev/sda

Iiskedyul ang maikling pagsusulit bawat linggo at ang mahabang pagsubok bawat buwan na may cron to bawasan ang epekto at magkaroon ng makasaysayang dataPatakbuhin ang mga pagsusulit sa maagang umaga o sa panahon ng mababang pagkarga; sa mahabang pagsubok mapapansin mo nadagdagan ang latency at pagbaba ng IOPS.

Mga convention sa pagpapangalan ng device sa Linux

Depende sa controller at interface, makakakita ka ng iba't ibang path. Ilang karaniwang halimbawa para sa pagkilala sa mga drive at controller: /dev/sd, /dev/nvmen, /dev/sg*Bilang karagdagan sa mga partikular na ruta sa 3ware o HP controllers (cciss/hpsa), ang pag-unawa sa eksaktong ruta ay pumipigil sa pag-aralan ang maling aparato.

Mga karaniwang error at log (ATA/SCSI/NVMe)

Pinapanatili ng SMART ang mga log ng mga kamakailang error at ipinapakita ang mga ito sa decoded form. ATA Makikita mo ang huling limang error na may mga status at code; sa SCSI Nakalista ang mga counter ng kabiguan sa pagbasa, pagsulat, at pag-verify; sa NVMe Ang mga entry sa log ng error ay naka-print (bilang default ang 16 pinakabago).

Mga karaniwang pagdadaglat sa mga output ng error (kapaki-pakinabang para sa mabilis na pagsusuri): ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPKung sila ay lilitaw nang paulit-ulit, mayroong a problema sa pisikal o koneksyon para mag-imbestiga.

Mahalaga rin na tukuyin ang mga kritikal na katangian sa pamamagitan ng ID, na kadalasang nauugnay sa mga napipintong pagkabigo: 05, 10, 183, 184, 188, 196, 197, 198, 201, 230Ang patuloy na pagtaas sa alinman sa mga ito ay isang masamang palatandaan.

Mga katangian ng SMART: kung paano basahin ang mga ito at kung alin ang dapat bigyang pansin

Ang mga programa ay nagpapakita ng bawat parameter na may ilang mga patlang. Ito ay kadalasang kasama Identifier (1-250), Threshold, Value, Pinakamahina, at Raw na Data, bilang karagdagan sa mga flag (ito man ay kritikal, istatistika, atbp.). Ang normalized na halaga ay nagsisimula sa mataas at bumababa sa paggamitAng paglampas sa threshold ay magti-trigger ng babala.

Kabilang sa mga pinakakapaki-pakinabang na katangian para sa pag-detect ng pagkasira o pagkasira, tingnan ang: Relocated_Sector_Ct (mga muling itinalagang sektor), Kasalukuyang_Nakabinbin_Sektor (hindi matatag na mga nakabinbing sektor), Offline_Uncorrectable (mga error nang walang offline na pagwawasto), Relocated_Event_Count (mga kaganapan sa muling pagtatalaga) at, sa HDD, Spin_Retry_Count (Sinusubukan ulit ang pagsisimula ng makina). May kaugnayan ang mga ito sa mga SSD. Magsuot ng Leveling Count y Mga Pagkabigo sa Programa/Burahin.

Eksklusibong nilalaman - Mag-click Dito  Ano ang gagawin kung hindi magpe-play ang Echo Dot ng mga audiobook?

Ang temperatura ay kontrobersyal, ngunit pinapanatili ang yunit sa ibaba 60°C Binabawasan nito ang posibilidad ng mga pagkakamali. Suriin ang chassis airflow at, kung kinakailangan, magdagdag ng mga NVMe heatsink sa mga M.2 drive. maiwasan ang throttling at degradation.

suriin ang disk

Windows: WMIC, PowerShell at CHKDSK

Para sa mabilis na pagsusuri sa mga Windows system maaari mong gamitin ang classic na console na may WMIC o PowerShell, nang hindi nag-i-install ng anumang karagdagang, at pagkatapos ay dagdagan ng isang mas komprehensibong SMART tool kung kinakailangan.

Gamit ang Command Prompt bilang administrator, patakbuhin ang: wmic diskdrive get model, statusKung ito ay bumalik ng OK, ang SMART status ay tama; kung nakikita mo Bago mabigoMay mga kritikal na parameter at ito ay may kaugnayan Gumawa ng isang kopya at mag-isip tungkol sa isang kapalit..

Sa PowerShell, magsimula bilang administrator at ilunsad: Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatus. Ang field Katayuan sa Kalusugan ay magpapakita sa iyo ng Healthy, Warning o Unhealthy, kapaki-pakinabang para sa tuklasin ang mga problema sa isang sulyap.

Upang suriin at ayusin ang mga error sa lohikal na file system, gamitin ang CHKDSK. Patakbuhin ang sumusunod na command sa console na may mataas na mga pribilehiyo: chkdsk C: /f /r /x upang i-troubleshoot ang mga error, hanapin ang mga masamang sektor, at i-disassemble ang drive kung kinakailangan; kung kailangan mo ng gabay sa Ayusin ang Windows pagkatapos ng isang malubhang virusTingnan ito ngayon. Sa NTFS, maaari mong gamitin chkdsk /scan para sa online na pagsusuri.

macOS: Disk Utility at Terminal

Sa isang Mac, mayroon kang dalawang napakasimpleng landas. Sa isang banda, Utility ng Disk (Applications > Utilities): Piliin ang pisikal na drive at pindutin Pangunang lunas upang ayusin ang file system; bilang karagdagan, makikita mo ang Katayuan ng SMART tulad ng Na-verify o Nabigo.

Kung mas gusto mo ang Terminal, tumakbo diskutil info /Volumes/NombreDeTuDisco at hanapin ang linya ng Katayuan ng SMART. Kung nakalista ang Na-verify, huminga; ngunit, agarang backup at isaalang-alang ang paggawa ng pagbabago.

Dagdag na Linux: dmesg, /sys at GUI na may GSmartControl

Bilang karagdagan sa smartctl, nakakatulong na suriin ang kernel log para sa alinman sa mga sumusunod: Mga error sa I/O o mga timeout ng controller. Ang isang mabilis na filter ay magiging: dmesg | grep -i errorat pinupunan ito ng mga terminong tulad ng failed o timeout.

Para sa mga pangunahing detalye ng device maaari mong basahin ang mga path ng system gaya ng /sys/block/sdX/device/model o mga istatistika ng /sys/block/sdX/statKapaki-pakinabang kapag gusto mo i-verify ang aktibidad at modelo walang panlabas na mga tool.

Kung mas gusto mo ang isang graphical na interface, i-install GSmartControl (Halimbawa: sudo apt install -y gsmartcontrol) at patakbuhin ito nang may mga pribilehiyo ng administrator. Pinapayagan ka nitong Tingnan ang mga katangian, magpatakbo ng maikli/mahabang pagsubok, at mag-export ng mga ulat na may isang pares ng mga pag-click.

HD Tune

Inirerekomendang mga tool ng third-party

Upang higit pa sa mga pangunahing kaalaman kapag nagde-detect ng mga fault sa iyong SSD gamit ang mga SMART command, mayroon kang ilang napakasikat na utility:

  • CrystalDiskInfo (Windows) ay libre, malinaw at tugma sa panloob at panlabas na SATA at NVMe; nagpapakita ito ng mga SMART na katangian, temperatura at oras ng paggamit.
  • HD Tune Nagdaragdag ito ng mga mapa ng sektor at mga pagsubok sa bilis (ito ay may bayad na bersyon).
  • Sentinel ng Hard Disk Nakatuon ito sa patuloy na pagsubaybay, mga advanced na alerto at mga ulat; ang libreng bersyon nito ay limitado ngunit napakalakas sa pagbibigay-kahulugan sa SMART.
  • GSmartControl Ito ay libre at nagbibigay-daan sa iyong magpatakbo ng mga pagsubok at tingnan ang mga katangian gamit ang isang graphical na interface.
Eksklusibong nilalaman - Mag-click Dito  Maingay na PC: Pagbabawas ng Ingay

Mga senyales na ang iyong SSD o HDD ay nasa mga huling paa nito

Ilista ang mga karaniwang sintomas: Mabagal na pagsisimula, hindi inaasahang pagsara, mga asul na screen ng kamatayan (BSoD o kernel panic)Mga file na hindi mabubuksan o masira, walang kakayahang mag-install o mag-update, at humimok nito mawala sa system o sa BIOS/UEFI.

Sa mga HDD, ang mga mekanikal na ingay (mga pag-click, squeaks, buzzing) ay isang masamang senyales. Sa mga SSD, maghanap ng mga error sa pagsusulat. mga error kapag nag-mount ng mga volume at pagtaas ng mga reassigned sector o attrition counts. Kung ang mga problema ay paulit-ulit, huwag maging kampante: Gumawa ng kopya ngayon.

Pagbili ng matalino: kung ano ang hahanapin kapag pumipili ng mga bagong tala

Pinahahalagahan nito ang mga tatak na may magandang reputasyon (Seagate, WD, Toshiba, Samsung), ang tipo de unidad (SSD para sa bilis, HDD para sa kapasidad), interface (SATA, NVMe sa M.2/PCIe), cache, at pag-alis ng init. kakayahan Maipapayo na i-overestimate ito nang bahagya sa iyong aktwal na mga pangangailangan.

Suriin ang ipinahayag na tibay (TBW sa SSD, mga warranty, MTBF nang may pag-iingat), ang Inaasahang paggamit (Ang mga modelo ng NAS ay madalas na gumaganap at humahawak ng RAID nang mas mahusay) at badyet: kung minsan ang pagbabayad ng kaunti pa ay nagbibigay sa iyo kapayapaan ng isip at kapaki-pakinabang na buhay.

Mga Limitasyon ng SMART: konteksto at pag-aaral

Ang SMART ay kapaki-pakinabang ngunit hindi perpekto: mayroon hindi pagkakapare-pareho sa pagitan ng mga tagagawa Sa mga kahulugan at standardisasyon, ang ilang mga katangian ay napakahalaga (muling itinalaga, nakabinbin, hindi naitatama), habang ang iba ay kakaunti ang kontribusyon. Itinuturo ng Backblaze iyon lamang isang dakot ng mga katangian Mahusay itong nauugnay sa mga pagkabigo, at ipinakita ng Google ang mga kaso ng mga pagkabigo nang walang paunang abiso.

Ano ang ibig sabihin nito? Nangangahulugan ito na nakakatulong ang SMART na mahulaan ang maraming problema, ngunit dapat pagsamahin ang iyong diskarte monitoring, redundancy (RAID), backup at pagbawi. Huwag lamang magtiwala sa isang berdeng ilaw ng trapiko.

Kung ang tool o system ay nag-uulat Babala/Nahuhulaang Nabigo/Hindi malusog1) Kopyahin hangga't maaari ngayon, 2) Patunayan sa isa pang utility para kumpirmahin, 3) Iskedyul ang agarang kapalitPagkatapos gawin ang pagbabago, suriin ang RAID kung kinakailangan upang maiwasan mga panganib sa muling pagtatayo.

Ang pagsunod sa mga mahahalaga ay nakakatulong: Binabalaan ka ng SMART tungkol sa marami sa mga problemang paparating.Ngunit hindi lahat sa kanila; ang matalinong paraan upang magtrabaho ay ang pagsamahin ito sa mga naka-iskedyul na pagsubok, mahusay na pag-backup, at isang malinaw na patakaran sa pagpapalit kapag nagsimulang lumipat ang mga kritikal na tagapagpahiwatig.

Paano linisin ang pagpapatala ng Windows nang walang sinisira ang anumang bagay
Kaugnay na artikulo:
Paano linisin ang pagpapatala ng Windows nang walang sinisira ang anumang bagay