- SMART ช่วยให้คุณคาดการณ์ความล้มเหลวของ SSD/HDD ได้โดยการอ่านคุณลักษณะที่สำคัญและการทดสอบตัวเองแบบสั้นและยาว
- Windows, macOS และ Linux นำเสนอวิธีการและแอปดั้งเดิม (CrystalDiskInfo, GSmartControl) สำหรับการตรวจสอบสุขภาพและอุณหภูมิ
- SMART ไม่ครอบคลุมถึงความล้มเหลวทั้งหมด แต่จะรวมการตรวจสอบเข้ากับการสำรองข้อมูล ความซ้ำซ้อน และการเปลี่ยนทดแทนที่วางแผนไว้
หากคุณกังวลเกี่ยวกับสุขภาพของที่จัดเก็บข้อมูลของคุณ คุณมาถูกที่แล้ว: ด้วย เทคโนโลยีสมาร์ท คุณสามารถคาดการณ์ความล้มเหลวร้ายแรงของ SSD และ HDD และบันทึกข้อมูลของคุณได้ทันเวลา บทความนี้จะอธิบาย วิธีตรวจจับข้อผิดพลาดใน SSD ของคุณโดยใช้คำสั่ง SMART
นอกเหนือจากความอยากรู้อยากเห็นเพียงอย่างเดียว การตรวจสอบสภาพของดิสก์เป็นสิ่งสำคัญ รับประกันความพร้อมของข้อมูล และวางแผนด้านความจุและประสิทธิภาพ ฮาร์ดไดรฟ์ที่เสียหายโดยไม่คาดคิดอาจขัดขวางบริการต่างๆ ทำลายชื่อเสียง และทำให้คุณเสียเงิน และแม้ว่า SSD จะไม่ส่งเสียงดังเท่า HDD แต่ก็มีอาการต่างๆ ดังต่อไปนี้: ความเร็วลดลง, ข้อผิดพลาดในการพิมพ์ หรือสูญเสียข้อมูลเนื่องจากการสึกหรอของเซลล์
SMART คืออะไร และทำอะไรได้บ้าง (และทำอะไรไม่ได้)
SMART เป็นคำย่อของ เทคโนโลยีการตรวจสอบตนเอง การวิเคราะห์ และการรายงานชุดคำสั่งในเฟิร์มแวร์จะตรวจสอบตัวแปรดิสก์ภายในและแจ้งเตือนเมื่อตรวจพบความเสี่ยงที่จะเกิดความล้มเหลว เป้าหมายของชุดคำสั่งนี้ชัดเจน นั่นคือเพื่อให้คุณมีเวลาสำรองข้อมูลและเปลี่ยนไดรฟ์ใหม่ก่อนที่จะเกิดภัยพิบัติ
การใช้งานนั้นจำเป็นจะต้อง เมนบอร์ด (BIOS/UEFI) และตัวไดรฟ์เองก็รองรับและเปิดใช้งาน SMART ปัจจุบันนี้ ไดรฟ์นี้ใช้งานได้แทบทุกระบบใน SATA, SAS, SCSI และ NVMe และระบบปฏิบัติการสมัยใหม่ก็ทำงานร่วมกับไดรฟ์นี้ได้โดยไม่มีปัญหา
พารามิเตอร์ที่วัดได้มีดังต่อไปนี้: อุณหภูมิ, ภาคส่วนที่กำหนดใหม่, ข้อผิดพลาด CRCเวลาหมุนของเครื่องยนต์ ข้อผิดพลาดในการอ่าน/เขียนที่แก้ไขไม่ได้ จำนวนเซกเตอร์ที่รอดำเนินการ ความเร็วในการค้นหา และแอตทริบิวต์อื่นๆ อีกมากมาย ผู้ผลิตแต่ละรายกำหนดและทำให้ตารางของตนเป็นมาตรฐาน พร้อมเกณฑ์และค่าที่ยอมรับได้
สำคัญ: SMART ไม่ได้ทำเวทมนตร์ มันแค่เตือนคุณเท่านั้น ความล้มเหลวที่คาดเดาได้ (การสึกหรอ ปัญหาทางกลไกที่เพิ่มมากขึ้น บล็อก NAND ที่เสื่อมสภาพ) ไม่สามารถคาดการณ์ได้ เหตุการณ์ฉับพลัน เช่น ไฟกระชากหรือความเสียหายทางอิเล็กทรอนิกส์อย่างกะทันหัน การศึกษาเช่นของ Google และ Backblaze แสดงให้เห็นว่าฟีเจอร์บางอย่างมีประโยชน์ แต่ ไม่ครอบคลุมถึงความล้มเหลว 100%.

Linux: smartmontools คำสั่งสำคัญและการทดสอบ
ใน Linux แพ็คเกจ smartmontools ประกอบด้วยสองส่วน: สมาร์ทซีทีแอล (เครื่องมือคอนโซลสำหรับการค้นหาและการทดสอบ) และ สมาร์ทด (เดมอนที่ตรวจสอบและแจ้งเตือนผ่าน syslog หรืออีเมล) เป็นโปรแกรมฟรีและใช้งานได้กับ SATA, SCSI, SAS และ NVMe.
การติดตั้ง (ตัวอย่าง Debian/Ubuntu): sudo apt install smartmontoolsในการแจกจ่ายอื่น ๆ จะใช้ตัวจัดการที่สอดคล้องกัน ความพร้อมใช้งานใน Linux และ BSD นั้นแพร่หลายและ มันไม่ควรทำให้คุณมีปัญหาใดๆ.
ขั้นแรกให้ระบุหน่วย คุณสามารถแสดงรายการส่วนประกอบด้วย df -h หรือระบุดิสก์และพาร์ติชั่นด้วย sudo fdisk -lโปรดจำไว้ว่า: smartctl ทำงานกับอุปกรณ์ ไม่ใช่กับพาร์ติชั่น นั่นคือบน /dev/sdX หรือ /dev/nvmeXnY.
คำสั่งที่จำเป็นด้วย smartctl สำหรับ เริ่ม ในการทำงานกับ SMART บนดิสก์เฉพาะ:
- ตรวจสอบการสนับสนุนและสถานะ SMART:
sudo smartctl -i /dev/sda - เปิดใช้งาน SMART หากปิดใช้งาน:
sudo smartctl -s on /dev/sda - ดูคุณลักษณะและบันทึกทั้งหมด:
sudo smartctl -a /dev/sda - การทดสอบตัวเองแบบสั้น (เร็ว):
sudo smartctl -t short /dev/sda - การทดสอบตัวเองแบบยาวนาน (ครอบคลุม):
sudo smartctl -t long /dev/sda - สรุปสุขภาพ:
sudo smartctl -H /dev/sda
กำหนดการทดสอบสั้นทุกสัปดาห์และการทดสอบยาวทุกเดือนด้วย cron ลดผลกระทบให้น้อยที่สุดและมีข้อมูลทางประวัติศาสตร์รันการทดสอบในช่วงเช้าตรู่หรือในช่วงที่มีโหลดต่ำ ระหว่างการทดสอบที่ยาวนาน คุณจะสังเกตเห็น เพิ่มความหน่วงและ IOPS ลดลง.
หลักเกณฑ์การตั้งชื่ออุปกรณ์ใน Linux
คุณจะเห็นเส้นทางที่แตกต่างกันไปขึ้นอยู่กับตัวควบคุมและอินเทอร์เฟซ ตัวอย่างทั่วไปสำหรับการจดจำไดรฟ์และตัวควบคุม: /dev/sd, /dev/nvmen, /dev/sg*นอกเหนือจากเส้นทางเฉพาะบนตัวควบคุม 3ware หรือ HP (cciss/hpsa) การทำความเข้าใจเส้นทางที่แน่นอนยังช่วยป้องกัน วิเคราะห์อุปกรณ์ที่ไม่ถูกต้อง.
ข้อผิดพลาดและบันทึกทั่วไป (ATA/SCSI/NVMe)
SMART จะบันทึกข้อผิดพลาดล่าสุดและแสดงไว้ในรูปแบบถอดรหัส เอตา คุณจะเห็นข้อผิดพลาดห้ารายการสุดท้ายพร้อมสถานะและรหัสใน เอสซีไอ แสดงรายการตัวนับความล้มเหลวในการอ่าน การเขียน และการตรวจสอบ เอ็นวีเอ็ม รายการบันทึกข้อผิดพลาดจะถูกพิมพ์ (ค่าเริ่มต้นคือ 16 รายการล่าสุด)
ตัวย่อทั่วไปในผลลัพธ์ข้อผิดพลาด (มีประโยชน์สำหรับการวินิจฉัยอย่างรวดเร็ว): ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPหากปรากฏซ้ำๆ กันแสดงว่ามี ปัญหาทางกายภาพหรือการเชื่อมต่อ เพื่อทำการสืบสวน
สิ่งสำคัญอีกประการหนึ่งคือการระบุคุณลักษณะที่สำคัญโดยใช้ ID ซึ่งมักสัมพันธ์กับความล้มเหลวที่อาจเกิดขึ้นในอนาคต: 05, 10, 183, 184, 188, 196, 197, 198, 201, 230การเพิ่มขึ้นอย่างต่อเนื่องของสิ่งใดสิ่งหนึ่งถือเป็นสัญญาณที่ไม่ดี
คุณสมบัติ SMART: วิธีการอ่านและคุณสมบัติที่ควรใส่ใจ
โปรแกรมจะแสดงพารามิเตอร์แต่ละตัวพร้อมฟิลด์หลายฟิลด์ โดยปกติจะประกอบด้วย ตัวระบุ (1-250), เกณฑ์, ค่า, แย่ที่สุด และข้อมูลดิบนอกเหนือจากแฟล็ก (ไม่ว่าจะเป็นค่าวิกฤต ค่าสถิติ ฯลฯ) ค่าปกติจะเริ่มต้นสูงและ ลดลงตามการใช้งานการเกินขีดจำกัดจะทำให้เกิดการเตือน
คุณสมบัติที่เป็นประโยชน์ที่สุดในการตรวจจับการสึกหรอหรือความเสียหาย ได้แก่: ย้ายเซกเตอร์_Ct (จัดสรรภาคส่วนใหม่) ภาคที่กำลังรอดำเนินการในปัจจุบัน (ภาคส่วนที่รอดำเนินการไม่เสถียร) ออฟไลน์_ไม่สามารถแก้ไขได้ (ข้อผิดพลาดที่ไม่มีการแก้ไขแบบออฟไลน์) จำนวนเหตุการณ์ที่ถูกย้าย (เหตุการณ์การมอบหมายใหม่) และบน HDD หมุนซ้ำนับ (การลองสตาร์ทเครื่องยนต์ใหม่) สิ่งเหล่านี้เกี่ยวข้องกับ SSD จำนวนการปรับระดับการสึกหรอ y ความล้มเหลวในโปรแกรม/ลบข้อมูล.
อุณหภูมิเป็นที่ถกเถียงกัน แต่การรักษาหน่วยให้ต่ำกว่า 60 องศาเซลเซียส วิธีนี้จะช่วยลดโอกาสที่จะเกิดข้อผิดพลาด ตรวจสอบการไหลเวียนของอากาศภายในเคส และหากจำเป็น ให้เพิ่มฮีตซิงก์ NVMe ลงในไดรฟ์ M.2 หลีกเลี่ยงการลดความเร็วและการเสื่อมสภาพ.

Windows: WMIC, PowerShell และ CHKDSK
หากต้องการตรวจสอบระบบ Windows อย่างรวดเร็ว คุณสามารถใช้คอนโซลคลาสสิกได้ ดับเบิลยูเอ็มไอซี หรือ PowerShell โดยไม่ต้องติดตั้งอะไรเพิ่มเติม และเสริมด้วยเครื่องมือ SMART ที่ครอบคลุมมากขึ้นหากจำเป็น
โดยใช้ Command Prompt ในฐานะผู้ดูแลระบบ ให้รัน: wmic diskdrive get model, statusหากกลับเป็น OK แสดงว่าสถานะ SMART ถูกต้อง หากคุณเห็น เปร็ดล้มเหลวมีพารามิเตอร์ที่สำคัญและมีความเกี่ยวข้อง สร้างสำเนาและพิจารณาการทดแทน.
ใน PowerShell ให้เริ่มเป็นผู้ดูแลระบบและเปิดใช้งาน: Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatus. สนาม สถานะสุขภาพ จะแสดงให้คุณเห็นว่ามีสุขภาพดี คำเตือน หรือไม่ดีต่อสุขภาพ มีประโยชน์สำหรับ ตรวจจับปัญหาได้ในทันที.
ในการตรวจสอบและแก้ไขข้อผิดพลาดของระบบไฟล์เชิงตรรกะ ให้ใช้ CHKDSK รันคำสั่งต่อไปนี้ในคอนโซลด้วยสิทธิ์ที่สูงกว่า: chkdsk C: /f /r /x เพื่อแก้ไขข้อผิดพลาด ค้นหาเซกเตอร์เสีย และถอดประกอบไดรฟ์หากจำเป็น หากคุณต้องการคำแนะนำ ซ่อมแซม Windows หลังจากติดไวรัสร้ายแรงลองดูตอนนี้ ใน NTFS คุณสามารถใช้ chkdsk /scan เพื่อการวิเคราะห์ออนไลน์
macOS: ยูทิลิตี้ดิสก์และเทอร์มินัล
บน Mac คุณมีสองทางเลือกง่ายๆ อย่างหนึ่งคือ ยูทิลิตี้ดิสก์ (แอปพลิเคชัน > ยูทิลิตี้): เลือกไดรฟ์ทางกายภาพและกด ปฐมพยาบาล เพื่อซ่อมแซมระบบไฟล์ นอกจากนี้คุณจะเห็น สถานะสมาร์ท เช่น ได้รับการยืนยัน หรือ ล้มเหลว
หากคุณต้องการใช้ Terminal ให้รัน diskutil info /Volumes/NombreDeTuDisco และมองหาเส้นของ สถานะ SMART. หากอยู่ในรายการ Verified ให้หายใจเข้า แต่ สำรองข้อมูลทันที และพิจารณาทำการเปลี่ยนแปลง
Linux เพิ่มเติม: dmesg, /sys และ GUI พร้อม GSmartControl
นอกจาก smartctl แล้ว การตรวจสอบบันทึกเคอร์เนลสำหรับสิ่งต่อไปนี้ก็มีประโยชน์: ข้อผิดพลาด I/O หรือตัวควบคุมหมดเวลา ตัวกรองด่วนจะเป็นดังนี้: dmesg | grep -i errorและเสริมด้วยคำศัพท์เช่น failed o timeout.
สำหรับรายละเอียดอุปกรณ์พื้นฐาน คุณสามารถอ่านเส้นทางระบบ เช่น /sys/block/sdX/device/model หรือสถิติของ /sys/block/sdX/statมีประโยชน์เมื่อคุณต้องการ ตรวจสอบกิจกรรมและแบบจำลอง โดยไม่ต้องใช้เครื่องมือภายนอก
หากคุณต้องการอินเทอร์เฟซแบบกราฟิก ให้ติดตั้ง จีสมาร์ทคอนโทรล (ตัวอย่างเช่น: sudo apt install -y gsmartcontrol) และรันด้วยสิทธิ์ผู้ดูแลระบบ ช่วยให้คุณสามารถ ดูคุณลักษณะ รันการทดสอบระยะสั้น/ยาว และส่งออกรายงาน ด้วยการคลิกเพียงไม่กี่ครั้ง

เครื่องมือของบุคคลที่สามที่แนะนำ
หากต้องการไปไกลกว่าพื้นฐานในการตรวจจับข้อผิดพลาดใน SSD ของคุณด้วยคำสั่ง SMART คุณมียูทิลิตี้ยอดนิยมบางตัว:
- คริสตัลดิสก์อินโฟ (Windows) เป็นระบบปฏิบัติการฟรี ชัดเจน และเข้ากันได้กับ SATA และ NVMe ภายในและภายนอก อีกทั้งยังแสดงคุณสมบัติ SMART อุณหภูมิ และชั่วโมงการใช้งาน
- เอชดี จูน เพิ่มแผนที่ภาคส่วนและการทดสอบความเร็ว (มีเวอร์ชันที่ต้องชำระเงิน)
- ฮาร์ดดิสก์เซนติเนล เน้นที่การตรวจสอบอย่างต่อเนื่อง การแจ้งเตือนและรายงานขั้นสูง เวอร์ชันฟรีมีข้อจำกัดแต่ทรงพลังในการตีความ SMART
- จีสมาร์ทคอนโทรล มันฟรีและช่วยให้คุณสามารถรันการทดสอบและดูแอตทริบิวต์ด้วยอินเทอร์เฟซแบบกราฟิก
สัญญาณที่บ่งบอกว่า SSD หรือ HDD ของคุณกำลังจะหมดอายุการใช้งาน
รายชื่ออาการทั่วไป: การเริ่มต้นระบบช้า การปิดระบบโดยไม่คาดคิด หน้าจอสีน้ำเงินแห่งความตาย (BSoD หรือ kernel panic)ไฟล์ที่ไม่สามารถเปิดได้หรือเสียหาย ไม่สามารถติดตั้งหรืออัปเดตได้ และไดรฟ์ที่ หายไปจากระบบหรือ BIOS/UEFI.
ในฮาร์ดดิสก์ไดรฟ์ เสียงกลไก (เช่น เสียงคลิก เสียงเอี๊ยด เสียงหึ่งๆ) ถือเป็นสัญญาณที่ไม่ดี ในฮาร์ดดิสก์ไดรฟ์ SSD ให้มองหาข้อผิดพลาดในการเขียนข้อมูล ข้อผิดพลาดเมื่อติดตั้งไดรฟ์ข้อมูล และการเพิ่มขึ้นของภาคส่วนที่ถูกจัดสรรใหม่หรือจำนวนพนักงานที่ลาออก หากปัญหาเกิดขึ้นเป็นระยะๆ อย่าชะล่าใจ: สร้างสำเนาตอนนี้.
การซื้ออย่างชาญฉลาด: สิ่งที่ต้องมองหาเมื่อเลือกซื้อบันทึกใหม่
ให้ความสำคัญกับแบรนด์ที่มีชื่อเสียงดี (Seagate, WD, Toshiba, Samsung) ประเภทหน่วย (SSD สำหรับความเร็ว, HDD สำหรับความจุ), อินเทอร์เฟซ (SATA, NVMe ใน M.2/PCIe), แคช และการระบายความร้อน ความสามารถ ขอแนะนำให้ประเมินเกินความต้องการจริงของคุณเล็กน้อย
ตรวจสอบ ประกาศความทนทาน (TBW บน SSD, การรับประกัน, MTBF ด้วยความระมัดระวัง) คาดว่าจะใช้งานได้ (รุ่น NAS มักมีประสิทธิภาพและจัดการ RAID ได้ดีกว่า) และงบประมาณ: บางครั้งการจ่ายเงินเพิ่มเล็กน้อยจะทำให้คุณ ความสงบของจิตใจและชีวิตที่มีประโยชน์.
ข้อจำกัดของ SMART: บริบทและการศึกษา
SMART มีประโยชน์แต่ไม่สมบูรณ์แบบ: มี ความไม่สอดคล้องกันระหว่างผู้ผลิต ในคำจำกัดความและการกำหนดมาตรฐาน คุณลักษณะบางอย่างมีคุณค่ามาก (ถูกกำหนดใหม่ รอดำเนินการ ไม่สามารถแก้ไขได้) ในขณะที่คุณลักษณะบางอย่างมีคุณค่าน้อยมาก Backblaze ชี้ให้เห็นว่ามีเพียง คุณสมบัติบางประการ มันสัมพันธ์กันดีกับความล้มเหลว และ Google แสดงกรณีของ ความล้มเหลวโดยไม่ได้แจ้งให้ทราบล่วงหน้า.
นี่หมายความว่าอย่างไร? หมายความว่า SMART ช่วยคาดการณ์ปัญหาต่างๆ ได้มากมาย แต่กลยุทธ์ของคุณจะต้องผสมผสาน การตรวจสอบ การสำรองข้อมูล (RAID) การสำรองข้อมูล และการกู้คืน. อย่าเชื่อแค่สัญญาณไฟจราจรสีเขียวเท่านั้น
หากเครื่องมือหรือระบบรายงาน คำเตือน/ความล้มเหลวที่คาดเดาได้/ไม่ดีต่อสุขภาพ1) คัดลอกให้ได้มากที่สุดตอนนี้ 2) ตรวจสอบกับยูทิลิตี้อื่นเพื่อยืนยัน 3) กำหนดเวลา ทดแทนทันทีหลังจากทำการเปลี่ยนแปลงแล้ว ให้ตรวจสอบ RAID หากจำเป็นเพื่อหลีกเลี่ยง ความเสี่ยงในการสร้างใหม่.
การยึดมั่นกับสิ่งสำคัญช่วยได้: SMART เตือนคุณเกี่ยวกับปัญหาต่างๆ มากมายที่จะเกิดขึ้นแต่ไม่ใช่ทั้งหมด วิธีทำงานที่ชาญฉลาดคือการรวมเข้ากับการทดสอบตามกำหนดเวลา การสำรองข้อมูลที่ดี และนโยบายการเปลี่ยนทดแทนที่ชัดเจนเมื่อตัวบ่งชี้ที่สำคัญเริ่มเคลื่อนไหว
บรรณาธิการเชี่ยวชาญด้านเทคโนโลยีและอินเทอร์เน็ตด้วยประสบการณ์มากกว่าสิบปีในสื่อดิจิทัลต่างๆ ฉันทำงานเป็นบรรณาธิการและผู้สร้างเนื้อหาให้กับบริษัทอีคอมเมิร์ซ การสื่อสาร การตลาดออนไลน์ และการโฆษณา ฉันยังได้เขียนไว้ในเว็บไซต์เศรษฐศาสตร์ การเงิน และภาคส่วนอื่นๆ ด้วย งานของฉันก็คือความหลงใหลของฉันเช่นกัน ตอนนี้ผ่านบทความของฉันใน Tecnobitsฉันพยายามสำรวจข่าวสารและโอกาสใหม่ ๆ ที่โลกแห่งเทคโนโลยีมอบให้เราทุกวันเพื่อปรับปรุงชีวิตของเรา