Cách phát hiện lỗi SSD bằng các lệnh SMART nâng cao

Cập nhật lần cuối: 24/11/2025
tác giả: Daniel Terrasa

  • SMART cho phép bạn dự đoán các lỗi SSD/HDD có thể dự đoán được bằng cách đọc các thuộc tính quan trọng và chạy các bài kiểm tra tự động ngắn và dài.
  • Windows, macOS và Linux cung cấp các phương pháp và ứng dụng gốc (CrystalDiskInfo, GSmartControl) để kiểm tra tình trạng và nhiệt độ.
  • SMART không bao gồm tất cả các lỗi: nó kết hợp giám sát với sao lưu, dự phòng và thay thế theo kế hoạch.
Phát hiện lỗi trong ổ SSD của bạn bằng lệnh SMART

Nếu bạn lo lắng về tình trạng lưu trữ của mình, bạn đã đến đúng nơi: với Công nghệ thông minh Bạn có thể dự đoán các lỗi nghiêm trọng của ổ SSD và HDD và lưu dữ liệu kịp thời. Bài viết này sẽ giải thích. Cách phát hiện lỗi trong ổ SSD bằng lệnh SMART.

Ngoài sự tò mò đơn thuần, việc theo dõi tình trạng của đĩa đệm là chìa khóa để đảm bảo tính khả dụng của thông tin và lên kế hoạch cho dung lượng và hiệu suất. Một ổ cứng hỏng bất ngờ có thể làm gián đoạn dịch vụ, gây tổn hại đến danh tiếng của bạn và khiến bạn tốn kém. Mặc dù ổ SSD không gây ra tiếng ồn như ổ HDD, nhưng nó vẫn có những triệu chứng sau: tốc độ giảm, lỗi đánh máy hoặc mất dữ liệu do hao mòn cell.

SMART là gì và có thể (và không thể) làm gì

SMART là từ viết tắt của Công nghệ tự giám sát, phân tích và báo cáoMột loạt các chương trình con trong phần mềm hệ thống giám sát các biến số nội bộ của ổ đĩa và đưa ra cảnh báo khi phát hiện nguy cơ lỗi. Mục tiêu của chúng rất rõ ràng: cho bạn thời gian sao lưu dữ liệu và thay thế ổ đĩa trước khi thảm họa xảy ra.

Để sử dụng nó, cần phải bo mạch chủ (BIOS/UEFI) và bản thân ổ đĩa hỗ trợ và được kích hoạt SMART. Ngày nay, nó gần như phổ biến trong các chuẩn SATA, SAS, SCSI và NVMe, và các hệ điều hành hiện đại tương tác với nó mà không gặp vấn đề gì.

Các thông số mà nó đo lường bao gồm mọi thứ: nhiệt độ, các sector được chỉ định lại, lỗi CRCThời gian khởi động động cơ, lỗi đọc/ghi không thể sửa, số lượng sector đang chờ xử lý, tốc độ tìm kiếm và hàng chục thuộc tính khác. Mỗi nhà sản xuất đều xác định và chuẩn hóa các bảng của mình, với các ngưỡng và giá trị chấp nhận được.

Quan trọng: SMART không có tác dụng kỳ diệu. Nó chỉ cảnh báo bạn. những thất bại có thể dự đoán được (hao mòn, các vấn đề cơ học tiến triển, các khối NAND bị hư hỏng). Nó không thể dự đoán sự kiện đột ngột chẳng hạn như điện áp tăng đột ngột hoặc hư hỏng điện tử đột ngột. Các nghiên cứu như của Google và Backblaze cho thấy một số tính năng hữu ích, nhưng Họ không bao gồm 100% các lỗi.

Phát hiện lỗi SSD bằng lệnh SMART

Linux: smartmontools, các lệnh chính và các bài kiểm tra

Trong Linux, gói smartmontools bao gồm hai phần: thông minh (công cụ điều khiển cho các truy vấn và thử nghiệm) và thông minh (một daemon giám sát và cảnh báo qua syslog hoặc email). Nó miễn phí và tương thích với SATA, SCSI, SAS và NVMe.

Cài đặt (ví dụ Debian/Ubuntu): sudo apt install smartmontoolsTrong các bản phân phối khác, nó sử dụng trình quản lý tương ứng; tính khả dụng rộng rãi trong Linux và BSD và Nó sẽ không gây ra vấn đề gì cho bạn đâu..

Nội dung độc quyền - Bấm vào đây  Điều chỉnh độ sáng màn hình trên Nintendo Switch

Đầu tiên, hãy xác định vị trí các đơn vị. Bạn có thể liệt kê các cụm lắp ráp với df -h hoặc xác định đĩa và phân vùng với sudo fdisk -lHãy nhớ: smartctl hoạt động trên thiết bị, không phải trên phân vùng; nghĩa là trên /dev/sdX hoặc /dev/nvmeXnY.

Các lệnh thiết yếu với smartctl cho bắt đầu để làm việc với SMART trên một đĩa cụ thể:

  • Kiểm tra hỗ trợ và trạng thái SMART: sudo smartctl -i /dev/sda
  • Kích hoạt SMART Nếu bị vô hiệu hóa: sudo smartctl -s on /dev/sda
  • Xem tất cả các thuộc tính và nhật ký: sudo smartctl -a /dev/sda
  • Bài kiểm tra tự đánh giá ngắn (nhanh): sudo smartctl -t short /dev/sda
  • Bài kiểm tra tự luận dài (toàn diện): sudo smartctl -t long /dev/sda
  • Tóm tắt về sức khỏe: sudo smartctl -H /dev/sda

Lên lịch kiểm tra ngắn hàng tuần và kiểm tra dài hàng tháng với cron để giảm thiểu tác động và có dữ liệu lịch sửTiến hành thử nghiệm vào sáng sớm hoặc trong thời gian tải thấp; trong thời gian thử nghiệm kéo dài, bạn sẽ nhận thấy tăng độ trễ và giảm IOPS.

Quy ước đặt tên thiết bị trong Linux

Tùy thuộc vào bộ điều khiển và giao diện, bạn sẽ thấy các đường dẫn khác nhau. Một số ví dụ phổ biến để nhận dạng ổ đĩa và bộ điều khiển: /dev/sd, /dev/nvmen, /dev/sg*Ngoài các tuyến đường cụ thể trên bộ điều khiển 3ware hoặc HP (cciss/hpsa), việc hiểu tuyến đường chính xác sẽ ngăn ngừa phân tích thiết bị không chính xác.

Lỗi và nhật ký điển hình (ATA/SCSI/NVMe)

SMART lưu giữ nhật ký các lỗi gần đây và hiển thị chúng ở dạng đã giải mã. ATA Bạn sẽ thấy năm lỗi cuối cùng với trạng thái và mã; trong SCSI Các bộ đếm lỗi đọc, ghi và xác minh được liệt kê; trong NVMe Các mục nhật ký lỗi sẽ được in ra (mặc định là 16 mục gần đây nhất).

Các từ viết tắt phổ biến trong kết quả lỗi (hữu ích cho việc chẩn đoán nhanh): ABRT, AMNF, CCTO, EOM, ICRC, IDNF, MC, MCR, NM, TK0NF, UNC, WPNếu chúng xuất hiện nhiều lần, có một vấn đề vật lý hoặc kết nối để điều tra.

Việc xác định các thuộc tính quan trọng theo ID cũng rất quan trọng, vì chúng thường liên quan đến các lỗi sắp xảy ra: 05, 10, 183, 184, 188, 196, 197, 198, 201, 230Sự gia tăng liên tục của bất kỳ chỉ số nào cũng là một dấu hiệu xấu.

Thuộc tính SMART: cách đọc chúng và những thuộc tính nào cần chú ý

Các chương trình hiển thị từng tham số với nhiều trường. Nó thường bao gồm Mã định danh (1-250), Ngưỡng, Giá trị, Tệ nhất và Dữ liệu thô, ngoài các cờ (cho dù là quan trọng, thống kê, v.v.). Giá trị chuẩn hóa bắt đầu ở mức cao và giảm dần khi sử dụngVượt quá ngưỡng sẽ kích hoạt cảnh báo.

Trong số các thuộc tính hữu ích nhất để phát hiện tình trạng hao mòn hoặc hư hỏng, hãy xem xét: Khu vực_di_chuyển_Ct (phân bổ lại các khu vực), Khu vực đang chờ xử lý hiện tại (các lĩnh vực đang chờ xử lý không ổn định), Offline_Không thể sửa được (lỗi không được sửa ngoại tuyến), Relocated_Event_Count (sự kiện tái chỉ định) và trên HDD, Số lần quay lại (thử lại khi khởi động động cơ). Những điều này có liên quan đến ổ SSD. Đếm số lượng cân bằng hao mòn y Lỗi chương trình/xóa.

Nội dung độc quyền - Bấm vào đây  Thương hiệu game thủ pc tốt nhất là gì

Nhiệt độ còn gây tranh cãi, nhưng việc giữ cho đơn vị ở mức dưới 60 ° C Điều này giúp giảm thiểu khả năng xảy ra lỗi. Hãy kiểm tra luồng không khí trong khung máy và nếu cần, hãy lắp thêm tản nhiệt NVMe vào ổ đĩa M.2. tránh tình trạng bóp nghẹt và suy thoái.

kiểm tra đĩa

Windows: WMIC, PowerShell và CHKDSK

Để kiểm tra nhanh hệ thống Windows, bạn có thể sử dụng bảng điều khiển cổ điển với WMIC hoặc PowerShell, mà không cần cài đặt thêm bất cứ thứ gì, sau đó bổ sung bằng công cụ SMART toàn diện hơn nếu cần.

Với Command Prompt là quản trị viên, hãy chạy: wmic diskdrive get model, statusNếu trả về OK, trạng thái SMART là chính xác; nếu bạn thấy dự đoán thất bạiCó những thông số quan trọng và nó có liên quan Hãy sao chép và suy nghĩ về phương án thay thế..

Trong PowerShell, hãy bắt đầu với tư cách quản trị viên và khởi chạy: Get-PhysicalDisk | Select-Object MediaType, Size, SerialNumber, HealthStatus. Cánh đồng Tình trạng sức khỏe sẽ cho bạn thấy Lành mạnh, Cảnh báo hoặc Không lành mạnh, hữu ích cho phát hiện vấn đề ngay lập tức.

Để kiểm tra và sửa lỗi hệ thống tệp logic, hãy sử dụng CHKDSK. Chạy lệnh sau trong bảng điều khiển với quyền cao hơn: chkdsk C: /f /r /x để khắc phục lỗi, xác định vị trí các sector bị lỗi và tháo rời ổ đĩa nếu cần; nếu bạn cần hướng dẫn Sửa chữa Windows sau khi bị nhiễm virus nghiêm trọngHãy kiểm tra ngay bây giờ. Trong NTFS, bạn có thể sử dụng chkdsk /scan để phân tích trực tuyến.

macOS: Tiện ích đĩa và Terminal

Trên máy Mac, bạn có hai cách rất đơn giản. Một mặt, Tiện ích đĩa (Ứng dụng > Tiện ích): Chọn ổ đĩa vật lý và nhấn viện trợ đầu tiên để sửa chữa hệ thống tập tin; ngoài ra, bạn sẽ thấy Trạng thái SMART chẳng hạn như Đã xác minh hoặc Không đạt.

Nếu bạn thích Terminal, hãy chạy diskutil info /Volumes/NombreDeTuDisco và tìm kiếm dòng Trạng thái THÔNG MINH. Nếu đã được xác minh, hãy thở; nhưng, sao lưu ngay lập tức và cân nhắc thực hiện thay đổi.

Linux bổ sung: dmesg, /sys và GUI với GSmartControl

Ngoài smartctl, bạn cũng nên kiểm tra nhật ký hạt nhân để biết những thông tin sau: Lỗi I/O hoặc thời gian chờ của bộ điều khiển. Một bộ lọc nhanh sẽ là: dmesg | grep -i errorvà bổ sung nó bằng các thuật ngữ như failed o timeout.

Để biết thông tin chi tiết về thiết bị cơ bản, bạn có thể đọc các đường dẫn hệ thống như /sys/block/sdX/device/model hoặc số liệu thống kê của /sys/block/sdX/statHữu ích khi bạn muốn xác minh hoạt động và mô hình không cần dụng cụ bên ngoài.

Nếu bạn thích giao diện đồ họa, hãy cài đặt GSmartControl (ví dụ: sudo apt install -y gsmartcontrol) và chạy nó với quyền quản trị viên. Nó cho phép bạn Xem các thuộc tính, chạy thử nghiệm ngắn/dài và xuất báo cáo với một vài cú nhấp chuột.

HD Tune

Các công cụ của bên thứ ba được đề xuất

Để vượt ra ngoài những điều cơ bản khi phát hiện lỗi trong SSD bằng lệnh SMART, bạn có một số tiện ích rất phổ biến:

  • CrystalDiskInfo (Windows) miễn phí, rõ ràng và tương thích với SATA và NVMe bên trong và bên ngoài; nó hiển thị các thuộc tính SMART, nhiệt độ và giờ sử dụng.
  • HD Tune Nó bổ sung bản đồ khu vực và kiểm tra tốc độ (có phiên bản trả phí).
  • Sentinel đĩa cứng Phần mềm này tập trung vào việc giám sát liên tục, cảnh báo và báo cáo nâng cao; phiên bản miễn phí của phần mềm này có giới hạn nhưng rất mạnh mẽ trong việc giải thích SMART.
  • GSmartControl Nó miễn phí và cho phép bạn chạy thử nghiệm và xem các thuộc tính bằng giao diện đồ họa.
Nội dung độc quyền - Bấm vào đây  Làm cách nào để ép xung từ bộ xử lý đã mở khóa trong Bandizip?

Dấu hiệu cho thấy ổ SSD hoặc HDD của bạn sắp hỏng

Liệt kê các triệu chứng phổ biến: Khởi động chậm, tắt máy đột ngột, màn hình xanh chết chóc (BSoD hoặc kernel panic)Các tệp không mở được hoặc bị hỏng, không thể cài đặt hoặc cập nhật và các ổ đĩa biến mất khỏi hệ thống hoặc BIOS/UEFI.

Trên ổ cứng HDD, tiếng ồn cơ học (tiếng lách cách, tiếng rít, tiếng vo vo) là dấu hiệu không tốt. Trên ổ SSD, hãy kiểm tra lỗi ghi. lỗi khi gắn khối lượng và sự gia tăng số lượng các khu vực được điều chuyển hoặc số lượng binh sĩ hao hụt. Nếu vấn đề chỉ diễn ra không liên tục, đừng chủ quan: Tạo một bản sao ngay bây giờ.

Mua sắm thông minh: những điều cần lưu ý khi chọn đĩa nhạc mới

Nó coi trọng các thương hiệu có uy tín tốt (Seagate, WD, Toshiba, Samsung), loại đơn vị (SSD cho tốc độ, HDD cho dung lượng), giao diện (SATA, NVMe trong M.2/PCIe), bộ nhớ đệm và tản nhiệt. công suất Bạn nên ước tính nó cao hơn một chút so với nhu cầu thực tế của mình.

Kiểm tra độ bền đã được công bố (TBW trên SSD, bảo hành, MTBF với sự thận trọng), Dự kiến ​​sử dụng (Các mô hình NAS thường hoạt động và xử lý RAID tốt hơn) và ngân sách: đôi khi trả nhiều hơn một chút sẽ mang lại cho bạn sự an tâm và cuộc sống hữu ích.

Hạn chế của SMART: bối cảnh và nghiên cứu

SMART hữu ích nhưng không hoàn hảo: có sự không nhất quán giữa các nhà sản xuất Trong các định nghĩa và chuẩn hóa, một số thuộc tính rất có giá trị (đã được gán lại, đang chờ xử lý, không thể sửa), trong khi một số khác lại đóng góp rất ít. Backblaze chỉ ra rằng chỉ một số ít thuộc tính Nó tương quan tốt với các thất bại và Google đã chỉ ra các trường hợp sự cố không báo trước.

Điều này có nghĩa là gì? Nó có nghĩa là SMART giúp dự đoán nhiều vấn đề, nhưng chiến lược của bạn phải kết hợp giám sát, dự phòng (RAID), sao lưu và phục hồi. Đừng chỉ tin vào đèn giao thông xanh.

Nếu công cụ hoặc hệ thống báo cáo Cảnh báo/Có thể dự đoán được lỗi/Không lành mạnh1) Sao chép càng nhiều càng tốt ngay bây giờ, 2) Xác thực bằng một tiện ích khác để xác nhận, 3) Lên lịch thay thế ngay lập tứcSau khi thực hiện thay đổi, hãy kiểm tra RAID nếu cần để tránh rủi ro tái thiết.

Tuân thủ những điều cốt yếu sẽ giúp: SMART cảnh báo bạn về nhiều vấn đề sắp phát sinh.Nhưng không phải tất cả; cách làm việc thông minh là kết hợp nó với các cuộc kiểm tra theo lịch trình, các bản sao lưu tốt và chính sách thay thế rõ ràng khi các chỉ số quan trọng bắt đầu thay đổi.

Cách dọn dẹp sổ đăng ký Windows mà không làm hỏng bất cứ thứ gì
Bài viết liên quan:
Cách dọn dẹp sổ đăng ký Windows mà không làm hỏng bất cứ thứ gì