Bạn sẽ không bao giờ phải gõ nữa: Các tùy chọn tốt nhất để trích xuất văn bản từ hình ảnh trong Windows

Cập nhật lần cuối: 13/05/2025
Tác giả: Alberto Navarro

  • Tính năng nhận dạng hình ảnh (OCR) hiện đã được tích hợp sẵn trong Windows 11 và PowerToys.
  • Có một số phương pháp đáng tin cậy và miễn phí để trích xuất văn bản từ ảnh hoặc ảnh chụp màn hình.
  • Các công cụ như OneNote và các dịch vụ trực tuyến cung cấp đầy đủ các tùy chọn có sẵn cho mọi người dùng.
  • Việc lựa chọn phương pháp phù hợp nhất phụ thuộc vào phiên bản Windows và loại hình ảnh được sử dụng.
Qué es OCR

En la era digital, thu thập thông tin từ hình ảnh hoặc bức ảnh trên máy tính của bạn đã trở thành nhu cầu ngày càng phổ biến. Cho dù bạn muốn quét tài liệu đã in, lấy dữ liệu từ ảnh chụp màn hình hay chỉ sao chép văn bản từ ảnh ai đó gửi cho bạn, Windows đều cung cấp nhiều cách để thực hiện.

Muchos usuarios desconocen que Trích xuất văn bản từ hình ảnh trong Windows Giờ đây, việc này dễ dàng hơn bao giờ hết nhờ các tính năng mới có trong phiên bản mới nhất của hệ điều hành và một số công cụ bên ngoài. Microsoft đã đạt được tiến bộ đáng kể để tạo điều kiện thuận lợi cho nhiệm vụ này, tránh việc phải ghi thủ công một lượng lớn thông tin.

OCR là gì và nó được sử dụng để làm gì?

Trích xuất văn bản từ ảnh trong Windows 8

Trước khi bắt tay vào thực hiện các phương pháp và công cụ thực tế, điều quan trọng là phải hiểu rõ khái niệm chính giúp thực hiện quy trình này: Reconocimiento Óptico de Caracteres, más conocido como OCR por sus siglas en inglés (Optical Character Recognition). Công nghệ này Nhận dạng và số hóa các ký tự in hoặc viết tay có trong hình ảnh, ảnh chụp hoặc thậm chí là videovà chuyển đổi chúng thành văn bản có thể chỉnh sửa.

OCR có ích rất lớn trong cuộc sống hàng ngày. Bạn có thể sao chép nội dung từ các tài liệu được quét, áp phích ảnh, ảnh chụp màn hình hoặc bất kỳ hình ảnh nào mà thông thường không thể chọn được văn bản.. Bằng cách này, văn bản đó sẽ được lưu vào bảng tạm và bạn có thể dán vào bất kỳ ứng dụng nào để chỉnh sửa, dịch, chia sẻ hoặc lưu trữ.

Phương pháp chính để trích xuất văn bản từ hình ảnh trong Windows

OCR

Chúng tôi sẽ phân tích tất cả các giải pháp thay thế thiết thực và hiện đại mà bạn có thể sử dụng trong Windows để trích xuất văn bản từ hình ảnh, bằng cách sử dụng các công cụ riêng của hệ thống cũng như các tiện ích miễn phí hoặc ứng dụng trực tuyến khác. Mỗi phương pháp đều có ưu điểm, đặc điểm và trường hợp sử dụng lý tưởng riêng.

1. Sử dụng Công cụ cắt và OCR được tích hợp trong Windows 11

OCR trong Clippings

Kể từ khi Microsoft phát hành bản cập nhật Windows 23 2H11, Công cụ cắt truyền thống đã trải qua một cuộc cải tiến lớn. Bây giờ bao gồm một chức năng của OCR tích hợp có thể nhận dạng chính xác văn bản trong hình ảnh và ảnh chụp màn hình. Có lẽ đây là lựa chọn trực tiếp và đơn giản nhất.

Nội dung độc quyền - Bấm vào đây  Cómo hacer PDF con iPhone

Các bước để trích xuất văn bản bằng Công cụ cắt trong Windows 11:

  • Xác nhận rằng bạn có Windows 11 phiên bản 23H2 trở lên. Bản cập nhật này rất cần thiết vì nó kích hoạt tính năng nhận dạng văn bản. Nếu bạn chưa có, hãy kiểm tra bản cập nhật hệ thống mới.
  • Mở hình ảnh mà bạn muốn trích xuất văn bản hoặc chụp ảnh màn hình mới bằng ứng dụng Snipping. Bạn có thể mở ứng dụng từ menu Bắt đầu bằng cách tìm kiếm "Snipping Tool" hoặc sử dụng phím tắt Win + Mayús + S.
  • Để làm việc với hình ảnh hiện có, bạn chỉ cần chọn ba dấu chấm ở góc trên bên phải và nhấp vào "Mở tệp", sau đó chọn ảnh hoặc ảnh chụp màn hình của bạn.
  • En la barra de herramientas, selecciona la opción Acciones de texto. Khi bạn nhấp vào tính năng này, hệ thống sẽ sử dụng trí tuệ nhân tạo để tự động làm nổi bật toàn bộ văn bản được phát hiện trong hình ảnh.
  • Để sao chép văn bản, chỉ cần nhấp vào «Sao chép toàn bộ văn bản» ở trên cùng, hoặc chọn thủ công một phần cụ thể và sử dụng nhấp chuột phải hoặc Ctrl + C để gửi nó vào bảng tạm.
  • El contenido Bây giờ đã sẵn sàng để dán vào bất kỳ ứng dụng nào: Word, notepad, mail, trình duyệt, v.v.

Mẹo: Para obtener mejores resultados, sử dụng hình ảnh chất lượng tốt, độ phân giải cao, không có thành phần mờ hoặc quá nhỏ. Trong những hình ảnh chất lượng kém, việc nhận dạng có thể không chính xác và sẽ cần phải chỉnh sửa lại văn bản kết quả.

2. PowerToys và mô-đun Text Extractor của nó: tính linh hoạt hoàn toàn để trích xuất văn bản

Bật Trình trích xuất văn bản trong PowerToys

Một giải pháp thay thế phổ biến và rất mạnh mẽ khác, đặc biệt nếu bạn có Windows 10 hoặc muốn linh hoạt hơn, là tiện ích Đồ chơi điện tử từ Microsoft. Tích hợp một chức năng được gọi là Text Extractor cho phép bạn trích xuất văn bản từ bất kỳ phần nào có thể nhìn thấy trên màn hình, cho dù đó là ảnh, video, tài liệu được quét hoặc thậm chí từ các ứng dụng không cho phép bạn sao chép trực tiếp văn bản.

PowerToys là gì? Son un Bộ tiện ích nâng cao miễn phí để tận dụng tối đa hệ điều hành Windows của bạn. Trong số nhiều tùy chọn có sẵn, Text Extractor nổi bật hơn cả vì tính đơn giản và hữu ích của nó đối với công việc hiện tại.

Cách sử dụng PowerToys Text Extractor từng bước:

  • Tải xuống và cài đặt PowerToys từ trang GitHub chính thức hoặc Microsoft Store.
  • Truy cập ứng dụng và tìm kiếm Phần «Trích xuất văn bản» ở bảng điều khiển bên trái.
  • Hãy đảm bảo rằng función está activada. Từ cùng một màn hình, bạn có thể tùy chỉnh phím tắt mà bạn sẽ kích hoạt để khởi chạy trình trích xuất (theo mặc định, đó là Win + Shift + T).
  • Khi bạn muốn sao chép văn bản, mở hoặc đặt hình ảnh trên màn hình (hoặc bất kỳ nội dung trực quan nào) mà bạn cần trích xuất thông tin.
  • Nhấn phím tắt tương ứng. Bạn sẽ thấy màn hình tối lại và một dấu thập xuất hiện để chọn vùng.
  • Chọn bằng cách giữ nút chuột trái khu vực cụ thể nơi văn bản cần được chụp nằm.
  • Khi phát hành, OCR sẽ phân tích khu vực và sao chép văn bản trực tiếp vào clipboard.
Nội dung độc quyền - Bấm vào đây  Como Hacer La Raya Del Ojo De Abajo

Phương pháp này không chỉ hiệu quả với hình ảnh mà còn với mọi thứ bạn thấy trên màn hình. Ví dụ, nó hữu ích khi sao chép văn bản từ các ứng dụng không cho phép, video bị tạm dừng, tệp PDF được bảo vệ, ảnh chụp màn hình trò chơi điện tử, v.v. Ngoài ra, độ tin cậy và khả năng tương thích ngôn ngữ phụ thuộc vào Gói ngôn ngữ OCR được cài đặt trên Windows. Bạn có thể kiểm tra và cài đặt thêm ngôn ngữ nếu cần bằng cách sử dụng PowerShell với tư cách quản trị viên.

Cài đặt và cấu hình nâng cao cho PowerToys Text Extractor

Trong PowerToys, bạn có thể tùy chỉnh một số tùy chọn liên quan đến Text Extractor:

  • Combinación de teclas: Sửa đổi phím tắt chung để điều chỉnh hoạt động theo sở thích của bạn và tránh xung đột với các ứng dụng khác.
  • Idioma preferido: Chọn gói ngôn ngữ OCR phù hợp nhất với văn bản bạn muốn nhận dạng.

Nếu bạn cần cài đặt hoặc kiểm tra những ngôn ngữ nào khả dụng, bạn có thể mở PowerShell với tư cách quản trị viên và sử dụng các lệnh sau:

  • Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' } để liệt kê các gói OCR đã cài đặt hoặc có sẵn.
  • $Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*es-ES*' } để tìm kiếm gói tiếng Tây Ban Nha chẳng hạn.
  • $Capability | Add-WindowsCapability -Online để cài đặt nó, hoặc $Capability | Remove-WindowsCapability -Online nếu bạn muốn xóa nó.

Nếu tại bất kỳ thời điểm nào, PowerToys thông báo với bạn rằng "Không có ngôn ngữ OCR nào được cài đặt", hãy đảm bảo rằng ngôn ngữ bạn cần được cài đặt chính xác và thư mục của bạn /Windows/OCR ở đúng đơn vị (C:).

Tận dụng tối đa OneNote và các chương trình khác của Microsoft

OCR trong OneNote

Một lựa chọn cổ điển khác, vẫn hợp lệ và đặc biệt thiết thực nếu bạn sử dụng nhiều bộ Microsoft Office là OneNote. Ứng dụng ghi chú này cũng tích hợp OCR (Điểm kiểm soát quang học quan trọng) cho phép bạn trích xuất văn bản từ hình ảnh một cách nhanh chóng và dễ dàng.

Cách sao chép văn bản từ hình ảnh bằng OneNote:

  • Mở ứng dụng OneNote, có sẵn miễn phí hoặc thông qua Microsoft 365.
  • Carga la imagen mà bạn muốn lấy văn bản từ đó.
  • Haz clic derecho sobre la imagen y selecciona la opción «Copiar texto de la imagen» en el menú contextual.
  • Văn bản sẽ được tự động sao chép vào bảng tạm. Hiện nay bạn có thể dán nó ở bất cứ đâu bạn muốn: Từ ngữ, thư, ghi chú, v.v.
Nội dung độc quyền - Bấm vào đây  Como Funciona Pay Joy

Tính năng này đặc biệt hữu ích trong môi trường văn phòng và nếu bạn đã sử dụng OneNote để sắp xếp thông tin. Bên cạnh đó, OneNote nhận dạng văn bản bằng nhiều ngôn ngữ và xử lý tốt hình ảnh có chất lượng khác nhau..

Các lựa chọn thay thế bên ngoài khác: Google Keep, Adobe Acrobat và các lựa chọn khác

Adobe Acrobat OCR

Có lẽ một trong những giải pháp trên không phù hợp với sở thích của bạn hoặc bạn đã sử dụng những công cụ khác trong cuộc sống hàng ngày. Họ tồn tại nhiều ứng dụng và tiện ích cũng tích hợp chức năng OCR để trích xuất văn bản từ hình ảnh trong Windows.

  • Google Keep: Đây là ứng dụng ghi chú của Google. Nó cho phép bạn tải lên hình ảnh và trích xuất văn bản bên trong nhờ chức năng OCR tích hợp. Tất cả đều có trên phiên bản web mà không cần phải cài đặt bất cứ thứ gì.
  • Adobe Acrobat ReaderNếu bạn làm việc với các tệp PDF có chứa hình ảnh được quét hoặc tài liệu đồ họa, Acrobat cho phép bạn trích xuất văn bản bằng công nghệ OCR. Tuy nhiên, để có được các tùy chọn nâng cao, bạn cần phải đăng ký phiên bản trả phí.
  • Otras appsCó những chương trình của bên thứ ba dành cho Windows cung cấp chức năng OCR rất tiên tiến, nhưng các tùy chọn được mô tả ở trên thường đáp ứng hầu hết các nhu cầu phổ biến mà không mất phí.

Mẹo để đạt được khả năng nhận dạng văn bản tốt hơn trong hình ảnh

Bất kể bạn chọn phương pháp nào, một số mẹo chung có thể tạo nên sự khác biệt về mặt chất lượng và độ chính xác của văn bản được trích xuất:

  • Sử dụng hình ảnh sắc nét, đủ sáng, không bị mờ.
  • Tránh những bức ảnh quá nhỏ hoặc có độ phân giải thấp.
  • Si puedes, cắt xén hình ảnh trước để chỉ hiển thị văn bản có liên quan, do đó OCR sẽ hoạt động với ít nhiễu hình ảnh hơn.
  • Kiểm tra xem ngôn ngữ hình ảnh có khớp với ngôn ngữ OCR đã cài đặt không trên hệ thống của bạn, nếu bạn sử dụng PowerToys hoặc các công cụ khác cho phép điều đó.
  • Luôn xem lại văn bản kết quả, vì một số ký hiệu, từ ngữ không rõ ràng hoặc định dạng đặc biệt có thể không được nhận dạng chính xác.

Sự tiến bộ của trí tuệ nhân tạo và OCR trong Windows đã tạo điều kiện thuận lợi rất nhiều cho một nhiệm vụ, Cho đến gần đây, việc này đòi hỏi phải cài đặt các chương trình chuyên dụng hoặc sao chép thông tin từ hình ảnh theo cách thủ công.. Các tính năng gốc của Windows, PowerPoint, OneNote và nhiều dịch vụ web khác cung cấp các tùy chọn miễn phí và hiệu quả để chuyển đổi bất kỳ văn bản hoặc hình ảnh nào thành thông tin có thể chỉnh sửa chỉ trong vài giây.

La elección del método Điều này sẽ phụ thuộc vào phiên bản Windows và nhu cầu cụ thể của bạn., nhưng sự đa dạng của các tùy chọn có sẵn giúp bạn dễ dàng làm việc hiệu quả hơn và tiết kiệm thời gian cho các công việc thường ngày.

Những điều bạn nên biết trước khi trích xuất văn bản từ hình ảnh bằng ChatGPT
Bài viết liên quan:
Những điều bạn nên biết trước khi trích xuất văn bản từ hình ảnh bằng ChatGPT