- ChatGPT Plus (GPT-4) ஆனது OCR ஐப் பயன்படுத்தி படங்களிலிருந்து உரையைப் பிரித்தெடுக்க உங்களை அனுமதிக்கிறது.
- இது அச்சிடப்பட்ட படங்கள், கையால் எழுதப்பட்ட உரை அல்லது குறியீடுகளுடன் வேலை செய்து அவற்றை டிஜிட்டல் உரையாக மாற்றுகிறது.
- படத்தின் தரம் மற்றும் எழுத்துரு அங்கீகார துல்லியத்தை பாதிக்கிறது.
- இது OCR க்கு அப்பால் செல்கிறது: இது பகுப்பாய்வு செய்கிறது, விளக்குகிறது மற்றும் பிரித்தெடுக்கப்பட்ட உரையுடன் நேரடியாக வேலை செய்ய உங்களை அனுமதிக்கிறது.

ChatGPT மூலம் படங்களிலிருந்து உரையைப் பிரித்தெடுப்பதற்கு முன்பு நீங்கள் என்ன தெரிந்து கொள்ள வேண்டும்? செயற்கை நுண்ணறிவைப் பயன்படுத்தி படங்களிலிருந்து நேரடியாக உரையைப் பிரித்தெடுக்கும் திறன், ஆவணங்கள், புகைப்படங்கள் மற்றும் ஸ்கேன் செய்யப்பட்ட கோப்புகளுடன் நாம் தொடர்பு கொள்ளும் விதத்தில் புரட்சியை ஏற்படுத்தி வருகிறது. இதற்கு தற்போது கிடைக்கும் மிகவும் சக்திவாய்ந்த கருவிகளில் ஒன்று ChatGPT ஆகும், குறிப்பாக GPT-4 மாடலுடன் கூடிய அதன் பிளஸ் பதிப்பு. இந்தப் பயன்பாடு வெறுமனே ஸ்கேன் செய்வதற்கு அப்பாற்பட்டது: AI காட்சி எழுத்துக்களை அங்கீகரிக்கிறது, பகுப்பாய்வு செய்கிறது மற்றும் திருத்தக்கூடிய டிஜிட்டல் உரையாக மாற்றுகிறது..
இருப்பினும், இந்த அம்சத்தைப் பயன்படுத்துவதற்கு முன், நீங்கள் முழுமையான புரிதலைப் பெறுவது முக்கியம் இது எப்படி வேலை செய்கிறது, அதற்கு என்ன வரம்புகள் உள்ளன, எந்தெந்த சந்தர்ப்பங்களில் இது உங்களுக்கு மிகவும் பயனுள்ளதாக இருக்கும். ChatGPT-யில் கட்டமைக்கப்பட்ட OCR (ஆப்டிகல் கேரக்டர் ரெகக்னிஷன்) தொழில்நுட்பம் ஆட்டோமேஷன் மற்றும் உற்பத்தித்திறனில் குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது, ஆனால் அதில் நுணுக்கங்களும் இல்லாமல் இல்லை.
ChatGPT மூலம் படங்களிலிருந்து உரையைப் பிரித்தெடுக்க உங்களுக்கு என்ன தேவை?

தொடங்குவதற்கு, ChatGPT வழியாக படங்களில் உள்ள உரை அங்கீகாரம் கட்டண பதிப்பில் மட்டுமே கிடைக்கும் (ChatGPT Plus). குறிப்பாக, GPT-4 மாதிரியை அணுக வேண்டும், ஏனெனில் இது படங்களை செயலாக்கும் திறனை இயல்பாகவே உள்ளடக்கியது.
இந்த விருப்பம் செயல்படுத்தப்பட்டவுடன், பயனர் நீங்கள் படங்களையோ அல்லது ஸ்கேன் செய்யப்பட்ட ஆவணங்களையோ நேரடியாக உரையாடலுக்கு பதிவேற்றலாம்.. "இந்தப் படத்தைப் படியுங்கள்" போன்ற குறிப்பிட்ட வழிமுறைகளை வழங்க வேண்டிய அவசியமில்லை, ஏனெனில் மாதிரியால் அது காட்சி உள்ளடக்கம் என்பதை தானாகவே கண்டறிய முடியும். மற்றும் உரை அங்கீகாரத்தை உடனடியாகத் தொடங்குகிறது.
எவ்வளவு நன்றாக இருக்கிறது என்பது வியக்க வைக்கிறது மூலக் குறியீட்டுடன் கூடிய ஸ்கிரீன்ஷாட்கள் போன்ற சிக்கலான படங்களுடன் கூட வேலை செய்கிறது., வெவ்வேறு நோக்குநிலைகளில் கையெழுத்து அல்லது உரையுடன் கூடிய புகைப்படங்கள். வரம்புகள் இருந்தாலும், எழுதப்பட்ட குறியீடுகளை (டிஜிட்டல் அல்லது கையால் எழுதப்பட்ட அச்சுக்கலை) விளக்கும் திறன் குறிப்பிடத்தக்க அளவில் மேம்பட்டுள்ளது. நீங்கள் பற்றி மேலும் அறிய ஆர்வமாக இருந்தால் கணினியில் உள்ள படங்களிலிருந்து உரையைப் பிரித்தெடுக்கிறது, இந்த கட்டுரை உங்களுக்கு பயனுள்ளதாக இருக்கும்.
ChatGPT OCR ஐப் பயன்படுத்துவதற்கான நடைமுறை எடுத்துக்காட்டுகள்
ஒரு குறிப்பிடத்தக்க உதாரணம் பதிவேற்றுவது ஒரு நிரலில் பிழையைக் கொடுக்கும் குறியீட்டின் ஒரு பகுதியின் புகைப்படம்.. ChatGPT குறியீட்டில் உள்ள எழுத்துக்களை அடையாளம் காண்பது மட்டுமல்லாமல், என்ன நடக்கிறது என்பதைப் புரிந்துகொண்டு, தனிப்பயனாக்கப்பட்ட தொழில்நுட்ப தீர்வையும் வழங்க முடியும். இதன் பொருள், காட்சிகளை எளிய உரையாக மாற்றுவதற்கு மட்டும் இது மட்டுப்படுத்தப்படவில்லை, ஆனால் பிரித்தெடுக்கப்பட்ட உரைக்கு GPT-4 இன் மொழியியல் மற்றும் சூழல் செயலாக்கத்தை நீங்கள் பயன்படுத்தலாம்..
ஆனால் மிகவும் ஆச்சரியமான விஷயம் என்னவென்றால், அதன் திறன் கையெழுத்து சரியாக கோடிட்டுக் காட்டப்படாவிட்டாலும் அதைப் புரிந்து கொள்ளுங்கள்.. "இதைப் படியெடுத்தல்" போன்ற கட்டளையுடன் நீங்கள் அதனுடன் சென்றால், அதிக துல்லியத்துடன் டிஜிட்டல் உரை வடிவத்தில் உள்ளடக்கத்தைப் பெறுவீர்கள்.
இந்த தொழில்நுட்பத்தின் மிகவும் பொதுவான பயன்பாடுகள்

படங்களில் உள்ள உரை அங்கீகார தொழில்நுட்பத்தை பல துறைகளில் பயன்படுத்தலாம். இந்த செயல்பாடு பயன்படுத்தப்படும் மிகவும் பொதுவான சூழ்நிலைகள் சில இங்கே. பெரிய மாற்றத்தை ஏற்படுத்த முடியும்.:
- இயற்பியல் கோப்புகளை டிஜிட்டல் மயமாக்குதல்: நூலகங்கள், காப்பகங்கள் மற்றும் அரசு நிறுவனங்கள் மலையளவு ஆவணங்களை நொடிகளில் செயல்படுத்தக்கூடிய தரவுகளாக மாற்ற முடியும்.
- அலுவலக ஆட்டோமேஷன்: கையால் எழுதப்பட்ட அல்லது அச்சிடப்பட்ட படிவங்களின் ஸ்கேன்களை எளிதாக சேமிப்பதற்காக அல்லது குறிப்புக்காக டிஜிட்டல் மயமாக்கலாம்.
- ஆவணங்களைக் கையாளுதல்: உரை படியெடுக்கப்பட்டவுடன், அதை தானாகவே மொழிபெயர்க்க முடியும், அச்சிடப்பட்ட ஆவணங்களில் உள்ள மொழித் தடைகளை நீக்குகிறது.
- கணக்கியல் மேலாண்மை: விலைப்பட்டியல்கள், ரசீதுகள் மற்றும் டிக்கெட்டுகளை மேலாண்மை அமைப்புகளில் ஒருங்கிணைக்கும் சாத்தியத்துடன் செயலாக்கப்பட்டு கட்டமைக்கப்படலாம்.
- இதழியல் மற்றும் ஆராய்ச்சி: அறிக்கைகளை எழுதும்போது புலப் படங்கள் அல்லது ஸ்கேன் செய்யப்பட்ட ஆவணங்களிலிருந்து உள்ளடக்கத்தைப் பிரித்தெடுப்பது நிறைய நேரத்தை மிச்சப்படுத்தும்.
- விரைவான தரவு உள்ளீடு: அதிக அளவிலான ஆவணங்களை டிஜிட்டல் மயமாக்க வேண்டிய நிறுவனங்கள் மனித செலவுகள் மற்றும் பிழைகளைக் குறைக்கலாம்.
இந்தப் பணிக்கு ChatGPT-ஐப் பயன்படுத்துவதன் சிறந்த நன்மைகளில் ஒன்று, உங்களுக்குப் பல கருவிகள் தேவையில்லை.: நீங்கள் படத்தை பதிவேற்றலாம், உரையைப் பிரித்தெடுக்கலாம் மற்றும் அதே அரட்டையில் நேரடியாக அதனுடன் தொடர்ந்து பணியாற்றலாம். நீங்கள் திருத்தினாலும், சுருக்கினாலும், மொழிபெயர்த்தாலும், பகுப்பாய்வு செய்தாலும், நீங்கள் அங்கிருந்து தொடரலாம்.
நீங்கள் கருத்தில் கொள்ள வேண்டிய வரம்புகள்
எந்த தொழில்நுட்பத்தையும் போலவே, இதுவும் சரியானதல்ல. சில உள்ளன ChatGPT OCR இன் துல்லியத்தைக் குறைக்கக்கூடிய தொழில்நுட்ப மற்றும் சூழல் நிலைமைகள். மிகவும் பொருத்தமானவற்றை கீழே விவரிக்கிறோம்:
- படத்தின் தரம்: மங்கலான, பிக்சலேட்டட் அல்லது மோசமாக வெளிச்சம் உள்ள புகைப்படம் அங்கீகாரத்தை கடினமாக்கும்.
- எழுத்துரு பாணிகள்: அலங்கார எழுத்துருக்கள் அல்லது கலை கையெழுத்து போன்ற சிக்கலான எழுத்துக்களை விளக்குவது மிகவும் கடினம்.
- அரிய மொழிகள் மற்றும் சின்னங்கள்: சீன அல்லது ஜப்பானிய போன்ற ஐடியோகிராம்களைக் கொண்ட மொழிகள் அல்லது அசாதாரண சின்னங்கள், ஒரு பெரிய சவாலைக் குறிக்கின்றன.
- சிக்கலான வடிவமைப்புகள்: நேரியல் அல்லாத வடிவங்களில் உள்ள உரை (நெடுவரிசைகள், வட்டங்கள் அல்லது மூலைகள் போன்றவை) அமைப்பைக் குழப்பக்கூடும்.
- காட்சிப் பிழைகள்: 'O' மற்றும் '0' அல்லது '1' மற்றும் 'l' போன்ற ஒத்த எழுத்துக்கள் தெளிவாக வேறுபடுத்தப்படாவிட்டால் விளக்கப் பிழைகளுக்கு வழிவகுக்கும்.
- உரையின் நடுவில் உள்ள கிராஃபிக் கூறுகள்: விளக்கப்படங்கள், மேலடுக்குகள் அல்லது வாட்டர்மார்க்குகள் OCR இல் குறுக்கிடக்கூடும்.
நீங்கள் படத்தை நன்றாகத் தயாரித்தால், வெற்றிக்கான வாய்ப்புகள் அதிவேகமாக அதிகரிக்கும்.. போதுமான வெளிச்சம், போதுமான மாறுபாடு மற்றும் உரை சட்டகத்திற்குள் முடிந்தவரை சிறப்பாக சீரமைக்கப்பட்டுள்ளதா என்பதை உறுதிப்படுத்திக் கொள்ளுங்கள்.
படங்களைப் பயன்படுத்துவதில் தனியுரிமை மற்றும் நெறிமுறை வரம்புகள்
இந்த செயல்பாடுகள் தொடர்பாக மிகவும் விவாதிக்கப்பட்ட அம்சங்களில் ஒன்று படங்களிலிருந்து பிரித்தெடுக்கப்பட்ட தரவின் தனியுரிமை மற்றும் பாதுகாப்பு. ChatGPT-யில் பதிவேற்றப்படும் படங்களில் உள்ளவர்களின் அடையாளத்தைப் பாதுகாக்க OpenAI குறிப்பிடத்தக்க கட்டுப்பாடுகளை விதித்துள்ளது.
உதாரணமாக, புகைப்படங்களின் அடிப்படையில் மனிதர்களை அடையாளம் காண இந்த அமைப்பு மறுக்கிறது.. அவர்கள் பொது நபர்களாக இருந்தாலும் கூட இல்லை. இந்த நடவடிக்கை பயனர் தனியுரிமையைப் பாதுகாப்பதற்கும் தவறான அல்லது தீங்கிழைக்கும் பயன்பாடுகளைத் தடுப்பதற்கும் வடிவமைக்கப்பட்டுள்ளது.
கூடுதலாக, இந்த அமைப்பு வெளிப்படையான மற்றும் உணர்திறன் மிக்க உள்ளடக்கத்தை வடிகட்டும் திறன் கொண்டது. இந்தக் கட்டுப்பாடுகள் மீற முயற்சிக்கும் சூழ்நிலைகளில், மாதிரி நிராகரிப்பு அல்லது வரம்புச் செய்திகளுடன் பதிலளிக்கும், அத்தகைய செயல்கள் அனுமதிக்கப்படாது என்பதை விளக்கும்.
பொதுவான தவறுகள் மற்றும் ஏதாவது தவறு நடந்தால் என்ன செய்வது
மிகவும் அடிக்கடி எழும் சந்தேகங்களில் ஒன்று, என்ன செய்வது என்பதுதான் OCR முடிவு எதிர்பார்த்தபடி இல்லை.. இங்கே சில பயனுள்ள குறிப்புகள் உள்ளன:
- படத்தைச் சரிபார்க்கவும்: தெளிவாகத் தெரியும் உரையுடன், தேவையற்ற காட்சி இரைச்சல் இல்லாமல், அது கவனம் செலுத்தப்பட்டுள்ளதா என்பதை உறுதிப்படுத்திக் கொள்ளுங்கள்.
- வெவ்வேறு வடிவங்களை முயற்சிக்கவும்: சில நேரங்களில் ஒரு PNG, JPEG ஐ விட சிறப்பாக செயல்படும், அல்லது நேர்மாறாகவும்.
- நீண்ட ஆவணங்களைப் பிரிக்கவும்: உங்கள் படத்தில் நிறைய உரை இருந்தால், அதைப் பல பகுதிகளாகப் பிரித்து, துண்டுகளாகப் பதிவேற்றவும்.
- தெளிவான வழிமுறைகளைப் பயன்படுத்தவும்: "இதை டிரான்ஸ்கிரிப்ட் செய்" அல்லது "டெக்ஸ்ட்டாக மாற்று" போன்ற சொற்றொடர்கள், சிஸ்டம் தானாகவே பதிலளிக்கவில்லை என்றால் அதை வழிநடத்த உதவும்.
முதலில் OCR மூலம் உரையைப் பிரித்தெடுத்து, பின்னர் ChatGPT-யிடம் அதைப் பிரித்தெடுக்கச் சொல்வதன் மூலம் நீங்கள் எப்போதும் உரையின் சுத்தமான பதிப்பைப் பெறலாம். சரி செய், கட்டமை, சுருக்கு அல்லது மொழிபெயர்.. ChatGPT மூலம் படங்களிலிருந்து உரையைப் பிரித்தெடுப்பதற்கு முன்பு நீங்கள் தெரிந்து கொள்ள வேண்டியதை இப்போது நீங்கள் அறிந்திருக்கிறீர்கள், உங்களுக்கு உதவக்கூடிய மாற்று வழிகளைப் பார்ப்போம்.
வெளிப்புற மாற்றீட்டைப் பயன்படுத்துவது எப்போது நல்லது?

ChatGPT மிகவும் விரிவான தீர்வை வழங்கினாலும், சில நேரங்களில் OCR-க்கு மட்டுமே பிரத்யேகமாக அர்ப்பணிக்கப்பட்ட கருவிகளைப் பயன்படுத்துவது மிகவும் திறமையானதாக இருக்கலாம்.போன்ற அடோப் ஸ்கேன், Google லென்ஸ் அல்லது உரையை டிஜிட்டல் மயமாக்க குறிப்பிட்ட பயன்பாடுகள்.
இவை பொதுவாக அச்சிடப்பட்ட ஆவணங்களில் உள்ள உரைக்காக பிரத்யேகமாகப் பயிற்சியளிக்கப்படுகின்றன, மேலும் உரைத் தொகுதித் தேர்வு, அட்டவணை கண்டறிதல் அல்லது திருத்தக்கூடிய PDFக்கு நேரடி ஏற்றுமதி போன்ற மேம்பட்ட விருப்பங்களைக் கொண்டுள்ளன. எக்செல்லில் உதவக்கூடிய முறைகள் உள்ளன என்பதையும் நினைவில் கொள்வது அவசியம், மேலும் இந்தக் கட்டுரையில் அவற்றை விளக்குகிறோம். ஒரு உரை சரத்திலிருந்து முதல் அல்லது கடைசி வார்த்தையைப் பிரித்தெடுக்க எக்செல் இல் உரை செயல்பாட்டை எவ்வாறு பயன்படுத்துவது?.
எனினும், ChatGPT-யின் சக்தி என்னவென்றால், அது OCR-ஐ மொழியியல் செயலாக்கத்துடன் இணைக்கிறது.. நீங்கள் அவற்றைத் தனித்தனியாக பகுப்பாய்வு செய்ய வேண்டியிருந்தால், எழுத்துக்களைப் பிரித்தெடுப்பதில் எந்தப் பயனும் இல்லை. இங்குதான் ChatGPT பிரகாசிக்கிறது, அனைத்திலும் ஒருங்கிணைந்த தீர்வை வழங்குகிறது.
ChatGPT போன்ற மொழி மாதிரிகளில் OCR ஐ ஒருங்கிணைப்பது சாத்தியக்கூறுகளின் உலகத்தைத் திறக்கிறது. இருந்து வணிகப் பணி ஆட்டோமேஷன் முதல் நிகழ்நேர ஆவண மொழிபெயர்ப்பு மற்றும் பகுப்பாய்வு வரை. இதற்கு வரம்புகள் இருந்தாலும், அதன் நடைமுறை பயன்பாடுகள் தற்போதைய தொழில்நுட்ப தடைகளை விட மிக அதிகம். இந்த மாதிரிகள் அனுபவிக்கும் முன்னேற்றத்தின் வேகத்தைக் கருத்தில் கொண்டு, பாதகமான சூழ்நிலைகளில் கூட, அவை விரைவில் கிட்டத்தட்ட 100% நம்பகத்தன்மையை அடையும் என்று நினைப்பது நியாயமற்றது அல்ல. ChatGPT மூலம் படங்களிலிருந்து உரையைப் பிரித்தெடுப்பதற்கு முன்பு நீங்கள் தெரிந்து கொள்ள வேண்டியவற்றை இந்தக் கட்டுரையின் முடிவில் நீங்கள் அறிந்துகொள்வீர்கள் என்று நம்புகிறோம்.
சின்ன வயசுல இருந்தே டெக்னாலஜி மேல ஆர்வம். இந்தத் துறையில் புதுப்பித்த நிலையில் இருப்பதையும், எல்லாவற்றிற்கும் மேலாக, அதைத் தொடர்புகொள்வதையும் நான் விரும்புகிறேன். அதனால்தான் நான் பல ஆண்டுகளாக தொழில்நுட்பம் மற்றும் வீடியோ கேம் வலைத்தளங்களில் தொடர்பு கொள்ள அர்ப்பணித்துள்ளேன். ஆண்ட்ராய்டு, விண்டோஸ், மேகோஸ், ஐஓஎஸ், நிண்டெண்டோ அல்லது வேறு ஏதேனும் தொடர்புடைய தலைப்பைப் பற்றி நான் எழுதுவதை நீங்கள் காணலாம்.
