- ChatGPT Plus (GPT-4) թույլ է տալիս նկարներից տեքստ հանել OCR-ի միջոցով:
- Այն աշխատում է տպագիր պատկերների, ձեռագիր տեքստի կամ կոդերի հետ և դրանք վերածում է թվային տեքստի:
- Պատկերի որակը և տառատեսակը ազդում են ճանաչման ճշգրտության վրա:
- Այն դուրս է գալիս OCR-ից. այն վերլուծում է, մեկնաբանում և թույլ է տալիս ուղղակիորեն աշխատել արդյունահանված տեքստի հետ:

Ի՞նչ պետք է իմանաք նախքան ChatGPT-ով պատկերներից տեքստ հանելը: Արհեստական ինտելեկտի միջոցով պատկերներից անմիջապես տեքստ հանելու ունակությունը հեղափոխում է փաստաթղթերի, լուսանկարների և սկանավորված ֆայլերի հետ մեր փոխազդեցության ձևը: Ներկայումս դրա համար հասանելի ամենահզոր գործիքներից մեկը ChatGPT-ն է, հատկապես դրա Plus տարբերակը GPT-4 մոդելով: Այս օգտագործումը դուրս է գալիս պարզապես սկանավորումից. AI-ն ճանաչում, վերլուծում և փոխակերպում է տեսողական նիշերը խմբագրելի թվային տեքստի.
Այնուամենայնիվ, նախքան այս ֆունկցիան օգտագործելը, կարևոր է, որ դուք մանրամասն ըմբռնեք ինչպես է այն աշխատում, ինչ սահմանափակումներ ունի և ինչ դեպքերում կարող է հատկապես օգտակար լինել ձեզ համար. ChatGPT-ում ներկառուցված OCR (Optical Character Recognition) տեխնոլոգիան զգալի թռիչք է ավտոմատացման և արտադրողականության մեջ, բայց այն զուրկ չէ իր նրբություններից:
Ի՞նչ է անհրաժեշտ ChatGPT-ով պատկերներից տեքստ հանելու համար:

Սկսելու համար, ChatGPT-ի միջոցով պատկերներում տեքստի ճանաչումը հասանելի է միայն վճարովի տարբերակում (ChatGPT Plus). Մասնավորապես, ձեզ անհրաժեշտ է մուտք գործել GPT-4 մոդել, քանի որ այն իր մեջ ներառում է պատկերները մշակելու հնարավորությունը:
Այս տարբերակը ակտիվացնելուց հետո օգտվողը Դուք կարող եք պատկերներ կամ սկանավորված փաստաթղթեր վերբեռնել անմիջապես խոսակցության մեջ. Կարիք չկա հատուկ հրահանգներ տալ, ինչպիսին է «կարդա այս պատկերը», քանի որ մոդելն ի վիճակի է ավտոմատ կերպով հայտնաբերել, որ դա տեսողական բովանդակություն է և անմիջապես սկսում է տեքստի ճանաչումը:
Զարմանալի է, թե որքան լավ Աշխատում է նույնիսկ բարդ պատկերների հետ, ինչպիսիք են սկզբնական կոդով սքրինշոթերը, տարբեր կողմնորոշումների ձեռագրով կամ տեքստով լուսանկարներ։ Թեև կան սահմանափակումներ, գրավոր նշանները մեկնաբանելու ունակությունը (լինի թվային, թե ձեռագիր տպագրություն) զգալիորեն բարելավվել է: Եթե դուք հետաքրքրված եք ավելին իմանալու մասին համակարգչի վրա պատկերներից տեքստի դուրսբերում, այս հոդվածը օգտակար կլինի ձեզ համար:
ChatGPT OCR-ի օգտագործման գործնական օրինակներ
Վառ օրինակ է վերբեռնումը a կոդի հատվածի լուսանկար, որը սխալ է թույլ տալիս ծրագրում. ChatGPT-ն ոչ միայն ի վիճակի է նույնականացնել կոդի նիշերը, այլև կարող է հասկանալ, թե ինչ է կատարվում և առաջարկել հարմարեցված տեխնիկական լուծում: Սա նշանակում է, որ այն չի սահմանափակվում միայն տեսողական պատկերները պարզ տեքստի վերածելով, այլ Դուք կարող եք կիրառել GPT-4-ի լեզվական և համատեքստային մշակումը արդյունահանված տեքստի վրա.
Բայց ամենազարմանալին նրա կարողությունն է հասկանալ ձեռագիրը, նույնիսկ երբ այն կատարյալ ուրվագծված չէ. Եթե դուք այն ուղեկցում եք այնպիսի հրամանով, ինչպիսին է «արտագրեք սա», դուք կստանաք բովանդակությունը թվային տեքստի տեսքով՝ բարձր ճշգրտությամբ:
Այս տեխնոլոգիայի ամենատարածված օգտագործումը

Պատկերներում տեքստի ճանաչման տեխնոլոգիան կարող է օգտագործվել բազմաթիվ ոլորտներում: Ահա մի քանի ամենատարածված սցենարները, որտեղ օգտագործվում է այս գործառույթը կարող է մեծ տարբերություն առաջացնել:
- Ֆիզիկական ֆայլերի թվայնացում. Գրադարանները, արխիվները և պետական կառույցները կարող են մի քանի վայրկյանում փաստաթղթերի սարերը վերածել գործող տվյալների:
- Գրասենյակի ավտոմատացում. Ձեռագիր կամ տպագիր ձևաթղթերի սկանավորումները կարող են թվայնացվել՝ հեշտ պահպանման կամ հղման համար:
- Փաստաթղթերի ներկայացում. Տեքստը տառադարձվելուց հետո այն կարող է ավտոմատ կերպով թարգմանվել՝ վերացնելով տպագիր փաստաթղթերում լեզվական խոչընդոտները:
- Հաշվապահական կառավարում. Հաշիվ-ապրանքագրերը, անդորրագրերը և տոմսերը կարող են մշակվել և կառուցվածքավորվել՝ դրանք կառավարման համակարգերում ինտեգրելու հնարավորությամբ:
- Լրագրություն և հետազոտություն. Դաշտային պատկերներից կամ սկանավորված փաստաթղթերից բովանդակություն հանելը կարող է շատ ժամանակ խնայել հաշվետվություններ գրելիս:
- Տվյալների արագ մուտքագրում. Ընկերությունները, որոնք պետք է թվայնացնեն մեծ ծավալի փաստաթղթեր, կարող են նվազեցնել մարդկային ծախսերն ու սխալները:
Այս առաջադրանքի համար ChatGPT-ի օգտագործման մեծ առավելություններից մեկն այն է, որ ձեզ հարկավոր չեն բազմաթիվ գործիքներ:Դուք կարող եք վերբեռնել պատկերը, հանել տեքստը և շարունակել աշխատել դրա հետ անմիջապես նույն չաթում: Անկախ նրանից, թե խմբագրում եք, ամփոփում, թարգմանում կամ վերլուծում, կարող եք շարունակել այնտեղից:
Սահմանափակումներ, որոնք դուք պետք է հաշվի առնեք
Ինչպես ցանկացած տեխնոլոգիա, այս մեկը կատարյալ չէ: Կան որոշակի Տեխնիկական և համատեքստային պայմաններ, որոնք կարող են նվազեցնել ChatGPT OCR-ի ճշգրտությունը. Ստորև ներկայացնում ենք ամենաարդիականները.
- Պատկերի որակը. Լղոզված, պիքսելացված կամ վատ լուսավորված լուսանկարը կարող է դժվարացնել ճանաչումը:
- Տառատեսակի ոճերը. Դեկորատիվ տառատեսակները կամ բարդ տառերը, ինչպիսիք են գեղարվեստական գեղագրությունը, ավելի դժվար են մեկնաբանվում:
- Հազվագյուտ լեզուներ և նշաններ. Գաղափարագրերով լեզուները, ինչպիսիք են չինարենը կամ ճապոներենը, կամ ոչ սովորական նշանները, ավելի մեծ մարտահրավեր են ներկայացնում:
- Կոմպլեքս դիզայն. Ոչ գծային ձևաչափերով տեքստը (օրինակ՝ սյունակներ, շրջանակներ կամ անկյուններ) կարող է շփոթեցնել համակարգը:
- Տեսողական սխալներ. Նմանատիպ տառերը, ինչպիսիք են «O» և «0» կամ «1» և «l» կարող են հանգեցնել մեկնաբանության սխալների, եթե դրանք հստակորեն տարբերված չեն:
- Գրաֆիկական տարրեր տեքստի մեջտեղում. Նկարազարդումները, ծածկույթները կամ ջրանիշերը կարող են խանգարել OCR-ին:
Եթե պատկերը լավ եք պատրաստում, հաջողության շանսերը երկրաչափորեն մեծանում են։. Համոզվեք, որ այն ունի բավարար լույս, համապատասխան հակադրություն, և որ տեքստը հնարավորինս լավ հավասարեցված է շրջանակի ներսում:
Պատկերների օգտագործման գաղտնիությունը և էթիկական սահմանափակումները
Այս գործառույթների վերաբերյալ ամենաքննարկվող ասպեկտներից մեկն այն է պատկերներից հանված տվյալների գաղտնիությունը և անվտանգությունը. OpenAI-ը զգալի սահմանափակումներ է մտցրել ChatGPT-ում վերբեռնված պատկերներում մարդկանց ինքնությունը պաշտպանելու համար:
Eg Համակարգը հրաժարվում է լուսանկարների հիման վրա մարդկանց առարկաների նույնականացումից. Նույնիսկ եթե նրանք հասարակական գործիչներ են։ Այս միջոցը նախատեսված է պաշտպանելու օգտատերերի գաղտնիությունը և կանխելու չարաշահման կամ չարամիտ օգտագործումը:
Բացի այդ, համակարգը կարող է նաև զտել բացահայտ և զգայուն բովանդակությունը: Սցենարներում, երբ փորձ է արվում խախտել այդ սահմանափակումները, մոդելը կպատասխանի մերժման կամ սահմանափակման հաղորդագրություններով՝ բացատրելով, որ նման գործողություններ չեն թույլատրվում:
Ընդհանուր սխալներ և ինչ անել, եթե ինչ-որ բան սխալ լինի
Ամենահաճախակի կասկածներից մեկն այն է, թե ինչ անել, եթե OCR-ի արդյունքը սպասվածի նման չէ. Ահա մի քանի օգտակար խորհուրդներ.
- Ստուգեք պատկերը. Համոզվեք, որ այն կենտրոնացված է, հստակ տեսանելի տեքստով և առանց ավելորդ տեսողական աղմուկի:
- Փորձեք տարբեր ձևաչափեր. Երբեմն PNG-ն ավելի լավ է աշխատում, քան JPEG-ը, կամ հակառակը:
- Երկար փաստաթղթերի բաժանում. Եթե ձեր պատկերն ունի շատ տեքստ, բաժանեք այն մի քանի մասի և վերբեռնեք դրանք կտորներով:
- Օգտագործեք հստակ հրահանգներ. «Տառադարձել սա» կամ «փոխակերպել տեքստի» արտահայտությունները կարող են օգնել համակարգին առաջնորդել, եթե այն ինքնաբերաբար չի արձագանքում:
Դուք միշտ կարող եք ստանալ տեքստի ավելի մաքուր տարբերակը՝ նախ հանելով այն OCR-ով, այնուհետև ChatGPT-ին խնդրելով հանել այն: ուղղել, կառուցվածք, ամփոփել կամ թարգմանել. Այժմ, երբ դուք գիտեք, թե ինչ պետք է իմանաք նախքան ChatGPT-ով պատկերներից տեքստ հանելը, եկեք տեսնենք այլընտրանքներ, որոնք կարող են օգնել ձեզ:
Ե՞րբ է ավելի լավ օգտագործել արտաքին այլընտրանք:

Մինչ ChatGPT-ն առաջարկում է բավականին համապարփակ լուծում, Երբեմն ավելի արդյունավետ կարող է լինել բացառապես OCR-ին նվիրված գործիքներ օգտագործելը:Ինչպիսիք են Adobe Scan- ը, Google Lens կամ հատուկ հավելվածներ՝ տեքստը թվայնացնելու համար:
Դրանք սովորաբար հատուկ պատրաստված են տպագիր փաստաթղթերում տեքստի համար և ունեն առաջադեմ տարբերակներ, ինչպիսիք են տեքստային բլոկի ընտրությունը, աղյուսակի հայտնաբերումը կամ ուղղակի արտահանումը խմբագրվող PDF: Կարևոր է նաև հիշել, որ Excel-ում կան մեթոդներ, որոնք կարող են օգնել, և մենք դրանք բացատրում ենք այս հոդվածում: Ինչպե՞ս կարող եմ օգտագործել տեքստային ֆունկցիան Excel-ում՝ տեքստային տողից առաջին կամ վերջին բառը հանելու համար:.
Մեղք բռնագրավել, ChatGPT-ի հզորությունն այն է, որ այն համատեղում է OCR-ը լեզվական մշակման հետ. Անիմաստ է կերպարներ հանելը, եթե դուք պետք է դրանք առանձին վերլուծեք: Այստեղ է, որ ChatGPT-ն փայլում է՝ առաջարկելով համընդհանուր լուծում:
OCR-ի ինտեգրումը ChatGPT-ի նման լեզվական մոդելներին բացում է հնարավորությունների աշխարհ: Սկսած Բիզնես առաջադրանքների ավտոմատացումից մինչև փաստաթղթերի իրական ժամանակի թարգմանություն և վերլուծություն. Թեև այն ունի սահմանափակումներ, դրա գործնական կիրառությունները զգալիորեն գերազանցում են ներկայիս տեխնիկական խոչընդոտները: Հաշվի առնելով այս մոդելների բարելավման տեմպերը, անհիմն չէ կարծել, որ նրանք շուտով կհասնեն գրեթե 100% հուսալիության, նույնիսկ անբարենպաստ պայմաններում: Հուսով ենք, որ այս հոդվածի վերջում դուք կիմանաք, թե ինչ պետք է իմանաք նախքան ChatGPT-ով պատկերներից տեքստ հանելը:
Փոքրուց կրքոտ էր տեխնոլոգիայով: Ես սիրում եմ լինել արդի ոլորտում և, առաջին հերթին, հաղորդակցվել դրա հետ: Այդ իսկ պատճառով ես երկար տարիներ նվիրված եմ եղել հաղորդակցությանը տեխնոլոգիաների և տեսախաղերի կայքերում: Դուք կարող եք գտնել ինձ՝ գրելով Android-ի, Windows-ի, MacOS-ի, iOS-ի, Nintendo-ի կամ որևէ այլ հարակից թեմայի մասին, որը գալիս է մտքում:
