- ChatGPT Plus (GPT-4) ले तपाईंलाई OCR प्रयोग गरेर छविहरूबाट पाठ निकाल्न अनुमति दिन्छ।
- यसले छापिएका तस्बिरहरू, हस्तलिखित पाठ, वा कोडहरूसँग काम गर्छ र तिनीहरूलाई डिजिटल पाठमा रूपान्तरण गर्छ।
- छवि गुणस्तर र फन्टले पहिचान शुद्धतालाई प्रभाव पार्छ।
- यो OCR भन्दा बाहिर जान्छ: यसले विश्लेषण गर्दछ, व्याख्या गर्दछ, र तपाईंलाई निकालिएको पाठसँग प्रत्यक्ष रूपमा काम गर्न अनुमति दिन्छ।

ChatGPT मार्फत छविहरूबाट पाठ निकाल्नु अघि तपाईंले के जान्नुपर्छ? आर्टिफिसियल इन्टेलिजेन्स प्रयोग गरेर छविहरूबाट सिधै पाठ निकाल्ने क्षमताले कागजातहरू, तस्बिरहरू र स्क्यान गरिएका फाइलहरूसँग अन्तर्क्रिया गर्ने तरिकामा क्रान्तिकारी परिवर्तन ल्याइरहेको छ। यसका लागि हाल उपलब्ध सबैभन्दा शक्तिशाली उपकरणहरू मध्ये एक ChatGPT हो, विशेष गरी GPT-4 मोडेलको साथ यसको प्लस संस्करण। यो प्रयोग केवल स्क्यानिङभन्दा बाहिर जान्छ: एआईले दृश्य क्यारेक्टरहरूलाई पहिचान, विश्लेषण र सम्पादन योग्य डिजिटल टेक्स्टमा रूपान्तरण गर्दछ.
यद्यपि, यो सुविधा प्रयोग गर्न सुरु गर्नु अघि, तपाईंलाई यसको पूर्ण बुझाइ हुनु महत्त्वपूर्ण छ यसले कसरी काम गर्छ, यसमा कस्ता सीमितताहरू छन् र कुन अवस्थामा यो तपाईंको लागि विशेष रूपमा उपयोगी हुन सक्छ। ChatGPT मा निर्मित OCR (अप्टिकल क्यारेक्टर रिकग्निसन) प्रविधिले स्वचालन र उत्पादकतामा महत्वपूर्ण फड्को मार्छ, तर यो यसको सूक्ष्मताहरू बिना छैन।
ChatGPT मार्फत छविहरूबाट पाठ निकाल्न तपाईंलाई के चाहिन्छ?

सुरू गर्न, ChatGPT मार्फत छविहरूमा पाठ पहिचान सशुल्क संस्करण (ChatGPT Plus) मा मात्र उपलब्ध छ।। विशेष गरी, तपाईंलाई GPT-4 मोडेलमा पहुँच चाहिन्छ, किनकि यसले छविहरू प्रशोधन गर्ने क्षमतालाई मूल रूपमा समावेश गर्दछ।
यो विकल्प सक्रिय भएपछि, प्रयोगकर्ताले तपाईंले कुराकानीमा सिधै तस्बिरहरू वा स्क्यान गरिएका कागजातहरू अपलोड गर्न सक्नुहुन्छ।। "यो तस्बिर पढ्नुहोस्" जस्ता विशेष निर्देशनहरू दिन आवश्यक छैन किनभने मोडेलले यो दृश्य सामग्री हो भनेर स्वचालित रूपमा पत्ता लगाउन सक्षम छ र तुरुन्तै पाठ पहिचान सुरु गर्छ।
कति राम्रो छ भनेर अचम्म लाग्छ। स्रोत कोड भएका स्क्रिनसटहरू जस्ता जटिल छविहरूसँग पनि काम गर्दछ।, हस्तलेखन वा फरक अभिमुखीकरणमा पाठ सहितका तस्बिरहरू। सीमाहरू भए तापनि, लिखित प्रतीकहरू (चाहे डिजिटल होस् वा हस्तलिखित टाइपोग्राफी) व्याख्या गर्ने क्षमतामा उल्लेखनीय सुधार भएको छ। यदि तपाईं यस बारे थप जान्न इच्छुक हुनुहुन्छ भने पीसीमा छविहरूबाट पाठ निकाल्दै, यो लेख तपाईंको लागि उपयोगी हुनेछ।
ChatGPT OCR प्रयोग गर्ने व्यावहारिक उदाहरणहरू
एउटा उल्लेखनीय उदाहरण अपलोड गर्नु हो प्रोग्राममा त्रुटि दिने कोडको टुक्राको तस्बिर। ChatGPT ले कोडमा भएका क्यारेक्टरहरू पहिचान गर्न मात्र सक्षम छैन, तर के भइरहेको छ भनेर बुझ्न र अनुकूलित प्राविधिक समाधान पनि प्रदान गर्न सक्छ। यसको मतलब यो केवल दृश्यहरूलाई सादा पाठमा रूपान्तरण गर्नमा मात्र सीमित छैन, तर तपाईंले निकालिएको पाठमा GPT-4 को भाषिक र प्रासंगिक प्रशोधन लागू गर्न सक्नुहुन्छ।.
तर सबैभन्दा अचम्मको कुरा यसको क्षमता हो हस्तलेखन पूर्ण रूपमा रूपरेखा नभए पनि बुझ्ने। यदि तपाईंले "ट्रान्सक्राइब यो" जस्तो आदेशको साथमा राख्नुभयो भने, तपाईंले उच्च स्तरको शुद्धताका साथ डिजिटल टेक्स्ट फारममा सामग्री पाउनुहुनेछ।
यस प्रविधिको सबैभन्दा सामान्य प्रयोगहरू

छविहरूमा पाठ पहिचान प्रविधि धेरै क्षेत्रहरूमा प्रयोग गर्न सकिन्छ। यहाँ केहि सामान्य परिदृश्यहरू छन् जहाँ यो कार्यक्षमता प्रयोग गरिन्छ। ठूलो फरक पार्न सक्छ:
- भौतिक फाइलहरूको डिजिटलाइजेशन: पुस्तकालय, अभिलेखालय र सरकारी निकायहरूले केही सेकेन्डमै कागजातहरूको पहाडलाई कार्ययोग्य डेटामा परिणत गर्न सक्छन्।
- कार्यालय स्वचालन: हस्तलिखित वा छापिएका फारमहरूको स्क्यानलाई सजिलो भण्डारण वा सन्दर्भको लागि डिजिटलाइज गर्न सकिन्छ।
- कागजातको कारोबार: एकपटक पाठ ट्रान्सक्राइब भएपछि, यसलाई स्वचालित रूपमा अनुवाद गर्न सकिन्छ, जसले गर्दा छापिएका कागजातहरूमा भाषा अवरोधहरू हट्छन्।
- लेखा व्यवस्थापन: बीजक, रसिद, र टिकटहरू प्रशोधन र संरचित गर्न सकिन्छ, तिनीहरूलाई व्यवस्थापन प्रणालीमा एकीकृत गर्ने सम्भावनाको साथ।
- पत्रकारिता र अनुसन्धान: फिल्ड छविहरू वा स्क्यान गरिएका कागजातहरूबाट सामग्री निकाल्दा रिपोर्ट लेख्दा धेरै समय बचत हुन सक्छ।
- द्रुत डेटा प्रविष्टि: ठूला मात्रामा कागजातहरू डिजिटलाइज गर्न आवश्यक पर्ने कम्पनीहरूले मानवीय लागत र त्रुटिहरू कम गर्न सक्छन्।
यस कार्यको लागि ChatGPT प्रयोग गर्नुको एउटा ठूलो फाइदा भनेको तपाईंलाई धेरै उपकरणहरूको आवश्यकता पर्दैन।: तपाईं छवि अपलोड गर्न सक्नुहुन्छ, पाठ निकाल्न सक्नुहुन्छ, र उही च्याट भित्र सिधै यसको साथ काम गर्न जारी राख्न सक्नुहुन्छ। तपाईं सम्पादन गर्दै हुनुहुन्छ, सारांश गर्दै हुनुहुन्छ, अनुवाद गर्दै हुनुहुन्छ, वा विश्लेषण गर्दै हुनुहुन्छ, तपाईं त्यहाँबाट जारी राख्न सक्नुहुन्छ।
तपाईंले ध्यानमा राख्नु पर्ने सीमितताहरू
कुनै पनि प्रविधि जस्तै, यो पनि उत्तम छैन। त्यहाँ निश्चित छन् ChatGPT OCR को शुद्धता घटाउन सक्ने प्राविधिक र प्रासंगिक अवस्थाहरू। तल हामी सबैभन्दा सान्दर्भिकहरू विस्तृत रूपमा प्रस्तुत गर्छौं:
- छवि गुणस्तर: धमिलो, पिक्सेलेटेड वा कम प्रकाश भएको तस्बिरले पहिचान गर्न गाह्रो बनाउन सक्छ।
- फन्ट शैलीहरू: कलात्मक सुलेखन जस्ता सजावटी फन्टहरू वा जटिल अक्षरहरू, व्याख्या गर्न गाह्रो हुन्छ।
- दुर्लभ भाषाहरू र प्रतीकहरू: चिनियाँ वा जापानी जस्ता आइडियोग्राम भएका भाषाहरू, वा असामान्य प्रतीकहरूले ठूलो चुनौतीको प्रतिनिधित्व गर्छन्।
- जटिल डिजाइनहरू: गैर-रैखिक ढाँचाहरूमा पाठ (जस्तै स्तम्भहरू, वृत्तहरू, वा कुनाहरू) ले प्रणालीलाई भ्रमित गर्न सक्छ।
- दृश्य त्रुटिहरू: 'O' र '0' वा '1' र 'l' जस्ता समान अक्षरहरूलाई स्पष्ट रूपमा छुट्याइएको छैन भने व्याख्यामा त्रुटिहरू हुन सक्छन्।
- पाठको बीचमा ग्राफिक तत्वहरू: चित्रण, ओभरले, वा वाटरमार्कहरूले OCR मा हस्तक्षेप गर्न सक्छन्।
यदि तपाईंले छवि राम्रोसँग तयार गर्नुभयो भने, सफलताको सम्भावना तीव्र रूपमा बढ्छ।। यसमा पर्याप्त प्रकाश, पर्याप्त कन्ट्रास्ट र पाठ फ्रेम भित्र सकेसम्म राम्रोसँग पङ्क्तिबद्ध गरिएको छ भनी सुनिश्चित गर्नुहोस्।
तस्बिरहरूको प्रयोगमा गोपनीयता र नैतिक सीमाहरू
यी कार्यहरूको बारेमा सबैभन्दा बढी छलफल गरिएको पक्ष भनेको छविहरूबाट निकालिएको डेटाको गोपनीयता र सुरक्षा। ChatGPT मा अपलोड गरिएका तस्बिरहरूमा भएका व्यक्तिहरूको पहिचान सुरक्षित गर्न OpenAI ले महत्त्वपूर्ण प्रतिबन्धहरू लगाएको छ।
उदाहरणका लागि, प्रणालीले तस्बिरहरूको आधारमा मानव विषयहरू पहिचान गर्न अस्वीकार गर्छ। यदि तिनीहरू सार्वजनिक व्यक्तित्व हुन् भने पनि होइन। यो उपाय प्रयोगकर्ताको गोपनीयताको रक्षा गर्न र दुर्व्यवहारपूर्ण वा दुर्भावनापूर्ण प्रयोगहरू रोक्नको लागि डिजाइन गरिएको हो।
यसको अतिरिक्त, प्रणाली स्पष्ट र संवेदनशील सामग्री फिल्टर गर्न पनि सक्षम छ। यी प्रतिबन्धहरू उल्लङ्घन गर्ने प्रयास गरिएका परिदृश्यहरूमा, मोडेलले अस्वीकृति वा सीमा सन्देशहरूको साथ प्रतिक्रिया दिनेछ, त्यस्ता कार्यहरूलाई अनुमति छैन भनेर व्याख्या गर्दै।
सामान्य गल्तीहरू र केहि गलत भएमा के गर्ने
सबैभन्दा धेरै शंका हुने मध्ये एक के गर्ने यदि OCR नतिजा अपेक्षाकृत छैन।। यहाँ केही उपयोगी सुझावहरू छन्:
- छवि जाँच गर्नुहोस्: यो केन्द्रित छ, स्पष्ट रूपमा देखिने पाठ छ र अनावश्यक दृश्य आवाज छैन भनी सुनिश्चित गर्नुहोस्।
- फरक ढाँचाहरू प्रयास गर्नुहोस्: कहिलेकाहीँ PNG ले JPEG भन्दा राम्रो काम गर्छ, वा यसको विपरीत पनि।
- लामो कागजातहरू विभाजन गर्नुहोस्: यदि तपाईंको छविमा धेरै पाठ छ भने, यसलाई धेरै भागमा विभाजन गर्नुहोस् र टुक्रा-टुक्रामा अपलोड गर्नुहोस्।
- स्पष्ट निर्देशनहरू प्रयोग गर्नुहोस्: "यसलाई ट्रान्सक्राइब गर्नुहोस्" वा "पाठमा रूपान्तरण गर्नुहोस्" जस्ता वाक्यांशहरूले प्रणालीलाई मार्गदर्शन गर्न मद्दत गर्न सक्छन् यदि यसले स्वचालित रूपमा प्रतिक्रिया दिँदैन भने।
तपाईंले पहिले OCR मार्फत पाठ निकालेर र त्यसपछि ChatGPT लाई निकाल्न सोधेर पाठको सफा संस्करण प्राप्त गर्न सक्नुहुन्छ। सच्याउने, संरचना गर्ने, संक्षेप गर्ने वा अनुवाद गर्ने। अब तपाईंलाई थाहा छ कि ChatGPT मार्फत छविहरूबाट पाठ निकाल्नु अघि तपाईंले के जान्न आवश्यक छ, आउनुहोस् तपाईंलाई मद्दत गर्न सक्ने विकल्पहरू हेरौं।
बाह्य विकल्प कहिले प्रयोग गर्नु राम्रो हुन्छ?

जबकि ChatGPT ले एकदमै व्यापक समाधान प्रदान गर्दछ, कहिलेकाहीँ OCR मा विशेष रूपमा समर्पित उपकरणहरू प्रयोग गर्नु बढी प्रभावकारी हुन सक्छ।, कसरी एडोब स्क्यान, Google लेन्स वा पाठ डिजिटलाइज गर्न विशेष अनुप्रयोगहरू।
यी सामान्यतया छापिएका कागजातहरूमा पाठको लागि विशेष रूपमा प्रशिक्षित हुन्छन् र पाठ ब्लक चयन, तालिका पत्ता लगाउने, वा सम्पादन योग्य PDF मा प्रत्यक्ष निर्यात जस्ता उन्नत विकल्पहरू हुन्छन्। यो पनि मनमा राख्नु महत्त्वपूर्ण छ कि एक्सेलमा त्यस्ता विधिहरू छन् जसले मद्दत गर्न सक्छन्, र हामी यस लेखमा तिनीहरूलाई व्याख्या गर्नेछौं। टेक्स्ट स्ट्रिङबाट पहिलो वा अन्तिम शब्द निकाल्न म एक्सेलमा टेक्स्ट फंक्शन कसरी प्रयोग गर्न सक्छु?.
यद्यपि, ChatGPT को शक्ति यो हो कि यसले OCR लाई भाषिक प्रशोधनसँग जोड्दछ।। यदि तपाईंले पात्रहरूलाई छुट्टाछुट्टै विश्लेषण गर्नुपर्यो भने तिनीहरूलाई निकाल्नुको कुनै अर्थ छैन। यो त्यहीँ हो जहाँ ChatGPT चम्किन्छ, जसले सबै-मा-एक समाधान प्रदान गर्दछ।
ChatGPT जस्ता भाषा मोडेलहरूमा OCR लाई एकीकृत गर्नाले सम्भावनाहरूको संसार खोल्छ। बाट व्यावसायिक कार्य स्वचालनदेखि वास्तविक-समय कागजात अनुवाद र विश्लेषणसम्म। यद्यपि यसका सीमितताहरू छन्, यसको व्यावहारिक प्रयोगहरू हालका प्राविधिक अवरोधहरू भन्दा धेरै बढी छन्। यी मोडेलहरूले अनुभव गरिरहेको सुधारको गतिलाई ध्यानमा राख्दै, प्रतिकूल परिस्थितिहरूमा पनि तिनीहरूले चाँडै नै लगभग १००% विश्वसनीयता हासिल गर्नेछन् भनेर सोच्नु अव्यावहारिक होइन। हामी आशा गर्छौं कि यस लेखको अन्त्यसम्ममा तपाईंले ChatGPT मार्फत छविहरूबाट पाठ निकाल्नु अघि के जान्न आवश्यक छ भनेर थाहा पाउनुहुनेछ।
सानैदेखि टेक्नोलोजीमा रुचि थियो । मलाई सेक्टरमा अप टु डेट हुन मन पर्छ र, सबै भन्दा माथि, यो संचार गर्न। यसैले म धेरै वर्षदेखि प्रविधि र भिडियो गेम वेबसाइटहरूमा सञ्चारमा समर्पित छु। तपाईले मलाई एन्ड्रोइड, विन्डोज, म्याकओएस, आईओएस, निन्टेन्डो वा दिमागमा आउने अन्य सम्बन्धित विषयहरूको बारेमा लेखेको पाउन सक्नुहुन्छ।
