- गूगल ट्रांसलेट ऐप में जेमिनी एआई का उपयोग करके पारंपरिक हेडफ़ोन के साथ लाइव अनुवाद की सुविधा शामिल है और यह 70 से अधिक भाषाओं का समर्थन करता है।
- यह फीचर सबसे पहले अमेरिका, मैक्सिको और भारत में एंड्रॉइड पर बीटा वर्जन में आ रहा है, और 2026 से आईओएस और अन्य क्षेत्रों में इसका विस्तार करने की योजना है।
- जेमिनी अनुवादों की स्वाभाविकता को बेहतर बनाता है, बोलचाल की भाषा और मुहावरों की व्याख्या करता है, और मूल आवाज के लहजे, जोर और लय को संरक्षित करता है।
- गूगल ट्रांसलेट भाषा सीखने के उपकरण जोड़ता है और खुद को एप्पल के इकोसिस्टम के अधिक बंद दृष्टिकोण के एक खुले विकल्प के रूप में स्थापित करता है।

El गूगल अनुवादक लॉन्च के बाद से इसमें सबसे बड़े बदलावों में से एक हो रहा है। कंपनी ने एक फीचर को रोल आउट करना शुरू कर दिया है। वास्तविक समय अनुवाद सीधे आपके हेडफ़ोन में।इसके कृत्रिम बुद्धिमत्ता मॉडल की क्षमताओं द्वारा समर्थित मिथुन राशिइस विचार को समझाना तो आसान है, लेकिन इसे अमल में लाना जटिल है: ताकि आप अपने हेडफोन के माध्यम से लगभग तुरंत ही किसी दूसरे व्यक्ति द्वारा दूसरी भाषा में कही गई बात सुन सकें। एक साथ कम रोबोटिक कृत्रिम आवाज.
यह कदम गूगल की उस रणनीति के अनुरूप है जिसके तहत वह ट्रांसलेट को सिर्फ एक साधारण टेक्स्ट ट्रांसलेटर से कहीं अधिक बनाना चाहता है। अब इसका लक्ष्य एक व्यापक और व्यापक टूल बनना है। भाषाओं के संचार और सीखने के लिए केंद्रीय उपकरणएआई का उपयोग बोलचाल की भाषा और सांस्कृतिक बारीकियों को बेहतर ढंग से समझने और उपयोगकर्ता को उनके दैनिक जीवन में सहायता प्रदान करने के लिए किया जा रहा है। फिलहाल, यह नई सुविधा लॉन्च हो रही है। विशिष्ट बाजारों में और बीटा चरण मेंलेकिन यह स्पष्ट रूप से आने वाले वर्षों में वैश्विक स्तर पर इसके विस्तार की ओर इशारा करता है।
किसी भी हेडसेट के साथ रीयल-टाइम अनुवाद

सबसे उल्लेखनीय विशेषता नई है हेडसेट के माध्यम से लाइव बातचीत का अनुवादजो सुविधा पहले Pixel Buds जैसे कुछ खास मॉडलों तक ही सीमित थी, वह अब आपके फोन के साथ संगत लगभग किसी भी हेडफोन या ईयरबड पर उपलब्ध है। बस आपको ऐप इंस्टॉल करना होगा। गूगल अनुवादकहेडफोन कनेक्ट करें और लाइव अनुवाद मोड का उपयोग करें।
एंड्रॉइड पर, इस प्रक्रिया में एप्लिकेशन खोलना, बातचीत की भाषाओं का चयन करना और बटन पर टैप करना शामिल है। "लाइव अनुवाद" (लाइव ट्रांसलेट)। वहां से, फोन का माइक्रोफोन यह स्वचालित रूप से पता लगा लेता है कि प्रत्येक व्यक्ति कब और किस भाषा में बोलता है।यह ऑडियो को वास्तविक समय में ट्रांसक्राइब करता है, प्रोसेसिंग के लिए जेमिनी द्वारा Google के सर्वर पर ऑडियो भेजता है, और अपेक्षाकृत कम विलंब के साथ हेडफ़ोन के माध्यम से अनुवाद को वापस प्ले करता है।
गूगल का कहना है कि एआई इसके लिए जिम्मेदार है। मूल वक्ता के लहजे, लय और जोर को बनाए रखें।इससे आपको न केवल कही गई बातों का सार समझ आता है, बल्कि इरादे का भी कुछ हिस्सा पता चलता है: जैसे कि कोई व्यक्ति गुस्से में है, मजाक कर रहा है या गंभीर स्वर में बोल रहा है। साथ ही, अनुवादित बातचीत का एक लिखित रूप मोबाइल स्क्रीन पर प्रदर्शित होता है, जो तब उपयोगी होता है जब आप कही गई बातों की समीक्षा करना चाहते हैं या किसी विशिष्ट अंश पर टैप करके उसे दोबारा सुनना चाहते हैं।
यह फ़ीचर शुरू में इस रूप में तैनात किया जा रहा है बीटा ट्रांसलेट ऐप में एंड्रॉयडकुछ बाजारों में इसकी उपलब्धता सीमित है, जैसे कि संयुक्त राज्य अमेरिका, मेक्सिको और भारतफिर भी, भाषाई अनुकूलता व्यापक है: यह प्रणाली लाइव वॉयस ट्रांसलेशन प्रदान करने में सक्षम है। 70 से अधिक भाषाएंभाषा युग्मों के बीच हजारों संभावित संयोजनों के साथ।
की दशा में iPhoneगूगल ने पुष्टि की है कि हेडफ़ोन के साथ रीयल-टाइम अनुवाद की सुविधा भी जल्द ही उपलब्ध होगी। iPhone पर अनुवादक ऐपहालांकि इसका कार्यान्वयन बाद में होगा। कंपनी ने इसके लिए समय सीमा निर्धारित की है। 2026 तक क्षेत्रों का विस्तार किया जाएगा और iOS पर यह सुविधा लॉन्च की जाएगी।इससे यूरोप और अन्य देशों में इसे व्यापक रूप से लागू करने से पहले एक महत्वपूर्ण परीक्षण अवधि की आवश्यकता होगी।
लाइव ट्रांसलेट कैसे काम करता है और यह प्रतिदिन क्या-क्या सेवाएं प्रदान करता है

एआई की मुख्य विशेषताओं के अलावा, उपयोगकर्ता अनुभव महत्वपूर्ण है। एक बार मोड सक्रिय हो जाने के बाद "लाइव अनुवाद" इस ऐप में, उपयोगकर्ता लगातार स्क्रीन देखे बिना बातचीत कर सकता है। सिस्टम यह अनुवाद को मूल आवाज के ऊपर चलाता है। जिसे माइक्रोफोन कैप्चर कर लेता है, जिससे आप हेडफोन लगाकर भी किसी बातचीत, प्रस्तुति या यहां तक कि निर्देशित दौरे का अनुसरण कर सकते हैं।
आंतरिक परीक्षणों और कुछ विशेष मीडिया आउटलेट्स के अनुसार, विलंबता को आमतौर पर एक सेकंड से कम रखा जाता है। जब डेटा कनेक्शन स्थिर होता है, तो यह अंतराल बातचीत को स्वाभाविक रूप से आगे बढ़ाने के लिए पर्याप्त होता है, जिससे वाक्यों के बीच लंबे विराम लेने की आवश्यकता नहीं होती। इसका व्यावहारिक प्रभाव स्पष्ट रूप से तब दिखाई देता है, जब आप किसी दूसरी भाषा में दी गई व्याख्या को समझ रहे हों या किसी सम्मेलन में किसी विदेशी वक्ता को सुन रहे हों।
इस प्रणाली का एक मजबूत बिंदु यह है कि इसके लिए "स्मार्ट" हेडफ़ोन या आधिकारिक मॉडल की आवश्यकता नहीं है।कोई भी ब्लूटूथ या वायर्ड हेडसेट जो मोबाइल फोन के साथ काम करता है, अनुवाद के लिए ऑडियो आउटपुट के रूप में कार्य कर सकता है। यह इसे अन्य सीमित समाधानों से अलग करता है, जहाँ कुछ कार्य किसी विशिष्ट ब्रांड के उपकरणों तक ही सीमित होते हैं, और उपयोगकर्ताओं को अपने हार्डवेयर को अपग्रेड किए बिना इस सुविधा का लाभ उठाने की अनुमति देता है।
व्यवहार में, प्रदर्शन वातावरण के आधार पर भिन्न होता है। कुछ स्थानों पर तीव्र परिवेशीय शोर या फिर जब कई लोग एक साथ बोलते हैं, तो वाक् पहचान संबंधी त्रुटियां बढ़ जाती हैं, जो किसी भी मौजूदा सिस्टम में आम बात है। गूगल का कहना है कि जेमिनी में इसके लिए तंत्र शामिल हैं। पृष्ठभूमि के कुछ शोर को फ़िल्टर करें और मुख्य गायक की आवाज़ पर ध्यान केंद्रित करें।लेकिन वह स्वीकार करते हैं कि आदर्श परिस्थितियाँ अपेक्षाकृत शांत कमरे और स्पष्ट रूप से बोलने वाले वक्ता ही हैं।
विशिष्ट उपयोगों की दृष्टि से, यह उपकरण निम्नलिखित स्थितियों के लिए डिज़ाइन किया गया है: यात्राएं, कार्य संबंधी बैठकें, कक्षाएं, साक्षात्कार या प्रशासनिक प्रक्रियाएं किसी अन्य भाषा में। एकतरफा बातचीत (जहां एक व्यक्ति बोलता है और बाकी सुनते हैं) में अनुभव विशेष रूप से सहज होता है; लेकिन बहुत तेज़ बातचीत में या कई वार्ताकारों के बीच जो एक-दूसरे को बाधित करते हैं, सिस्टम को प्रत्येक हस्तक्षेप को अलग-अलग समझने में अधिक कठिनाई हो सकती है।
जेमिनी: वो एआई जो कम रोबोटिक लगने की कोशिश करता है

गूगल ट्रांसलेट में इस नए हेडफोन फीचर और बाकी सुधारों के पीछे का कारण यह है: मिथुन राशिगूगल का भाषा मॉडल, जिसे कंपनी धीरे-धीरे सर्च और ट्रांसलेट जैसे प्रमुख उत्पादों में एकीकृत कर रही है, का उद्देश्य शब्द-दर-शब्द अनुवाद से आगे जाना है। वाक्यांशों के पूर्ण अर्थ की व्याख्या करें.
व्यवहार में, इसका अर्थ यह होता है कम शाब्दिक और अधिक स्वाभाविक अनुवादयह बात बोलचाल की भाषा, मुहावरों या स्थानीय बोलचाल की भाषा के प्रयोग में विशेष रूप से लागू होती है। अंग्रेज़ी के मुहावरे "stealing my thunder" या स्पैनिश के मुहावरे "me robó el pelo" (उसने मेरी टांग खींची) जैसे आम उदाहरण अक्सर शाब्दिक अनुवाद करने पर अजीब परिणाम देते हैं। जेमिनी सिस्टम संदर्भ का विश्लेषण करता है और ऐसे विकल्प सुझाता है जो लक्ष्य भाषा में मुहावरे के वास्तविक अर्थ को बेहतर ढंग से दर्शाते हैं।
गूगल का दावा है कि यह दृष्टिकोण अनुमति देता है भाषण के पैटर्न, सूक्ष्म व्यंग्य या लहजे में बदलाव को बेहतर ढंग से समझने के लिएइसका सीधा असर बोलचाल की बातचीत के अनुवाद पर पड़ता है। एक तटस्थ संदेश का अनुवाद करना, किसी व्यंग्यात्मक वाक्य या हल्के-फुल्के मज़ाक में की गई टिप्पणी का अनुवाद करने जैसा नहीं होता। हालाँकि त्रुटि की गुंजाइश अभी भी है, कंपनी का दावा है कि उसके आंतरिक मापदंड यह दर्शाते हैं। अनुवाद की गुणवत्ता में दो अंकों का सुधार पिछली प्रणालियों की तुलना में, विशेष रूप से बहुत अलग भाषाओं के बीच।
ये क्षमताएं केवल ऑडियो तक सीमित नहीं हैं। एआई अन्य क्षेत्रों में भी महत्वपूर्ण भूमिका निभाता है। पाठ और दृश्य सामग्री का अनुवादजैसे कि मोबाइल फोन कैमरे से खींची गई तस्वीरें (संकेत या मेनू)। अंतर यह है कि अब सिस्टम अधिक स्वाभाविक वाक्य संरचनाओं वाले परिणाम दे सकता है, शब्दावली के विकल्प सुझा सकता है और कुछ मामलों में, संदर्भ के अनुसार औपचारिकता के स्तर को अनुकूलित कर सकता है।
यह सारी प्रोसेसिंग क्लाउड संसाधनों और डिवाइस पर मौजूद कार्यों को मिलाकर की जाती है। कुछ महत्वपूर्ण कार्य Google के सर्वरों पर होते हैं, जबकि स्पीच सिंथेसिस और कुछ फ़िल्टर जैसे तत्व मोबाइल डिवाइस पर ही संभाले जाते हैं। कंपनी के अनुसार, बैटरी की खपत एक वॉयस कॉल या शॉर्ट वीडियो कॉल के बराबर है।इसलिए, इस सुविधा का कभी-कभार उपयोग करने के लिए आपको विशेष रूप से शक्तिशाली हार्डवेयर की आवश्यकता नहीं होगी।
अनुवाद से परे: भाषा सीखने के एक उपकरण के रूप में अनुवाद

रीयल-टाइम अनुवाद के साथ-साथ, Google ट्रांसलेट के शैक्षिक स्वरूप को भी मजबूत कर रहा है। ऐप में अब निम्नलिखित सुविधाएं शामिल हैं: एआई-आधारित भाषा सीखने के कार्यDuolingo या जैसे विशिष्ट प्लेटफार्मों के पूरक के उद्देश्य से। मैं अनुवाद करता हूंउन्हें बदले बिना।
नई सुविधाओं के बीच, उच्चारण संबंधी बेहतर प्रतिक्रियाये उपकरण बोले जाने वाले वाक्यों का अभ्यास करते समय अधिक विशिष्ट सुझाव प्रदान करते हैं। उपयोगकर्ता किसी अभिव्यक्ति को दोहरा सकता है और लय, स्वर या अस्पष्ट उच्चारण पर प्रतिक्रिया प्राप्त कर सकता है, जिससे उसका भाषण मूल भाषा के समान और कम मशीनी जैसा हो जाता है।
ऐप में एक सुविधा भी शामिल की गई है। लगातार अभ्यास करने की प्रणाली या निरंतर दिनों का अभ्यासयह फ़ीचर ट्रैक करता है कि टूल का उपयोग अध्ययन के लिए लगातार कितने दिनों तक किया गया है। शैक्षिक ऐप्स में व्यापक रूप से उपयोग की जाने वाली इस प्रकार की व्यवस्था का उद्देश्य छोटे दैनिक लक्ष्यों और निरंतर प्रगति की भावना के माध्यम से प्रेरणा बनाए रखना है।
गूगल इन विकल्पों को धीरे-धीरे शुरू कर रहा है। लगभग 20 देशों और क्षेत्रोंशुरुआती तौर पर निम्नलिखित बाजारों में उपस्थिति के साथ: जर्मनी, भारत या स्वीडनजैसे-जैसे यह ऐप यूरोप के और अधिक क्षेत्रों में फैलेगा, उम्मीद है कि यह उन लोगों के लिए एक अधिक सामान्य विकल्प बन जाएगा जो अनौपचारिक रूप से भाषाओं का अभ्यास करते हैं, इसे पाठ्यक्रमों, कक्षाओं या अन्य गतिविधियों के साथ जोड़कर। वीडियो का अंग्रेजी से स्पेनिश में अनुवाद करें.
इसके साथ ही, कंपनी गूगल लैब्स में प्रयोग कर रही है। तीन निःशुल्क शिक्षण अनुभवइनमें उपयोगी शब्दावली पर केंद्रित छोटे पाठ, बोलचाल और अनौपचारिक अभिव्यक्तियों के लिए समर्पित मॉड्यूल, और दृश्य गतिविधियाँ शामिल हैं जिनमें एआई किसी फोटो में वस्तुओं की पहचान करता है और दूसरी भाषा में उनके नाम सिखाता है। हालांकि ये परीक्षण ट्रांसलेट ऐप का अभिन्न अंग नहीं हैं, लेकिन ये भाषा उपकरणों के एक व्यापक पारिस्थितिकी तंत्र की ओर इशारा करते हैं, जो सभी एक ही एआई इंजन द्वारा संचालित हैं।
एप्पल से तुलना और यूरोप की भूमिका
रियल-टाइम ट्रांसलेशन के क्षेत्र में गूगल का दृष्टिकोण एप्पल से बिल्कुल अलग है। क्यूपर्टिनो स्थित कंपनी ने अपने स्वयं के इकोसिस्टम में एकीकृत और उससे जुड़े एक फीचर का विकल्प चुना है। विशिष्ट AirPods मॉडलगूगल ने एक सॉफ्टवेयर-आधारित समाधान का विकल्प चुना है जो इसके साथ संगत है। कोई भी मानक हेडसेटयह अंतर विशेष रूप से उन बाजारों में ध्यान देने योग्य है जहां विभिन्न प्रकार के उपकरण सामान्य बात हैं, जैसे कि यूरोपीय एंड्रॉइड वातावरण।
एप्पल प्राथमिकता देता है स्थानीय ऑडियो प्रसंस्करणयानी, अधिकांश काम iPhone या iPad पर ही किया जाता है। इससे गोपनीयता और कनेक्टिविटी के मामले में फायदे मिलते हैं, लेकिन सिस्टम की स्केलेबिलिटी और समर्थित भाषाओं की संख्या सीमित हो जाती है; अन्य समाधान, जैसे कि माइक्रोसॉफ्ट टीमोंवे रीयल-टाइम अनुवाद की सुविधा जोड़ते हैं। गूगल, अपनी ओर से, क्लाउड का अधिक गहन उपयोग कर रहा है, जिससे वह एक व्यापक प्रबंधन कर सकता है। 70 से अधिक भाषाओं में वॉइस ट्रांसलेशन की सुविधा उपलब्ध है। और मॉडल को केंद्रीय रूप से अपडेट करें।
यूरोपीय उपयोगकर्ता के दृष्टिकोण से, Google का प्रस्ताव अधिक लचीला प्रतीत हो सकता है: लाइव अनुवाद का उपयोग करने के लिए हेडफ़ोन या मोबाइल डिवाइस बदलने की आवश्यकता नहीं होती है। हालाँकि, यह ध्यान रखना महत्वपूर्ण है कि यह फीचर अभी तक पूरे यूरोप में सक्रिय नहीं हुआ है।हालांकि ऐप में पहले से ही वार्तालाप अनुवाद मोड और अन्य उन्नत उपकरण शामिल हैं, लेकिन हेडफ़ोन पर निरंतर सुनने की सुविधा अभी भी देश के अनुसार धीरे-धीरे शुरू की जा रही है।
गूगल ने स्पेन या बाकी यूरोपीय संघ के लिए कोई विस्तृत समयसीमा नहीं दी है, लेकिन उसने यह स्पष्ट कर दिया है कि यह बीटा चरण लेटेंसी को समायोजित करना, स्थानीय उच्चारण पहचान में सुधार करना और अपने सर्वरों पर लोड का मूल्यांकन करना। कवरेज बढ़ाने से पहले। यह मानना उचित है कि यूरोपीय डेटा विनियम और ऑन-प्रिमाइसेस और क्लाउड प्रोसेसिंग के बीच संतुलन जैसे कारक भी तैनाती की गति को प्रभावित करेंगे।
हालांकि एप्पल के साथ तुलना आमतौर पर सुविधा और एकीकरण पर केंद्रित होती है, लेकिन इस मामले में कुछ मुद्दे हैं जैसे... ऑडियो गोपनीयता और संवेदनशील डेटा प्रबंधनगूगल का कहना है कि वह अनावश्यक जानकारी को हटाने के लिए फिल्टर का इस्तेमाल करता है और इस जानकारी का उपयोग अनुवाद की गुणवत्ता में सुधार के लिए किया जाता है, लेकिन इन संवादों को कैसे संभाला जाता है, इस पर चर्चा जारी रहेगी, खासकर यूरोप जैसे सख्त नियमों वाले क्षेत्रों में।
एक अनुवादक जो एक अदृश्य मध्यस्थ बनना चाहता है
तकनीकी विवरणों से परे, इस अपडेट का संदेश यह है कि Google Translate एक एक ऐसा मध्यस्थ जो उन लोगों के बीच तेजी से विवेकपूर्ण संबंध स्थापित कर रहा है जो एक भाषा साझा नहीं करते हैं।यह नए उपकरण लॉन्च नहीं करता है या उपयोगकर्ताओं को जटिल इंटरफेस सीखने के लिए मजबूर नहीं करता है: यह मोबाइल फोन, पारंपरिक हेडफोन और जेमिनी द्वारा संचालित निरंतर सॉफ्टवेयर सुधारों पर निर्भर करता है।
लाइव अनुवाद सुविधा अभी भी परीक्षण चरण में है और सभी बाजारों में उपलब्ध नहीं है, लेकिन यह स्पष्ट रूप से दर्शाता है कि उद्योग किस दिशा में आगे बढ़ रहा है: तेज़ अनुवाद, अधिक संदर्भ के साथ और हमारी वास्तविक भाषा के अधिक करीब।इसके साथ ही, एकीकृत शिक्षण उपकरण और बोलचाल की भाषा और मुहावरों को बेहतर ढंग से संभालने की क्षमता इस बात की ओर इशारा करती है कि ट्रांसलेटर का उपयोग केवल किसी विशिष्ट यात्रा के दौरान काम चलाने के लिए ही नहीं, बल्कि रोजमर्रा की जिंदगी में भी किया जाएगा।
शोरगुल भरे वातावरण में सटीकता से लेकर अत्यधिक स्थानीयकृत या सांस्कृतिक रूप से संवेदनशील अभिव्यक्तियों को संभालने तक, और क्लाउड पर ऑडियो भेजने के निहितार्थों को ध्यान में रखते हुए, अभी भी कई स्पष्ट चुनौतियाँ मौजूद हैं। फिर भी, कुछ साल पहले के शाब्दिक अनुवाद से आगे का सफर काफी बड़ा है: कई उपयोगकर्ताओं के लिए, इन चुनौतियों का संयोजन जेमिनी, गूगल ट्रांसलेट और कुछ सामान्य हेडफ़ोन अब यह उन बातचीत में कुछ आसानी से आगे बढ़ने के लिए पर्याप्त होने लगा है जो पहले मानव दुभाषिए के बिना असंभव होती थीं।
मैं एक प्रौद्योगिकी उत्साही हूं जिसने अपनी "गीक" रुचियों को एक पेशे में बदल दिया है। मैंने अपने जीवन के 10 से अधिक वर्ष अत्याधुनिक तकनीक का उपयोग करने और शुद्ध जिज्ञासा से सभी प्रकार के कार्यक्रमों के साथ छेड़छाड़ करने में बिताए हैं। अब मैंने कंप्यूटर प्रौद्योगिकी और वीडियो गेम में विशेषज्ञता हासिल कर ली है। ऐसा इसलिए है क्योंकि 5 वर्षों से अधिक समय से मैं प्रौद्योगिकी और वीडियो गेम पर विभिन्न वेबसाइटों के लिए लिख रहा हूं, ऐसे लेख बना रहा हूं जो आपको ऐसी भाषा में आवश्यक जानकारी देने का प्रयास करते हैं जो हर किसी के लिए समझ में आती है।
यदि आपके कोई प्रश्न हैं, तो मेरी जानकारी विंडोज ऑपरेटिंग सिस्टम के साथ-साथ मोबाइल फोन के लिए एंड्रॉइड से संबंधित हर चीज तक है। और मेरी प्रतिबद्धता आपके प्रति है, मैं हमेशा कुछ मिनट बिताने और इस इंटरनेट की दुनिया में आपके किसी भी प्रश्न को हल करने में आपकी मदद करने को तैयार हूं।