- 谷歌翻译应用程序采用 Gemini AI 技术,结合传统耳机进行实时翻译,支持 70 多种语言。
- 该功能首先在美国、墨西哥和印度的安卓系统上推出测试版,计划从 2026 年开始扩展到 iOS 和其他更多地区。
- Gemini 能够提升翻译的自然度,解读俚语和习语,并保留原文的语气、重音和节奏。
- 谷歌翻译增加了语言学习工具,并将自己定位为苹果生态系统较为封闭方式的开放替代方案。
El 谷歌翻译 它正经历自推出以来最大的变革之一。该公司已开始推出一项功能…… 实时翻译直接传输到您的耳机在其人工智能模型的功能支持下 双子座这个想法解释起来很简单,但执行起来却很复杂: 这样,你几乎可以立即通过耳机听到另一个人用另一种语言说的话。 用 不那么机械的合成语音.
此举符合谷歌将翻译功能从简单的文本翻译工具转型为更强大的工具的战略。它现在的目标是成为…… 用于交流和学习语言的核心工具利用人工智能技术,用户不仅可以更好地理解俚语和文化细微差别,还能在日常使用中得到辅助。目前,这项新功能即将推出。 特定市场,处于测试阶段但这显然预示着未来几年将在全球范围内推广。
使用任何耳机进行实时翻译

最引人注目的特点是新的 通过耳机进行实时对话翻译以前仅限于 Pixel Buds 等特定型号耳机的功能,现在几乎适用于所有与手机兼容的耳机或耳塞。您只需安装相应的应用程序即可。 谷歌翻译连接耳机并进入实时翻译模式。
在安卓系统上,操作步骤包括打开应用程序,选择对话语言,然后点击按钮。 “实时翻译” (实时翻译)。从那里,手机的麦克风 它能自动检测每个人何时说话以及使用的语言。它能实时转录音频,将音频发送到谷歌服务器由 Gemini 进行处理,并通过耳机以相对较低的延迟播放翻译结果。
谷歌解释说,人工智能是造成这种情况的原因。 保持原发言者的语气、节奏和重音这不仅能让你理解对话内容,还能让你了解对方的部分意图:比如对方是在生气、开玩笑,还是语气比较严肃。同时,翻译后的对话文本会显示在手机屏幕上,方便你回顾对话内容,或者点击特定片段重听。
该功能最初将以如下方式部署: 测试版 在翻译应用程序中 安卓在某些市场供应有限,例如 美国、墨西哥和印度即便如此,其语言兼容性依然广泛:该系统能够提供实时语音翻译。 超过70种语言语言对之间有成千上万种可能的组合。
在案件 iPhone谷歌已经确认,耳机实时翻译功能也将推出。 iPhone上的翻译应用尽管推广工作将在稍后进行,但该公司已设定了目标。 2026年将扩大覆盖范围并在iOS上推出该功能这意味着在在欧洲和其他国家更广泛地推广之前,还需要一段相当长的测试期。
实时翻译的工作原理及其日常功能

除了人工智能之外,用户体验才是关键。一旦该模式激活,用户体验就会发生变化。 “实时翻译” 在这个应用程序中,用户无需一直盯着屏幕即可进行对话。 在原声之上播放翻译版本 麦克风可以拾取声音,让您戴着耳机也能收听演讲、演示,甚至是导览游。
根据内部测试和一些专业媒体的报道, 延迟通常保持在一秒以内。 当数据连接稳定时,这样的延迟足以保证对话自然流畅,避免句子之间出现长时间的停顿。例如,在听别人用另一种语言解释或在会议上听外籍人士发言时,这种延迟带来的实际效果就非常明显。
该系统的优点之一是 它不需要“智能”耳机或官方型号任何可与手机配合使用的蓝牙或有线耳机都可以作为翻译的音频输出设备。这使其区别于一些功能仅限于特定品牌设备的封闭式解决方案,用户无需升级硬件即可使用该功能。
实际上,性能会因环境而异。在以下情况下,性能会有所不同: 强烈的环境噪音 或者,当许多人同时说话时,语音识别错误率会增加,这在任何现有系统中都很常见。谷歌表示,Gemini 集成了相应的机制来解决这个问题。 滤除一些背景噪音,专注于主唱。但他承认,理想的条件仍然是相对安静的房间和表达清晰的演讲者。
就具体用途而言,该工具是为以下情况而设计的: 出差、工作会议、课程、面试或行政程序 用另一种语言。在单向场景(一人发言,其他人聆听)中,体验尤其流畅;在语速极快的对话或多人互相打断的对话中,系统可能难以将每次发言分割开来。
Gemini:一款力求听起来不那么机械的人工智能。

这项新的耳机功能以及谷歌翻译的其他改进背后是…… 双子座谷歌的语言模型(该公司正逐步将其整合到搜索和翻译等关键产品中)旨在超越逐字翻译。 解释这些短语的完整含义.
在实践中,这意味着 不那么直译,更自然的翻译当使用口语表达、习语或地方俚语时,这一点尤为突出。例如,英语中的“stealing my thunder”(抢了我的风头)或西班牙语中的“me robó el pelo”(他捉弄了我)等,如果直译,往往会产生奇怪的结果。而Gemini系统会分析上下文,并提供更贴近目标语言实际含义的替代方案。
谷歌声称这种方法允许 为了更好地捕捉语调模式、微妙的讽刺或语气变化这直接影响到口语对话的翻译。翻译中性信息与翻译讽刺短语或半开玩笑的评论截然不同。尽管仍存在一定的误差范围,但该公司声称其内部指标显示…… 翻译质量实现了两位数的提升 与以前的系统相比,尤其是在语言差异很大的情况下。
这些功能不仅限于音频。人工智能在其他方面也发挥着作用。 文本和视觉内容的翻译例如用手机拍摄的标牌或菜单。不同之处在于,现在的系统可以提供句法结构更自然的结果,建议词汇替代方案,并且在某些情况下,还能根据上下文调整正式程度。
所有这些处理都是通过将云资源与设备自身的任务相结合来实现的。部分繁重的计算工作在谷歌的服务器上完成,而语音合成和某些过滤器等功能则在移动设备上处理。据该公司称, 电池消耗量与语音通话或短视频通话相当。因此,偶尔使用此功能并不需要特别强大的硬件。
超越翻译:将翻译作为语言学习的工具

除了实时翻译,谷歌还在加强翻译应用在教育领域的定位。该应用现在整合了…… 基于人工智能的语言学习功能旨在补充特定平台,例如 Duolingo 或 iTranslate无需更换它们。
在新功能中, 改进的发音反馈这些工具在练习口语短语时能提供更具体的建议。用户可以重复某个表达,并获得关于节奏、语调或发音不清晰等问题的反馈,从而帮助他们使自己的发音更自然、更接近母语人士的表达,减少生硬感。
该应用程序还整合了 连续练习制度或连续练习天数此功能会追踪用户连续使用该工具学习的天数。这种机制在教育类应用中十分常见,旨在通过每日小目标和持续进步感来保持用户的学习动力。
谷歌正开始逐步推出这些选项。 约20个国家和地区最初在以下市场开展业务: 德国、印度或瑞典随着该应用扩展到更多欧洲地区,预计它将成为非正式语言练习者的更常用选择,并可与课程、课堂或其他形式的学习方式相结合。 将视频从英语翻译成西班牙语.
与此同时,该公司正在谷歌实验室进行相关实验。 三次免费学习体验这些方案包括专注于实用词汇的短课程、专门讲解俚语和非正式表达的模块,以及人工智能识别照片中的物体并用另一种语言教授其名称的视觉活动。虽然这些测试并非严格意义上的“翻译”应用程序的一部分,但它们指向一个更广泛的语言工具生态系统,所有这些工具都由同一个人工智能引擎驱动。
与苹果公司的比较以及欧洲的作用
谷歌在实时翻译领域的做法与苹果截然不同。苹果选择将这项功能集成到自己的生态系统中,并与……相连。 特定型号的 AirPods谷歌选择了一种与以下系统兼容的基于软件的解决方案: 任何标准耳机在设备种类繁多的市场中,这种差异尤为明显,例如欧洲的安卓市场。
苹果优先考虑 本地音频处理也就是说,大部分工作都在 iPhone 或 iPad 本身完成。这在隐私和连接性方面具有优势,但限制了系统的可扩展性和支持的语言数量;其他解决方案,例如 微软团队他们增加了实时翻译功能。谷歌方面,正在更广泛地利用云计算,这使其能够管理…… 包含 70 多种语言的语音翻译目录 并集中更新模型。
从欧洲用户的角度来看,谷歌的方案似乎更灵活:无需更换耳机或移动设备即可使用实时翻译。然而,需要注意的是…… 该功能尚未在欧洲全面启用。虽然该应用程序已经包含对话翻译模式和其他高级工具,但使用耳机连续收听的功能仍需在各国逐步推出。
谷歌尚未提供西班牙或欧盟其他地区的详细时间表,但已明确表示,此次测试阶段将有助于…… 调整延迟、改进本地口音识别以及评估服务器负载 在扩大覆盖范围之前,可以合理地认为,欧洲数据法规以及本地部署和云处理之间的平衡等因素也会影响部署速度。
尽管与苹果公司的比较通常侧重于便利性和集成性,但在这个案例中,还存在诸如……之类的问题。 音频隐私和敏感数据管理谷歌坚称,它会使用过滤器来消除噪音,并且这些信息会用于提高翻译质量,但关于如何处理这些对话的讨论仍将继续,尤其是在欧洲等监管严格的地区。
一位想要成为隐形中介的翻译
抛开技术细节不谈,此次更新传达的信息是:谷歌翻译的目标是成为…… 越来越谨慎地充当不同语言人群之间的中间人它不推出新设备,也不强迫用户学习复杂的界面:它依靠手机、传统耳机以及 Gemini 推动的持续软件改进。
实时翻译功能目前仍处于测试阶段,尚未在所有市场推出,但它清楚地表明了行业的发展方向: 翻译速度更快,上下文信息更丰富,也更贴近我们实际的说话方式。与此同时,集成的学习工具和对俚语和习语的改进处理表明,翻译器将更多地用于日常使用,而不仅仅是用于特定的旅行。
显而易见的挑战依然存在,例如在嘈杂环境中保持翻译准确,以及处理高度本地化或带有文化色彩的表达方式,更不用说将音频发送到云端所带来的影响。即便如此,与几年前的字面翻译相比,如今的翻译技术已经取得了巨大的进步:对于许多用户而言,…… Gemini、谷歌翻译和一些普通耳机 现在,人们已经能够比较轻松地进行以前如果没有人工翻译就无法进行的对话了。
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。