Gemma 3n:谷歌的新项目将先进的人工智能带入任何设备

最后更新: 2025年30月06日

  • Gemma 3n 是一个开放、高效、多模式的 AI 模型,设计用于在仅有 2GB RAM 的移动设备上本地运行。
  • 它允许处理文本、图像、音频和视频,而无需互联网连接,突出隐私和低资源消耗。
  • 它包括 MatFormer 和 Per Layer Embeddings 等创新,可根据设备提高模型的效率和适应性。
  • 它可供 Google AI Studio、Hugging Face 和 Kaggle 等平台上的开发人员使用,并且在多模式功能和离线执行方面优于其他移动 AI。

Gemma 3n

谷歌在人工智能领域迈出了重要一步 Gemma 3n 推出, 一个专门设计用于在资源有限的设备上运行的开源人工智能模型。这项提案 现在可以在手机、平板电脑和笔记本电脑上下载并安装它。, supone 多模态人工智能即将问世,即使在只有 2 GB RAM 且没有互联网连接的设备上也能轻松使用. 它的出现发生在其呈现之后 上一届 Google I/O 大会,并吸引了寻求本地化、私密化、高效AI解决方案的开发者和用户的关注。

这一新模式基于以下目标 无需依赖云服务器,即可民主化地访问先进的人工智能工具因此,谷歌将 Gemma 3n 与 Gemini 等替代方案明确区分开来,后者采取封闭式策略,更注重大众消费。而 Gemma 则专注于开放式开发以及 AI 的研究和个性化使用,允许下载、修改并集成到众多应用程序中。

独家内容 - 点击这里  如何删除 Google 表格中受保护的单元格

多式联运能力和卓越的效率

Gemma 3n 尤其以多模式脱颖而出, es decir, 可以解释和生成文本、图像、音频和视频 无需借助云端,即可直接从设备获取数据。其核心功能包括语音识别、转录、翻译和实时视觉分析,非常适合教育任务、个人助理或翻译系统。

它所建立的建筑被称为 MatFormer,允许将模型细分为多个较小的版本,并像俄罗斯套娃一样集成在一个主模型中。由于这种结构, Gemma 3n 可以更好地管理资源并适应其运行硬件的限制。。此外,它还融合了 técnica Per Layer Embeddings (PLE), 那 减少内存使用量而不损失性能,从而使其即使在规格一般的设备上也能运行。

Gemma 3n 提供两种主要型号: E2B y E4B,分别具有 2.000 亿和 4.000 亿个有效参数。然而,由于它们的设计,这两个模型的运行内存需求与小得多的模型相当, 这为传统中低端设备上的高级人工智能打开了大门.

独家内容 - 点击这里  如何取消 Google One

Para el 图像和视频处理,Gemma 3n 使用编码器 MobileNet-V5经过优化,即使在低功耗移动设备上也能流畅运行,让您在最新机型上也能以 60 fps 的速度处理视频。在音频部分,它支持语音转录和即时翻译,所有功能均可在本地完成。

隐私、性能和可用性

Gemma 3n 本地 AI 性能

完全离线工作是 Gemma 3n 的一大优势, 它确保所有AI处理的数据都保留在设备本身,从而比其他基于云的解决方案更能增强用户隐私。此外,此功能还能提高能源效率并降低数据消耗,这在移动设备和连接受限的环境中至关重要。

En términos de rendimiento, Gemma 3n 支持 140 种文字处理语言和 35 种多模式语言。它在 LMArena 等基准测试中展现了出色的性能,其中 E4B 模型得分超过 1.300 分,成为第一个以少于 10.000 亿个参数达到此水平的模型。

Gemma 3n 已经到了 disponible en múltiples plataformas para desarrolladores,例如 Google AI Studio、Hugging Face、Kaggle,以及 Google AI Edge 或 Ollama 等工具。这些工具的开放设计和集成灵活性使其能够轻松创建满足特定需求的新应用程序,从教育系统到智能助手和离线翻译工具。

独家内容 - 点击这里  如何更改 Google 相册中的专辑封面

与其他替代方案的比较和实际优势

Gemma 3n IA 型号

Gemma 3n 的到来正值移动和边缘 AI 发展的背景下, 其他方案包括苹果神经引擎、三星高斯以及 Meta 和微软的模型。然而,尽管这些解决方案中有许多需要服务器连接,文本或图像功能有限,或者不对外开放,但 Gemma 3n 它致力于真正的多模式、不依赖网络和对社区开放。.

对于用户来说,最显著的优势是 运行先进的人工智能而不会失去隐私控制享受即时响应,并降低与移动数据使用相关的成本。对于制造商和开发者来说,Gemma 3n 它代表着将智能应用程序引入更广泛的设备的机会,而无需依赖最新的硬件或昂贵的内存升级。.

Gemma 3n 的强劲势头甚至促使一些制造商增加新设备的运行内存容量,以期未来大规模整合本地人工智能。因此,谷歌在实现 强大、高效、开放、真正可触及的人工智能.