谷歌推出 Gemini 2.5 Flash-Lite:其 AI 家族中速度最快、效率最高的模型

最后更新: 24/06/2025

  • Gemini 2.5 Flash-Lite 因其速度和低成本而脱颖而出
  • 该模型非常适合翻译和分类等大规模、低延迟任务。
  • 它处于预览阶段,而 Flash 和 Pro 已普遍可用。
  • 它提供多模式集成,而且价格比以前的型号低得多。
双子座 2.5 Flash-Lite

谷歌 Gemini 2.5 Flash-Lite 发布,继续扩展其人工智能模型范围,该型号专注于最大化成本效益和速度。近日,该公司宣布其 2.5 Pro 和 Flash 型号正式上市,同时 Flash-Lite 也以预览版的形式推出,面向对敏捷且经济高效的解决方案感兴趣的开发者和企业。

这款机芯满足了人们对结合 高处理量、低延迟,在不影响预算的情况下,促进翻译、数据分类等任务或任何需要速度的操作。 Flash-Lite 是那些希望处理 以有竞争力的价格快速提供大量信息,而不必总是诉诸双子座家族的最大推理能力。

Flash-Lite:Gemini 速度最快、价格最实惠的型号

双子座2.5

新版本 Gemini 2.5 Flash-Lite 明显优于其前身(2.0 Flash-Lite) 在编程、数学、科学、逻辑推理和多模态任务基准测试中表现出色。据谷歌称,该模型在海量数据输入场景中尤其有效,例如长文本翻译或大规模分类,其结果 与该系列的其他方案相比,速度和质量更胜一筹.

独家内容 - 点击这里  如何在 Google 课堂中离开课程

延迟是实时应用中的另一个决定性参数,也是 Flash-Lite 中的最低要求,在速度上超越了以前的版本,并将自己定位为那些优先考虑即时性的人的首选。

与以前版本相比的技术特点和改进

双子座 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite 保留了该系列的许多高级功能: 多模式支持 (文本、图像、视频甚至音频),与 Google 搜索等关键工具集成,代码执行,以及多达一百万个词条的上下文。此外,Gemini 2.5 采用的专家混合架构通过为每个查询仅激活必要的神经网络来最大限度地提高效率,从而减少资源消耗。

另一个独特的优势是 控制“思考预算” 通过 API 参数,开发人员可以决定模型在执行每项任务时应使用何种程度的推理能力。默认情况下,Flash-Lite 会禁用此功能,以寻求速度和成本之间的最佳平衡。但如果准确性是首要考虑因素,则可以随时启用此功能。

独家内容 - 点击这里  一对夫妇开车三个多小时去看一个不存在的地方:人工智能已经在生成虚假的旅游目的地。

MGI 最新的内部基准 Flash-Lite 的成绩优异: FACTS 基础知识考试成绩为 86,8%,多语言 MMLU 考试成绩为 84,5%,视觉理解考试成绩同样具有竞争力这些指标证实了它适用于准确性和速度至关重要的应用。

编辑照片 gemini flash-4
相关文章:
如何使用 Gemini Flash 2.0 编辑照片,无需任何编辑知识

更新了 Gemini 系列的供货情况和价格

除了 Flash-Lite 的到来之外, Gemini 2.5 Pro 和 Flash 现已正式发布,在通过测试阶段后。谷歌借此机会 简化定价体系,取消以前有思维电价和非思维电价之间的区别,这给开发人员带来了困惑。现在, Flash 模型对文本、图像和视频每百万输入令牌收费 0,30 美元,对每百万输出令牌收费 2,50 美元。,音频另行定价。

对于 Flash-Lite 来说,价格调整幅度更大, 巩固其作为处理大量数据但不需要最高程度的自动推理能力的入门模型的地位.

独家内容 - 点击这里  如何更改 Google Pixel 4a 上的密码

用例和对 Flash-Lite 模型的访问

Gemini 2.5 Flash-Lite 谷歌 AI Studio

谷歌瞄准有需求的开发者和企业 批量翻译、数据分类和大规模分析 是 Flash-Lite 的主要受益者。该模型还适用于自动化信息组织、多媒体内容处理以及毫秒级的操作,例如客户服务工具或警报和监控系统中的即时响应。

Gemini 2.5 Flash-Lite 现已推出 可在预览模式下使用 通过 Google AI Studio 和 Vertex AI同时,Flash 和 Pro 型号可在这些服务和 Gemini 应用程序中使用。所有这些选项都允许您调整预算,并根据每个项目或需求进行调整。

谷歌寻求提供 适合所有受众和预算的解决方案并将这些模型集成到其 AI Overviews 搜索引擎以及 Meet、Docs 和 Sheets 等生产力产品中。随着 Flash Lite 的推出,谷歌正在扩展可用选项的范围,使生成式人工智能更容易应用于那些处理量、速度和价格是决定性因素的任务。

相关文章:
Gemini Flash 2.0 将让您看到一件衣服穿在任何人身上的效果。