- Gemini 2.5 Flash-Lite nổi bật với tốc độ và chi phí thấp
- Mô hình này lý tưởng cho các tác vụ quy mô lớn, độ trễ thấp như dịch thuật và phân loại.
- Phiên bản này đang trong giai đoạn xem trước, trong khi Flash và Pro sẽ có sẵn rộng rãi.
- Nó cung cấp khả năng tích hợp đa phương thức và giá cả thấp hơn đáng kể so với các mẫu trước đây.
Google tiếp tục mở rộng phạm vi các mô hình trí tuệ nhân tạo của mình với sự ra mắt của Gemini 2.5 Flash-Lite, một mô hình tập trung vào hiệu quả chi phí và tốc độ tối đa. Trong những ngày gần đây, công ty đã công bố tính khả dụng chung của các mô hình 2.5 Pro và Flash, trong khi Flash-Lite đang ra mắt ở định dạng xem trước cho các nhà phát triển và các công ty quan tâm đến các giải pháp nhanh nhẹn và tiết kiệm chi phí.
Phong trào này đáp ứng nhu cầu ngày càng tăng đối với các mô hình kết hợp khối lượng xử lý cao và độ trễ thấp, hỗ trợ các nhiệm vụ như dịch thuật, phân loại dữ liệu hoặc bất kỳ hoạt động nào đòi hỏi tốc độ mà không ảnh hưởng đến ngân sách. Flash-Lite xuất hiện như một lựa chọn ưu tiên cho những ai muốn xử lý lượng thông tin lớn một cách nhanh chóng và với giá cả cạnh tranh, mà không cần phải lúc nào cũng phải dùng đến khả năng lý luận tối đa của gia đình Song Tử.
Flash-Lite: Mẫu nhanh nhất và giá cả phải chăng nhất của Gemini

Phiên bản mới Gemini 2.5 Flash-Lite rõ ràng vượt trội hơn phiên bản tiền nhiệm của nó (2.0 Flash-Lite) trong lập trình, toán học, khoa học, lý luận logic và chuẩn mực nhiệm vụ đa phương thức. Theo Google, mô hình này đặc biệt hiệu quả trong các tình huống nhập dữ liệu lớn, chẳng hạn như dịch văn bản dài hoặc phân loại quy mô lớn, với kết quả vượt trội về tốc độ và chất lượng so với các đề xuất khác trong loạt bài này.
Độ trễ, một trong những thông số quyết định trong các ứng dụng thời gian thực, cũng là tối thiểu trong Flash-Lite, vượt trội hơn các phiên bản trước về tốc độ và định vị là lựa chọn ưu tiên cho những ai coi trọng tính tức thời.
Các tính năng kỹ thuật và cải tiến so với các phiên bản trước

Gemini 2.5 Flash-Lite vẫn giữ nguyên nhiều tính năng tiên tiến của phiên bản trước: hỗ trợ đa phương thức (văn bản, hình ảnh, video và thậm chí cả âm thanh), tích hợp với các công cụ chính như Google Search, thực thi mã hoặc ngữ cảnh lên đến một triệu mã thông báo. Hơn nữa, kiến trúc pha trộn chuyên gia được Gemini 2.5 sử dụng tối đa hóa hiệu quả bằng cách chỉ kích hoạt mạng nơ-ron cần thiết cho mỗi truy vấn, giảm mức tiêu thụ tài nguyên.
Một lợi thế đặc biệt khác là kiểm soát 'ngân sách suy nghĩ' thông qua một tham số API, cho phép các nhà phát triển quyết định mức độ mô hình nên sử dụng khả năng suy luận của nó cho từng tác vụ. Theo mặc định, trong Flash-Lite, tính năng này bị vô hiệu hóa, tìm kiếm sự cân bằng tối ưu giữa tốc độ và chi phí, nhưng nó luôn có thể được bật khi độ chính xác là ưu tiên hàng đầu.
Các chuẩn mực nội bộ mới nhất Flash-Lite đạt được điểm số nổi bật: 86,8% trong FACTS Grounding, 84,5% trong Multilingual MMLU và các con số cạnh tranh ngang nhau trong hiểu biết trực quanCác số liệu này xác nhận tính phù hợp của nó đối với các ứng dụng đòi hỏi độ chính xác và tốc độ.
Cập nhật tình trạng sẵn có và giá cả cho gia đình Gemini
Ngoài sự ra đời của Flash-Lite, Gemini 2.5 Pro và Flash hiện đã có sẵn rộng rãi, sau khi vượt qua giai đoạn thử nghiệm. Google đã nắm bắt cơ hội để đơn giản hóa hệ thống định giá, xóa bỏ sự phân biệt trước đây giữa thuế quan có suy nghĩ và không có suy nghĩ, điều này gây ra sự nhầm lẫn giữa các nhà phát triển. Bây giờ, Mô hình Flash tính phí 0,30 đô la cho mỗi triệu mã thông báo đầu vào cho văn bản, hình ảnh và video và 2,50 đô la cho mỗi triệu mã thông báo đầu ra., với mức giá riêng cho âm thanh.
Trong trường hợp của Flash-Lite, giá cả thậm chí còn được điều chỉnh nhiều hơn, củng cố bản thân như là mô hình đầu vào cho những người xử lý khối lượng dữ liệu lớn nhưng không cần sự tinh vi tối đa trong suy luận tự động.
Các trường hợp sử dụng và quyền truy cập vào mô hình Flash-Lite

Google nhắm mục tiêu đến các nhà phát triển và doanh nghiệp có nhu cầu Dịch hàng loạt, phân loại dữ liệu và phân tích quy mô lớn là những người hưởng lợi chính của Flash-Lite. Mô hình này cũng hữu ích cho việc tổ chức thông tin tự động, xử lý nội dung đa phương tiện và các hoạt động mà mỗi mili giây đều có giá trị, chẳng hạn như phản hồi tức thời trong các công cụ dịch vụ khách hàng hoặc hệ thống cảnh báo và giám sát.
Gemini 2.5 Flash-Lite hiện đã có sẵn có sẵn ở chế độ xem trước xuyên qua Google AI Studio và Vertex AITrong khi đó, các mô hình Flash và Pro có thể được sử dụng trong các dịch vụ này và trong ứng dụng Gemini. Tất cả các tùy chọn này cho phép bạn điều chỉnh ngân sách và thích ứng với hồ sơ của từng dự án hoặc nhu cầu.
Google tìm cách cung cấp giải pháp cho mọi đối tượng và ngân sách, tích hợp các mô hình này vào cả công cụ tìm kiếm Tổng quan AI và các sản phẩm năng suất như Meet, Docs và Sheets. Với sự ra mắt của Flash Lite, Google đang mở rộng phạm vi các tùy chọn khả dụng, giúp AI tạo ra dễ truy cập hơn nữa cho các tác vụ mà khối lượng, tốc độ và giá cả là các yếu tố quyết định.
Tôi là một người đam mê công nghệ và đã biến sở thích “đam mê” của mình thành một nghề. Tôi đã dành hơn 10 năm cuộc đời mình để sử dụng công nghệ tiên tiến và mày mò đủ loại chương trình chỉ vì tò mò. Bây giờ tôi chuyên về công nghệ máy tính và trò chơi điện tử. Điều này là do trong hơn 5 năm, tôi đã viết cho nhiều trang web khác nhau về công nghệ và trò chơi điện tử, tạo ra các bài viết nhằm cung cấp cho bạn thông tin bạn cần bằng ngôn ngữ mà mọi người đều có thể hiểu được.
Nếu bạn có bất kỳ câu hỏi nào, kiến thức của tôi bao gồm mọi thứ liên quan đến hệ điều hành Windows cũng như Android dành cho điện thoại di động. Và cam kết của tôi là với bạn, tôi luôn sẵn sàng dành một vài phút và giúp bạn giải quyết mọi thắc mắc mà bạn có thể có trong thế giới internet này.