Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

15.03.2026 11 software

Google giới thiệu Gemini 3.1 Flash‑Lite – mô hình AI tiết kiệm và nhanh

Công ty Google công bố ra mắt phiên bản mới của mô hình Gemini 3.1 Flash‑Lite, được định vị là chi phí thấp nhất trong dòng Gemini về giá cả và hiệu suất.

* Tối ưu cho dữ liệu lớn – thuật toán được thiết kế đặc biệt để xử lý hiệu quả các tập dữ liệu khổng lồ.
* Chi phí sử dụng – 0,25 $ cho mỗi triệu token đầu vào và 1,50 $ cho mỗi triệu token đầu ra.

Phiên bản thử nghiệm đã sẵn có:

- dành cho nhà phát triển qua Gemini API trong Google AI Studio;
- dành cho khách hàng doanh nghiệp – trong Vertex AI.

Tốc độ và chất lượng
Chỉ số Gemini 3.1 Flash‑Lite vs Gemini 2.5 Flash: Thời gian tới token đầu tiên 2,5 lần nhanh hơn—Tốc độ xuất đáp án cao hơn 45 %—Chất lượng trả lời tương đương/điều tốt hơn—
Độ trễ thấp làm cho mô hình đặc biệt hấp dẫn cho các ứng dụng thời gian thực: từ chatbot đến giao diện tương tác, nơi phản hồi phải ngay lập tức.

Kết quả thử nghiệm
* Xếp hạng ELO trên Arena.ai – 1432 điểm.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.

Trong các bài kiểm tra này Gemini 3.1 Flash‑Lite đã vượt trội hơn các mô hình cùng cấp và thậm chí cả một số tiền nhiệm lớn hơn (ví dụ, Gemini 2.5 Flash) trong lý luận và xử lý đa phương tiện.

Tính linh hoạt và khả năng mở rộng
Nhà phát triển có thể điều chỉnh độ sâu suy nghĩ của mô hình cho phù hợp với nhu cầu – yếu tố quan trọng đối với các tải công việc cao tần.
Thuật toán được tối ưu cho:

- dịch văn bản lớn;
- kiểm duyệt nội dung, nơi chi phí là yếu tố hàng đầu.

Nó cũng thích hợp cho tạo giao diện người dùng (UI), bảng điều khiển, mô phỏng và nghiên cứu dựa trên truy vấn phức tạp.

Tóm lại: Gemini 3.1 Flash‑Lite kết hợp tính tiết kiệm, tốc độ và chất lượng đáng tin cậy, làm cho nó trở thành công cụ giá trị cả cho nhà phát triển cá nhân lẫn khách hàng doanh nghiệp đang tìm kiếm giải pháp AI với độ trễ thấp và hiệu suất cao.

Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

Related news

Google Gemini đã đạt được 750 triệu người dùng hoạt động hàng tháng, chỉ để lại ChatGPT ở một khoảng cách nhỏ so với nhà lãnh đạo.

Nothing đã giới thiệu phiên bản beta của Essential Apps – nền tảng để tạo mini Ứng dụng bằng trí tuệ nhân tạo

Microsoft đã giải thích lý do tại sao các tài khoản VeraCrypt và các dịch vụ mở khác bị khóa—do sự cẩu thả của những người sáng lập chúng

Ứng dụng Meta✴ AI đã chiếm vị trí thứ năm trong App Store sau khi ra mắt Muse Spark

Bình luận (0)

Đăng nhập để bình luận

Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

Related news

Google Gemini đã đạt được 750 triệu người dùng hoạt động hàng tháng, chỉ để lại ChatGPT ở một khoảng cách nhỏ so với nhà lãnh đạo.

Nothing đã giới thiệu phiên bản beta của Essential Apps – nền tảng để tạo mini Ứng dụng bằng trí tuệ nhân tạo

Microsoft đã giải thích lý do tại sao các tài khoản VeraCrypt và các dịch vụ mở khác bị khóa—do sự cẩu thả của những người sáng lập chúng

Ứng dụng Meta✴ AI đã chiếm vị trí thứ năm trong App Store sau khi ra mắt Muse Spark

Đăng nhập để bình luận

Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

Ứng dụng Meta✴ AI đã chiếm vị trí thứ năm trong App Store sau khi ra mắt Muse Spark