Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

Google đã công bố Gemini 3.1 Flash‑Lite là “đại diện nhanh nhất và tiết kiệm năng lượng trong dòng sản phẩm của mình”.

11 software

Google giới thiệu Gemini 3.1 Flash‑Lite – mô hình AI tiết kiệm và nhanh

Công ty Google công bố ra mắt phiên bản mới của mô hình Gemini 3.1 Flash‑Lite, được định vị là chi phí thấp nhất trong dòng Gemini về giá cả và hiệu suất.

* Tối ưu cho dữ liệu lớn – thuật toán được thiết kế đặc biệt để xử lý hiệu quả các tập dữ liệu khổng lồ.
* Chi phí sử dụng – 0,25 $ cho mỗi triệu token đầu vào và 1,50 $ cho mỗi triệu token đầu ra.

Phiên bản thử nghiệm đã sẵn có:

- dành cho nhà phát triển qua Gemini API trong Google AI Studio;
- dành cho khách hàng doanh nghiệp – trong Vertex AI.

Tốc độ và chất lượng
Chỉ số Gemini 3.1 Flash‑Lite vs Gemini 2.5 Flash: Thời gian tới token đầu tiên 2,5 lần nhanh hơn—Tốc độ xuất đáp án cao hơn 45 %—Chất lượng trả lời tương đương/điều tốt hơn—
Độ trễ thấp làm cho mô hình đặc biệt hấp dẫn cho các ứng dụng thời gian thực: từ chatbot đến giao diện tương tác, nơi phản hồi phải ngay lập tức.

Kết quả thử nghiệm
* Xếp hạng ELO trên Arena.ai – 1432 điểm.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.

Trong các bài kiểm tra này Gemini 3.1 Flash‑Lite đã vượt trội hơn các mô hình cùng cấp và thậm chí cả một số tiền nhiệm lớn hơn (ví dụ, Gemini 2.5 Flash) trong lý luận và xử lý đa phương tiện.

Tính linh hoạt và khả năng mở rộng
Nhà phát triển có thể điều chỉnh độ sâu suy nghĩ của mô hình cho phù hợp với nhu cầu – yếu tố quan trọng đối với các tải công việc cao tần.
Thuật toán được tối ưu cho:

- dịch văn bản lớn;
- kiểm duyệt nội dung, nơi chi phí là yếu tố hàng đầu.

Nó cũng thích hợp cho tạo giao diện người dùng (UI), bảng điều khiển, mô phỏng và nghiên cứu dựa trên truy vấn phức tạp.

Tóm lại: Gemini 3.1 Flash‑Lite kết hợp tính tiết kiệm, tốc độ và chất lượng đáng tin cậy, làm cho nó trở thành công cụ giá trị cả cho nhà phát triển cá nhân lẫn khách hàng doanh nghiệp đang tìm kiếm giải pháp AI với độ trễ thấp và hiệu suất cao.

Bình luận (0)

Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.

Chưa có bình luận nào. Hãy để lại bình luận và chia sẻ ý kiến của bạn!

Để bình luận, vui lòng đăng nhập.

Đăng nhập để bình luận