Alibaba ra mắt các mô hình Qwen 3.5 nhỏ gọn, hoạt động trực tiếp trên laptop và vượt trội hơn các đối thủ của OpenAI.

Alibaba ra mắt các mô hình Qwen 3.5 nhỏ gọn, hoạt động trực tiếp trên laptop và vượt trội hơn các đối thủ của OpenAI.

8 hardware

Alibaba Qwen 3.5 — bộ sưu tập mới các mô hình AI nhỏ gọn

Trong khuôn khổ bộ phận trí tuệ nhân tạo của mình, Alibaba đã công bố ra mắt dòng mô hình Qwen 3.5, hứa hẹn “kích thước nhỏ + hiệu suất cao”. So với các đồng loại Mỹ, chúng cho thấy độ chính xác tốt hơn trong khi tiêu thụ bộ nhớ ít hơn.

Mô hìnhKích thướcĐặc điểm nổi bật
Qwen 3.5‑0.8B0,8 tỷ tham số“Nhỏ gọn” và “nhanh”, dành cho nguyên mẫu và thiết bị di động có dung lượng pin hạn chế
Qwen 3.5‑2B2 tỷ tham sốTương tự 0.8B nhưng mạnh hơn một chút
Qwen 3.5‑4B4 tỷ tham sốĐa phương thức, cửa sổ ngữ cảnh 262 144 token; phù hợp với các giải pháp đại lý nhẹ
Qwen 3.5‑9B9 tỷ tham sốCó khả năng suy luận, vượt trội hơn OpenAI gpt‑oss‑120B (13,5× nhiều tham số) và thể hiện mức độ tư duy nghiên cứu sinh trong lập luận logic

Tất cả các mô hình đều được cấp phép Apache 2.0, cho phép sử dụng trong dự án thương mại và tiếp tục huấn luyện khi cần.

Điểm mới trong kiến trúc?
Alibaba đã từ bỏ Transformer truyền thống và áp dụng cấu trúc kết hợp:

* Gated Delta Networks (GDN) – cung cấp tốc độ cao và độ trễ thấp.
* Mixture‑of‑Experts (MoE) – giải quyết vấn đề hạn chế bộ nhớ, thường gặp ở các mô hình nhỏ.

Nhờ đó Qwen 3.5 có thể xử lý token đa phương thức ngay lập tức, thay vì “kết nối” trình tạo ảnh với mô hình văn bản như các thế hệ trước. Kết quả là phiên bản 4B và 9B có khả năng nhận diện phần tử UI và đếm đối tượng trong video.

Kiểm tra và kết quả
| Kiểm thử | Qwen 3.5‑9B |
|----------|-------------|
| So sánh MMMU‑Pro (hình ảnh) | 70,1 % – vượt qua Google Gemini 2.5 Flash‑Lite (59,7) và Qwen 3‑VL‑30B‑A3B (63,0) |
| Lập luận logic | 81,7 % – hơn OpenAI gpt‑oss‑120B (80,1), mặc dù gpt‑oss có 10× nhiều tham số |
| HMMT Feb 2025 (toán học) | 83,2 % (9B), 74,0 % (4B) – chứng minh không cần tài nguyên đám mây khổng lồ cho các nhiệm vụ khoa học phức tạp |
| OmniDocBench v1.58 | 87,7 % – dẫn đầu trong số mọi mô hình |
| MMMLU (đa ngôn ngữ) | 81,2 % – vượt qua gpt‑oss‑120B (78,2 %) |

Tại sao điều này quan trọng?
Sự ra đời của Qwen 3.5 đồng thời với nhu cầu ngày càng tăng về các đại lý AI độc lập. Người dùng hiện nay không chỉ muốn chatbot mà còn cần hệ thống:

1. Suy nghĩ – suy luận vấn đề.
2. Nhìn thấy – xử lý ảnh, video và phần tử UI.
3. Hành động – sử dụng công cụ (điền mẫu, sắp xếp tệp).

Với chi phí vận hành cao của các mô hình lớn (từ 3–5 tỷ tham số), Qwen 3.5 là giải pháp tiết kiệm hơn. Các mô hình có thể chạy cục bộ mà không cần kết nối đám mây và API, trong khi học tăng cường giúp chúng đưa ra “quyết định con người” – ví dụ như sắp xếp bàn làm việc hoặc phát triển mã từ video.

Ứng dụng thực tiễn
* Thiết bị di động – 0,8 tỷ tham số dễ dàng vừa vào điện thoại và cung cấp hoạt động độc lập.
* Máy trạm công việc – 9 tỷ tham số mang đầy đủ tính năng đại lý AI mà không cần đám mây.
* Cơ quan giao diện – nhờ “đính kèm ở mức pixel” mô hình có thể di chuyển qua UI, điền mẫu và sắp xếp tệp, thực hiện các lệnh ngôn ngữ tự nhiên với độ chính xác khoảng 90 %.

Như vậy, Alibaba Qwen 3.5 mở đường cho những đại lý AI dễ tiếp cận hơn, linh hoạt và mạnh mẽ, có thể làm việc cả trong đám mây lẫn cục bộ, đáp ứng nhu cầu ngày càng tăng của người dùng hiện đại.

Bình luận (0)

Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.

Chưa có bình luận nào. Hãy để lại bình luận và chia sẻ ý kiến của bạn!

Để bình luận, vui lòng đăng nhập.

Đăng nhập để bình luận