Amazon dự định triển khai các mô hình AI trên những chip lớn của Cerebras.
Amazon và Cerebras hợp lực để tăng tốc mô hình ngôn ngữ lớn
Amazon Web Services (AWS) đã công bố rằng vào giữa năm 2026 sẽ bắt đầu sử dụng chip của startup Cerebras Systems Inc. cùng với các bộ xử lý Trainium riêng của mình. Theo thông tin nội bộ, điều này sẽ tạo ra “điều kiện tối ưu” cho việc triển khai và duy trì mô hình ngôn ngữ lớn (LLM). Chi tiết về mặt tài chính của giao dịch vẫn chưa được công bố.
Những gì thực sự diễn ra
* Chip Trainium 3 của AWS sẽ xử lý các yêu cầu người dùng – “hiểu” ý nghĩa của chúng.
* Sau đó, chip Cerebras Wafer‑Scale Engine (WSE) sẽ chịu trách nhiệm tạo ra câu trả lời.
Do đó, hai bộ tăng tốc chuyên dụng hoạt động cùng nhau và cung cấp tính toán suy luận cho LLM.
> “Việc tương tác giữa các thành phần khác nhau thường làm chậm quá trình,” – Nafea Bshara, phó chủ tịch của AWS, nhận xét. – “Nhưng chúng tôi cố gắng đạt được lợi thế bằng cách sử dụng chip có khả năng xử lý suy luận nhanh hơn.”
Lợi thế này đặc biệt rõ rệt ở những nơi tốc độ phản hồi quan trọng: ví dụ, khi viết mã từng bước hoặc tạo văn bản theo thời gian thực.
Tại sao điều này quan trọng
* Amazon là một trong những nhà cung cấp dịch vụ đám mây lớn nhất và là người dùng GPU của Nvidia. Hiện tại công ty đang phát triển chip AI riêng để nâng cao hiệu quả trung tâm dữ liệu và mang đến cho khách hàng các dịch vụ độc đáo.
* Đối với Cerebras, hợp tác với AWS là hợp đồng lớn đầu tiên từ một cường đại dữ liệu, điều này tăng nhận diện thương hiệu trước thị trường tiềm năng. Điều này cũng quan trọng trong bối cảnh chuẩn bị IPO của họ.
Kết luận
AWS và Cerebras cùng nhau xây dựng cơ sở hạ tầng mới cho mô hình ngôn ngữ lớn: chip Trainium 3 xử lý yêu cầu, còn WSE tạo ra câu trả lời. Mặc dù dịch vụ riêng lẻ chỉ dùng Trainium có thể rẻ hơn, giải pháp kết hợp hứa hẹn tăng tốc đáng kể, nơi “thời gian là tiền bạc”. Điều này củng cố vị thế của Amazon như một khách hàng lớn của Nvidia và đồng thời thúc đẩy chip AI của công ty đạt hiệu suất cao hơn.
Bình luận (0)
Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.
Đăng nhập để bình luận