Có một mô-đun AI “không thuộc sở hữu” đáng ngờ xuất hiện trên mạng, có thể liên quan đến dự án DeepSeek

Hunter Alpha – mô hình bí ẩn gây nghi ngờ về DeepSeek

Mô hình AI mới xuất hiện trên nền tảng OpenRouter mà không ghi rõ tác giả đã nhanh chóng thu hút sự chú ý của các nhà báo và nhà nghiên cứu. Vào ngày 11 tháng 3, nó được công bố với tên “Hunter Alpha” và sau đó bị chính nền tảng đánh dấu là “mô hình ẩn”, điều này làm tăng thêm những tin đồn rằng startup Trung Quốc DeepSeek có thể đang thử nghiệm một thế hệ AI tiếp theo của mình trước khi ra mắt chính thức.

Những gì chuyên gia nói
* Reuters đã thực hiện một loạt các bài kiểm tra với chatbot Hunter Alpha.

- Bot tự mô tả mình là “mô hình Trung Quốc, được huấn luyện chủ yếu bằng tiếng Trung”.

- Nó cho biết dữ liệu huấn luyện bao gồm thời gian tới tháng Năm năm 2025 – ngày mà chính chatbot của DeepSeek đã đề cập.

- Khi hỏi về người sáng tạo, nó chỉ trả lời: “tôi biết tên mình, số lượng tham số và độ dài cửa sổ ngữ cảnh”. Cả DeepSeek lẫn OpenRouter đều không tiết lộ tác giả.

Thông số kỹ thuật
* 1 nghìn tỷ tham số – cho thấy yêu cầu tính toán khổng lồ.

* Cửa sổ ngữ cảnh lên tới 1 triệu token – cho phép xử lý lượng văn bản khổng lồ trong một phiên.

Nabil Haouam, kỹ sư AI agents, nhận xét rằng sự kết hợp của cửa sổ lớn và suy luận logic khi có truy cập miễn phí ngay lập tức thu hút ánh nhìn; các mô hình tương tự thường đòi hỏi chi phí cao hơn.

Liên hệ với DeepSeek V4
* Bộ tham số (1 nghìn tỷ) và cửa sổ ngữ cảnh (1 triệu token) trùng khớp với những gì đã được công bố cho mô hình DeepSeek V4 dự kiến ra mắt vào tháng Tư.

* Sự trùng lặp này đã tạo ra một làn sóng giả thuyết rằng Hunter Alpha có thể là phiên bản thử nghiệm sớm của sản phẩm tương lai.

Phân tích logic suy luận
* Daniel Dewhurst thực hiện phân tích các mẫu chuỗi suy luận và kết luận rằng phong cách xây dựng logic trong bot khó bị sao chép; nó thường phản ánh phương pháp huấn luyện mô hình.

Tuy nhiên, không phải ai cũng đồng ý với kết luận này.

Ý kiến độc lập
* Umur Ozkul thực hiện một benchmark độc lập và kết luận rằng Hunter Alpha có thể không phải là DeepSeek V4.

- Ông đưa ra những khác biệt trong hành vi token và các mẫu kiến trúc so với các hệ thống DeepSeek đã tồn tại.

Sự phổ biến của mô hình
* Theo dữ liệu từ OpenRouter vào Chủ Nhật, mô hình đã xử lý hơn 160 tỷ token.

* Phần lớn yêu cầu đến từ công cụ phát triển và framework cho AI agents.

Việc chạy mô hình một cách vô danh không phải là điều hiếm: nhiều nhà phát triển sử dụng phương pháp này để nhận được phản hồi khách quan từ cộng đồng trước khi ra mắt chính thức.

Có một mô-đun AI “không thuộc sở hữu” đáng ngờ xuất hiện trên mạng, có thể liên quan đến dự án DeepSeek

Related news

Apple‑Car có thể trông như thế này: Ferrari trình diễn nội thất của chiếc xe điện Luce do Johnny Ive thiết kế.

Doanh số bán Mortal Kombat 1 đã vượt qua 8 triệu bản, nhưng kỷ lục của trò chơi trước vẫn chưa được đạt tới

Tesla đã triển khai chiến dịch chống các phương pháp kích hoạt tự lái “đánh lừa” ở những khu vực nơi việc sử dụng bị cấm.

Trong vòng năm năm, nhu cầu bộ nhớ theo đánh giá của giám đốc Dell sẽ tăng hơn 600 lần nhờ sự phát triển của AI‑paper.

Bình luận (0)

Đăng nhập để bình luận