Anthropic đã xác nhận việc phát triển mô hình mạnh nhất Claude Mythos – chi tiết được công bố sau vụ rò rỉ.
Tóm tắt sự kiện
Công ty Anthropic chính thức xác nhận đang phát triển mô hình trí tuệ nhân tạo mới — Claude Mythos. Nó vượt trội hơn tất cả các phiên bản trước về tính năng và, như công ty ghi chú, mang lại “mối rủi ro chưa từng thấy” cho an ninh mạng. Thông tin này xuất hiện do một lần rò rỉ ngẫu nhiên của các bản nháp đã lọt vào bộ nhớ cache công khai.
1. Sự việc gì xảy ra
Ngày: Trước chiều thứ Năm
Trong cache công cộng, phát hiện một bản nháp blog của Anthropic đề cập Claude Mythos như một AI tạo ra “mối rủi ro chưa từng thấy” trong lĩnh vực an ninh mạng.
Sau khi được thông báo bởi Fortune, công ty đã tắt tìm kiếm công khai trên cache và hạn chế truy cập tài liệu. Lý do rò rỉ: Anthropic giải thích là “sự hiểu lầm của con người” khi thiết lập hệ thống quản lý nội dung.
2. Quy mô rò rỉ
* Khoảng 3 000 tài liệu, bao gồm bản nháp blog và tài liệu nội bộ, đã được công khai.
* Trong số các tệp rò rỉ:
* PDF về một sự kiện riêng dành cho giám đốc điều hành của các công ty châu Âu tại Vương quốc Anh (với sự tham gia Dario Amodei).
* Tài liệu mô tả cấp độ mới của các mô hình AI — Capybara và Claude Mythos.
* Đánh giá khối lượng rò rỉ do hai chuyên gia thực hiện:
* Alexander Povel – nhà nghiên cứu an ninh mạng tại University of Cambridge.
* Roy Paz – trưởng nhóm nghiên cứu bảo mật AI tại LayerX Security.
3. Capybara và Claude Mythos là gì
Thuật ngữ | Mô tả
---|---
Capybara | Cấp độ mới của các mô hình, lớn hơn và thông minh hơn Opus (mô hình “đỉnh cao” hiện tại). Trong nội bộ thuộc cùng cơ sở dữ liệu với Claude Mythos.
Claude Mythos | Thực chất là mô hình mới nhất của công ty. Có kết quả tốt hơn đáng kể trong lập trình, suy luận học thuật và an ninh mạng so với Opus 4.6.
* Hiện Anthropic bán ba cấp độ mô hình: Opus, Sonnet và Haiku.
4. Tập trung chính – rủi ro an ninh mạng
* Claude Mythos được mô tả là một hệ thống có thể phát hiện lỗ hổng nhanh hơn các phương pháp bảo vệ truyền thống.
* Theo kế hoạch của công ty, truy cập sớm sẽ chỉ dành cho các tổ chức chuyên về bảo mật mạng để họ có thể chuẩn bị hệ thống trước những cuộc tấn công tiềm năng sử dụng AI.
5. So sánh với đối thủ
Công ty | Mô hình | Điểm chính
---|---|---
OpenAI | GPT‑5.3‑Codex (tháng 2) | Đầu tiên được phân loại “Preparedness” trong an ninh mạng; được huấn luyện để phát hiện lỗ hổng phần mềm.
Anthropic | Opus 4.6 (hôm nay) | Có khả năng phát hiện các lỗ hổng chưa biết trước trong cơ sở mã.
6. Điều gì tiếp theo?
* Claude Mythos đang ở giai đoạn hoàn thiện đào tạo và dự kiến ra mắt trong truy cập sớm giới hạn.
* Công ty nhấn mạnh rằng mô hình vẫn chưa sẵn sàng cho sử dụng rộng rãi do chi phí vận hành cao.
Như vậy, vụ rò rỉ đã tiết lộ chi tiết về mô hình mới của Anthropic, tiềm năng và những rủi ro nghiêm trọng đối với ngành an ninh mạng. Công ty đã thực hiện các biện pháp hạn chế truy cập tài liệu rò rỉ và giải thích nguyên nhân sự cố.
Bình luận (0)
Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.
Đăng nhập để bình luận