Claude Code được trao quyền quản lý AWS, sau đó AI đã xóa hoàn toàn hai trang web và cơ sở dữ liệu của chúng.

Claude Code được trao quyền quản lý AWS, sau đó AI đã xóa hoàn toàn hai trang web và cơ sở dữ liệu của chúng.

13 software

Tóm tắt tin tức

Alexey Grigoryev là một nhà phát triển đã chuyển trang web của mình lên Amazon Web Services (AWS). Anh ấy sử dụng Terraform để quản lý hạ tầng và dựa vào Claude Code của Anthropic. Lỗi trong hoạt động của tác nhân không phải nguyên nhân gây ra sự cố: vấn đề xuất phát từ yếu tố con người.

Điều gì đã xảy ra
Bước Hành động Kết quả
1 Alexey quyết định hợp nhất hai tài nguyên (trang web và dịch vụ khác) vào một hạ tầng đám mây. Giảm số lượng cấu hình, nhưng tăng rủi ro lỗi.
2 Anh chọn Terraform để tự động hóa: tạo/xóa máy chủ, mạng, cân bằng tải và cơ sở dữ liệu. Kế hoạch Terraform bao gồm tất cả tài nguyên cần thiết.
3 Alexey yêu cầu Claude Code thực hiện kế hoạch, nhưng không tải tệp trạng thái (state) mô tả cấu hình hiện tại. AI đã thực hiện một phần lệnh – tạo container cho trang web, nhưng người dùng dừng quá trình giữa chừng.
4 Do thiếu state, các tài nguyên bắt đầu bị trùng lặp. Alexey quyết định xóa bản sao và sau đó tải lên tệp trạng thái. Anh giả định rằng tác nhân sẽ tiếp tục xóa các đối tượng thừa và mở state để thiết lập đúng.
5 Claude Code thực hiện `terraform destroy` theo tệp state. Trong tệp đã ghi rõ cơ sở dữ liệu đã tồn tại trên AWS. Cả hai trang web và dữ liệu của chúng (2,5 năm lưu trữ + ảnh chụp) đã bị xóa.

Hậu quả
- Mất toàn bộ cơ sở dữ liệu với lịch sử 2,5 năm.
- Cần liên hệ với dịch vụ hỗ trợ Amazon để khôi phục dữ liệu.
Trong vòng một ngày, hỗ trợ AWS đã khôi phục tất cả các đối tượng cần thiết.

Những gì Alexey làm sau sự cố
1. Kiểm tra định kỳ – cài đặt giám sát thường xuyên cho trạng thái cơ sở dữ liệu.
2. Bảo vệ khỏi xóa – bật các cơ chế bảo vệ trong Terraform và cài đặt AWS.
3. Lưu trữ tệp state – chuyển nó vào kho lưu trữ an toàn S3 thay vì ổ đĩa địa phương.
4. Quản lý tự chủ việc xóa – bây giờ mọi thao tác hủy tài nguyên đều thực hiện bởi chính nhà phát triển, không phải AI.

Kết luận
Sự cố do lỗi con người (không tải tệp state và hiểu lầm quản lý các tài nguyên trùng lặp) gây ra, chứ không phải vì hạn chế của Claude Code. Alexey đã áp dụng biện pháp giảm rủi ro trong tương lai và từ bỏ sự phụ thuộc hoàn toàn vào AI khi làm việc với Terraform.

Bình luận (0)

Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.

Chưa có bình luận nào. Hãy để lại bình luận và chia sẻ ý kiến của bạn!

Để bình luận, vui lòng đăng nhập.

Đăng nhập để bình luận