Google đã ra mắt Gemini 3 Deep Think – dịch vụ AI tiên tiến cho các nhiệm vụ khoa học, tiếp tục “điều chỉnh” câu trả lời theo yêu cầu.

Google đã ra mắt Gemini 3 Deep Think – dịch vụ AI tiên tiến cho các nhiệm vụ khoa học, tiếp tục “điều chỉnh” câu trả lời theo yêu cầu.

6 software

Google đã giới thiệu phiên bản cập nhật mới của Gemini 3 Deep Think

Công ty Google công bố một bản nâng cấp lớn cho nền tảng Gemini 3 Deep Think – trí tuệ nhân tạo có khả năng suy luận và giải quyết các bài toán khoa học-điện kỹ thuật phức tạp.

Những gì đã thay đổi
Tham số Mới Cách nhìn thấy Mục tiêu
Chuyển từ lý thuyết thuần túy sang ứng dụng thực tiễn Giải quyết vấn đề mà không có giới hạn rõ ràng, với dữ liệu chưa đầy đủ Truy cập Được tích hợp trong ứng dụng Gemini Người đăng ký Google AI Ultra có thể sử dụng, và qua API – các kỹ sư và công ty (cần nộp đơn) Đối tác phát triển Nhà khoa học nghiên cứu Hợp tác giải quyết các vấn đề phức tạp

Chỉ số hiệu suất
Kiểm tra Kết quả Bình luận
Humanity’s Last Exam 48,4 % Không sử dụng công cụ bên ngoài
ARC‑AGI‑284,6 % Đánh giá chuẩn cho trợ lý AI
Codeforces (Elo) 3455 Xếp hạng cao trong các giải pháp phần mềm
IMO 2025 Vàng huy Tương đương mức độ tham gia cuộc thi quốc tế
Hóa học/Vật lý Kết quả tương tự Thể hiện tính đa năng trong nhiều ngành học
CMT‑Benchmark (vật lý lý thuyết) 50,5 % Thành thạo các khái niệm phức tạp

Trợ lý AI “Aletheia”
Trong phòng thí nghiệm DeepMind của Google, họ đã tạo ra một tác nhân Aletheia dựa trên Gemini 3 Deep Think. Các tính năng chính:

1. Kiểm tra giả thuyết – tác nhân phát hiện điểm yếu trong các giải pháp đề xuất và điều chỉnh chúng theo cách lặp đi lặp lại.
2. Nhận diện sự không chắc chắn – có thể thông báo khi không biết câu trả lời.
3. Tương tác với nguồn bên ngoài – sử dụng công cụ tìm kiếm Google và duyệt web, nhưng tránh tạo ra các liên kết giả mạo.

Các cấp độ thành tựu
Google chia thành công của Aletheia thành năm giai đoạn:

Giai đoạn Mô tả Ví dụ
0 – “đổi mới nhỏ” Chế độ hoàn toàn tự động, ba bài toán của P. Erdős đã được giải (cấp 1) Ba bài toán Erdős
1 – “đổi mới tối thiểu” Một kết quả bổ sung trong chế độ tự động Bài toán thứ tư
2 – “sẵn sàng công bố” Kết quả cả độc lập lẫn hợp tác với con người, cùng các công cụ hỗ trợ Các bài toán dữ liệu 3–4 – “đột phá đáng kể/đáng chú ý” Chưa đạt được

Cách Aletheia xử lý các bài toán Erdős
* Trong số 700 vấn đề chưa giải quyết cho tới nay của tác nhân, đã giải được 13.
* Tuy nhiên chỉ có 4 trong số đó thực sự mới – phần còn lại đã biết trước trong cộng đồng khoa học.
* Trong số 212 giải pháp nộp, chỉ 6,5 % là đúng nội dung; 68,5 % chứa lỗi cơ bản, và 31,5 % – hiểu sai vấn đề.

Các nhà phát triển lưu ý rằng AI có xu hướng “tái diễn giải câu hỏi để trả lời đơn giản hơn”, và vẫn “rất dễ mắc lỗi so với con người”. Do đó hiện chưa thể thay thế các nhà toán học bằng trí tuệ nhân tạo.

Tóm lại: Gemini 3 Deep Think và tác nhân Aletheia của nó cho thấy kết quả ấn tượng trong nhiều lĩnh vực khoa học, nhưng vẫn giữ những hạn chế đáng kể về độ chính xác và độ tin cậy của giải pháp. Google tiếp tục cải thiện khả năng suy luận sâu và kiểm tra các kết luận của mình.

Bình luận (0)

Chia sẻ ý kiến của bạn — vui lòng lịch sự và đúng chủ đề.

Chưa có bình luận nào. Hãy để lại bình luận và chia sẻ ý kiến của bạn!

Để bình luận, vui lòng đăng nhập.

Đăng nhập để bình luận