Tin mới
Không phải con người, chỉ có 16 tác nhân AI Claude đã xây dựng một trình biên dịch C hoàn chỉnh khiến các nhà phát triển vô cùng kinh ngạc
Anthropic vừa công bố một thí nghiệm gây chấn động giới lập trình khi toàn bộ quá trình xây dựng một trình biên dịch C hoàn chỉnh gần như không có sự can thiệp trực tiếp của con người. Dự án do nhà nghiên cứu Nicholas Carlini dẫn dắt đã cho thấy mức độ tiến bộ đáng kinh ngạc của khả năng cộng tác tự chủ giữa các hệ thống AI trong phát triển phần mềm thực tế.

Trong thí nghiệm này, trình biên dịch được phát triển liên tục trong vòng hai tuần với sự tham gia của 16 tác nhân Claude Opus 4.6 hoạt động độc lập. Mỗi tác nhân AI chạy trong một container Docker riêng, cùng sao chép một kho mã Git chung và làm việc hoàn toàn không có bộ điều phối trung tâm hay người quản lý. Các nhiệm vụ được các tác nhân tự động lựa chọn, xung đột mã được xử lý thông qua Git và các thay đổi được đẩy lên kho chính mà không cần giám sát thủ công. Tổng cộng, hệ thống AI này đã tạo ra khoảng 100.000 dòng mã Rust thông qua gần 2.000 phiên lập trình khác nhau với chi phí API ước tính vào khoảng 20.000 USD (Khoảng 520 triệu đồng).
Thành quả cuối cùng là một trình biên dịch C mã nguồn mở được viết hoàn toàn từ đầu và hoạt động đầy đủ. Trình biên dịch này có thể biên dịch thành công nhân Linux phiên bản 6.9 cho các kiến trúc phổ biến như x86, ARM và RISC-V, đồng thời xử lý tốt nhiều dự án mã nguồn mở lớn như PostgreSQL, SQLite, Redis hay FFmpeg. Khi được kiểm tra bằng bộ GCC Torture Test Suite vốn rất khắt khe, trình biên dịch đạt tỷ lệ vượt qua lên tới 99%. Như một cột mốc mang tính biểu tượng, hệ thống thậm chí còn biên dịch và chạy thành công Doom, một "bài test kinh điển" để chứng minh năng lực của một trình biên dịch.
Ý nghĩa của dự án này nằm ở việc nó chứng minh các hệ thống AI hiện nay đã có khả năng tự phối hợp, quản lý những cơ sở mã lớn và tạo ra phần mềm hạ tầng đạt chất lượng gần với mức sản xuất thực tế. Dù trình biên dịch vẫn còn những hạn chế và chưa thể thay thế hoàn toàn GCC, thí nghiệm này đã đánh dấu một bước tiến lớn hướng tới kỷ nguyên phát triển phần mềm do AI tự vận hành trong thời gian dài.
Nhìn về tương lai, thí nghiệm này cho thấy cách phần mềm được xây dựng có thể sẽ thay đổi sâu sắc. Các tác nhân AI có thể đảm nhiệm những công việc lặp lại, những đợt tái cấu trúc quy mô lớn, kiểm thử hay sửa lỗi, từ đó giải phóng thời gian để lập trình viên tập trung vào thiết kế, kiến trúc hệ thống và giải quyết các bài toán cốt lõi. Đồng thời, nó cũng đặt ra những câu hỏi mới về chất lượng mã, độ tin cậy và cách xác minh phần mềm do AI tạo ra. Con người rõ ràng chưa bị thay thế, nhưng vai trò của lập trình viên có thể sẽ chuyển dịch từ việc viết từng dòng mã sang định hướng, rà soát và xác nhận các hệ thống ngày càng tự chủ do AI xây dựng.
Minh Hoàng
















