🤯TIN NÓNG: Alibaba vừa chứng minh rằng AI Coding không lấy đi công việc của bạn, nó chỉ viết mã di sản sẽ giữ bạn làm việc sửa chữa nó trong suốt thập kỷ tới. 🤣 Vượt qua một bài kiểm tra lập trình một lần là dễ. Duy trì mã đó trong 8 tháng mà không bị nổ tung? Rõ ràng, điều đó gần như không thể đối với AI. Alibaba đã thử nghiệm 18 tác nhân AI trên 100 mã nguồn thực trong các chu kỳ 233 ngày. Họ không chỉ tìm kiếm "các giải pháp nhanh" - họ tìm kiếm sự sống sót lâu dài. Kết quả là một cuộc tắm máu: 75% các mô hình đã làm hỏng mã đang hoạt động trong quá trình bảo trì. Chỉ có Claude Opus 4.5/4.6 duy trì tỷ lệ không suy giảm >50%. Mọi mô hình khác đều tích lũy nợ kỹ thuật cho đến khi mã nguồn sụp đổ. Chúng ta đã sử dụng các tiêu chuẩn "snapshot" như HumanEval chỉ hỏi "Nó có hoạt động ngay bây giờ không?" Tiêu chuẩn SWE-CI mới hỏi: "Nó có vẫn hoạt động sau 8 tháng phát triển không?" Hầu hết các tác nhân AI là "Nghệ sĩ Sửa Chữa Nhanh." Họ viết mã giòn dễ gãy mà hôm nay vượt qua các bài kiểm tra nhưng trở thành cơn ác mộng bảo trì vào ngày mai. Họ không xây dựng phần mềm; họ đang xây dựng một ngôi nhà bằng thẻ bài. Câu chuyện vừa trở nên chân thật: Hầu hết các mô hình có thể viết mã. Hầu như không có mô hình nào có thể duy trì nó.