Một khung tự tiến hóa để khám phá và tinh chỉnh kỹ năng của tác nhân. Hầu hết các kỹ năng của tác nhân mà tôi thấy ngày nay đều được chế tạo thủ công hoặc thiết kế kém bởi một tác nhân. Các hệ thống đa tác nhân để xây dựng kỹ năng trông có vẻ hứa hẹn. Bài báo này giới thiệu EvoSkill, một khung tự tiến hóa tự động khám phá và tinh chỉnh kỹ năng của tác nhân thông qua phân tích thất bại lặp đi lặp lại. EvoSkill phân tích các thất bại trong quá trình thực thi, đề xuất các kỹ năng mới hoặc chỉnh sửa các kỹ năng hiện có, và hiện thực hóa chúng thành các thư mục kỹ năng có cấu trúc, có thể tái sử dụng. Ba tác nhân hợp tác điều khiển toàn bộ quá trình. Một Executor thực hiện các nhiệm vụ, một Proposer chẩn đoán các thất bại, và một Skill-Builder tạo ra các thư mục kỹ năng cụ thể. Một biên giới Pareto điều chỉnh việc lựa chọn, chỉ giữ lại các kỹ năng cải thiện hiệu suất xác thực giữ lại trong khi giữ nguyên mô hình cơ bản. Trên OfficeQA, EvoSkill cải thiện Claude Code với Opus 4.5 từ 60.6% lên 67.9% độ chính xác khớp chính xác. Trên SealQA, nó mang lại lợi ích 12.1%. Các kỹ năng phát triển trên SealQA chuyển giao không cần điều chỉnh sang BrowseComp, cải thiện độ chính xác lên 5.3% mà không cần sửa đổi. Tôi sẽ tiếp tục theo dõi dòng nghiên cứu này một cách chặt chẽ. Tôi nghĩ điều này thực sự quan trọng. Bài báo: Hãy học cách xây dựng các tác nhân AI hiệu quả trong học viện của chúng tôi: