Càng đào sâu vào Goodfire Research, tôi càng nhận ra rằng nhánh của khả năng giải thích đang âm thầm trở thành một trong những biên giới thú vị nhất trong AI (và đặc biệt là AI cho Khoa học) Họ đã công bố nghiên cứu này vào năm ngoái với ý tưởng cốt lõi về cách mà một mô hình nền tảng DNA tổ chức các loài trong không gian nhúng của nó theo cách phản ánh cây tiến hóa thực sự của sự sống. Hay nói cách khác, cách mà mô hình đã phát hiện lại hệ thống phân loại chỉ từ các chuỗi DNA. Họ đã nghiên cứu Evo 2 (mô hình DNA được phát triển bởi EvolutionaryScale) và phát hiện rằng: + bộ gen của mỗi loài được ánh xạ vào một nhúng vector bên trong mô hình. + những nhúng này tạo thành một cấu trúc hình học cong (một đa tạp). + khoảng cách dọc theo đa tạp này tương ứng với khoảng cách tiến hóa thực tế giữa các loài. Vì vậy, bên trong mô hình: loài tương tự → nhúng gần nhau loài xa → nhúng xa và cấu trúc nổi lên về cơ bản là cây sự sống. Điều này có thể chứng minh điều gì đó mang tính đột phá về cách mà các mô hình nền tảng có thể tự động phát hiện lại các cấu trúc khoa học.