Esses novos benchmarks de IA estão a ficar insanos.