Gemini 3 Deep Think (2/26) Puoliyksityinen arviointi - ARC-AGI-1: 96,0 %, 7,17 $/tehtävä - ARC-AGI-2: 84,6 % 13,62 $/tehtävä Uusi ARC-AGI SOTA -malli @GoogleDeepMind
ARC-AGI-1 tulostaulukko
- Tulostaulukko: - Toista tulokset: - Testauspolitiikka:
222