Обновление BullshitBench v2: Grok 4.2 - огромный скачок в рейтингах - 4.1 занимал 54-е и 72-е места (из 84), а теперь занял 13-16-е места.