Запит на оцінку «з наскільки малою кількістю ліній і дрібних змін можна вирішити цю проблему SWE-Bench», щоб OpenAI міг піднятися на пагорби Моя робота зараз — просто видалити близько 60% з вихідних 😭 даних Codex