Ich bitte um eine Bewertung zu "Mit wie wenigen Zeilen und kleinen Änderungen kannst du dieses swe-bench Problem lösen", damit OpenAI es bis zum Äußersten optimieren kann. Mein Job in diesen Tagen besteht nur darin, etwa 60 % von Codex' Ausgaben zu löschen 😭