Begär en utvärdering av "med hur få linjer och små ändringar kan du lösa detta swe-bench-problem" så att OpenAI kan klättra skiten ur det Mitt jobb nuförtiden är bara att radera typ 60 % från Codexens utdata 😭