solicitando una evaluación de "con cuántas pocas líneas y pequeños cambios puedes resolver este problema de swe-bench" para que openai pueda escalarlo al máximo mi trabajo estos días es simplemente eliminar como el 60% de las salidas de codex 😭