Solicitando una evaluación de "con cuántas líneas y pequeños cambios puedes resolver este problema de SWE Bench" para que OpenAI pueda hacer una subida de cuesta a tope Mi trabajo últimamente es eliminar como un 60% de las salidas 😭 del códex