solicitando uma avaliação de "com quantas poucas linhas e pequenas mudanças você pode resolver este problema do swe-bench" para que a openai possa escalar isso ao máximo meu trabalho atualmente é apenas deletar cerca de 60% das saídas do codex 😭