"Bu swe-bench problemini ne kadar az hat ve küçük değişikliklerle çözebilirsin" değerlendirmesi talep ediyorum ki openai bu işi demekçe tırmanabilsin. Bugünlerde işim Codex'in çıktılarından 😭 yaklaşık %60'ını silmek