Claude 4.6は優れたプログラマーですが、非常に深刻なバグを常に書き続けます。監査で全てを検出することはできませんし、他のClaudeもそうではありません Codex 5.4はコミットごとに4+回監査する必要があります。信じられないなら、試してみて。 私は/auditcodexのスキルを持っています
「テストに合格したんだ!ちなみに「虫はいない!」というのは無茶な仮定です
136