Je vois beaucoup de "Je n'avais jamais utilisé de tests, mais maintenant je demande simplement à LLM de générer un ensemble complet". Mais n'est-ce pas faux ? En réfléchissant à partir des premiers principes, si les tests sont la preuve définitive que votre code fonctionne, alors vous devriez mettre beaucoup d'efforts manuels dans la conception d'un bon ensemble de tests, puis laisser LLM générer le code réel pour satisfaire les tests. Pourquoi la pratique courante est-elle l'inverse ? Il semble qu'en théorie, le TDD devrait prospérer dans un codage axé sur l'agent, mais ce n'est pas le cas. Pourquoi ?