Vejo muito "Eu nunca costumava escrever testes, mas só peço para o LLM gerar um traje completo". Mas isso não é errado? Pensando pelos princípios básicos, se os testes são prova definitiva de que seu código funciona, então você deve colocar muito esforço manual para projetar um bom traje de teste e então deixar o LLM eliminar o código de uma vez para satisfazer os testes. Por que a prática comum é o contrário? Parece que, em teoria, o TDD deveria prosperar na codificação agentic-first, mas não é assim. Por quê?