Pedir a los agentes que demuestren su trabajo es un gran prompt activa un estilo de flujo de trabajo completamente diferente que produce mejores resultados Normalmente se presenta algún tipo de prueba guiada por pruebas, pero también scripts desechables para mostrar los resultados y la consistencia de los experimentos LOCO