necesitamos arreglar la arquitectura, el contexto de ventana deslizante no es memoria del agente 🧵
1/ el contexto de ventana deslizante no es memoria del agente. la mayoría de las personas que construyen con agentes de IA no conocen la diferencia. y está rompiendo sus productos.
Una ventana deslizante de 2/a es solo lo que el LLM puede ver en este momento. (temporal. sin estado. ciego fuera de la ventana.) es la conversación activa (tokens entrantes, tokens salientes). una vez que algo se desplaza más allá del límite, se ha ido. completamente. el modelo no tiene idea de que alguna vez existió.
La memoria del agente 3/ es algo completamente diferente. (es la diferencia entre la RAM y un disco duro.) es un almacenamiento explícito (hechos, preferencias, interacciones pasadas) que vive fuera del modelo. se puede consultar, actualizar, eliminar. sobrevive al final de las sesiones.
4/sin memoria real, los agentes no aprenden realmente de las conversaciones pasadas. (es solo una alucinación muy segura.) lo que hacen en su lugar es adivinar. hacen coincidencias de patrones dentro de la ventana actual y fingen continuidad. parece coherente. no lo es.
5/ confundir los dos es donde las cosas salen mal en silencio. asumes que tu agente conoce las preferencias del usuario. no lo hace (eso es solo contexto desplazado hace dos sesiones). parecía que recordaba. solo estaba trabajando con lo que tenía delante.
tu agente no está roto. simplemente nunca tuvo memoria para empezar.
69