DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Recientemente, @supermemory logró un 99% en LongMemEval. El problema es que los benchmarks de memoria se crearon cuando los LLMs tenían una ventana de contexto muy pequeña. Por ejemplo, LongMemEval_M es de ~1.5M tokens. Lo cual está casi dentro de la ventana de contexto de Opus 4.6. Por lo que entiendo, el mejor benchmark actual es BEAM con una ventana de contexto de 10M. Así que estoy evaluando todos los nuevos sistemas de memoria en función de su puntuación allí. ¡Emocionado por ver cómo puntuará @supermemory! ¡Estoy seguro de que le irá bien!

Parte superior

Clasificación

Favoritos