Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Recientemente, @supermemory logró un 99% en LongMemEval.
El problema es que los benchmarks de memoria se crearon cuando los LLMs tenían una ventana de contexto muy pequeña.
Por ejemplo, LongMemEval_M es de ~1.5M tokens.
Lo cual está casi dentro de la ventana de contexto de Opus 4.6.
Por lo que entiendo, el mejor benchmark actual es BEAM con una ventana de contexto de 10M. Así que estoy evaluando todos los nuevos sistemas de memoria en función de su puntuación allí.
¡Emocionado por ver cómo puntuará @supermemory! ¡Estoy seguro de que le irá bien!

Parte superior
Clasificación
Favoritos
