Recentemente @supermemory ha raggiunto il 99% su LongMemEval. Il problema è che i benchmark di memoria sono stati creati quando gli LLM avevano una finestra di contesto molto piccola. Ad esempio, LongMemEval_M è di ~1,5M token. Che è quasi all'interno della finestra di contesto di Opus 4.6. Da quello che ho capito, l'attuale miglior benchmark è BEAM con una finestra di contesto di 10M. Quindi sto valutando tutti i nuovi sistemi di memoria in base al loro punteggio lì. Sono entusiasta di vedere come si comporterà @supermemory! Sono sicuro che andrà bene!