Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gần đây @supermemory đã đạt 99% trong LongMemEval.
Vấn đề là các bài kiểm tra bộ nhớ được tạo ra khi các LLM có cửa sổ ngữ cảnh rất nhỏ.
Ví dụ, LongMemEval_M là ~1.5M token.
Điều này gần như nằm trong cửa sổ ngữ cảnh Opus 4.6.
Theo những gì tôi hiểu, bài kiểm tra tốt nhất hiện tại là BEAM với cửa sổ ngữ cảnh 10M. Vì vậy, tôi đang đánh giá tất cả các hệ thống bộ nhớ mới dựa trên điểm số của chúng ở đó.
Rất hào hứng để xem @supermemory sẽ ghi điểm như thế nào! Tôi chắc chắn nó sẽ làm tốt!

Hàng đầu
Thứ hạng
Yêu thích
