Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Gần đây @supermemory đã đạt 99% trong LongMemEval. Vấn đề là các bài kiểm tra bộ nhớ được tạo ra khi các LLM có cửa sổ ngữ cảnh rất nhỏ. Ví dụ, LongMemEval_M là ~1.5M token. Điều này gần như nằm trong cửa sổ ngữ cảnh Opus 4.6. Theo những gì tôi hiểu, bài kiểm tra tốt nhất hiện tại là BEAM với cửa sổ ngữ cảnh 10M. Vì vậy, tôi đang đánh giá tất cả các hệ thống bộ nhớ mới dựa trên điểm số của chúng ở đó. Rất hào hứng để xem @supermemory sẽ ghi điểm như thế nào! Tôi chắc chắn nó sẽ làm tốt!

Hàng đầu

Thứ hạng

Yêu thích