Cercetări noi privind îmbunătățirea auto-reflecției în agenții de limbaj. O problemă de bază a auto-reflecției agentului este că modelele tind să genereze reflexii repetitive care adaugă zgomot în loc de semnal, afectând performanța generală a raționamentului. Introduce ParamMem, un modul de memorie parametrică care codifică tiparele de reflexie cross-sample direct în parametrii modelului, apoi folosește eșantionarea controlată de temperatură pentru a genera reflexii diverse la momentul inferenței. ParamMem arată îmbunătățiri constante față de liniile de bază SOTA în generarea de cod, raționamentul matematic și QA multi-hop. De asemenea, permite transferul de la slab la puternic și auto-îmbunătățirea fără a necesita un model extern mai puternic, ceea ce îl face un upgrade practic pentru pipeline-urile agențice. Hârtie: Învață să construiești agenți AI eficienți în academia noastră: