Nieuw onderzoek met @Tsinghua_Uni: Spatial-TTT. Een framework voor streaming visueel-gebaseerde ruimtelijke intelligentie met test-tijd training (TTT). Spatial-TTT past snelle gewichten aan om ruimtelijke bewijs uit lange videostreams vast te leggen en te organiseren, waardoor modellen in staat zijn om gestructureerd 3D-ruimtelijk geheugen in de loop van de tijd op te bouwen. Hoogtepunten: 🔹Efficiënt streaming geheugen. Snelle gewichten fungeren als compact ruimtelijk geheugen met sublineaire geheugen groei over 7000+ frames en meer dan 40% lagere rekentijd. 🔹Ruimtelijk-voorspellend mechanisme. TTT-lagen met 3D spatiotemporele convolutie vangen geometrische overeenkomsten en temporele continuïteit. 🔹SOTA-resultaten op lange termijn video ruimtelijk begrip (VSI-Bench). Het paper stond op #1 op @huggingface Daily Papers op 13 maart. Projectpagina: GitHub: Paper: Model & Data: