Loc3R-VLM Локализация на основе языка и 3D-рассуждения с использованием моделей «язык-изображение» статья: