Loc3R-VLM Localizzazione basata sulla lingua e ragionamento 3D con modelli Vision-Language articolo: