Titulky v reálném čase ve vašem prohlížeči s modelem LFM2-VL od @LiquidAI na WebGPU. Posílat každý snímek na server nikdy nemělo být řešením. Představte si šířku pásma, latenci a náklady. Lokální inference. Žádné náklady na server. Nekonečně škálovatelné. Takhle se to dělá.