Žádný předtrénovaný enkodér, žádné složité triky. LeWorldModel ukazuje, jak lze modely světa založené na JEPA trénovat end-to-end ze surových pixelů s pouhými 2 ztrátovými členy ~15 M parametrů, jeden GPU a ~48× rychlejší plánování než modely světa založené na základním modelu.