Vi är fortfarande "tidigt" i mycket av den algoritmiska och arkitektoniska utvecklingen som finns i transformermodeller Ytterligare bra bevis på detta, ingen gratis lunch men definitivt många möjligheter där ute.