Taalas käyttää Llama 3 8B:tä 16 000 tokenia sekunnissa per käyttäjä. Se on lähes kertaluokan kasvu jopa verrattuna SRAM-pohjaisiin järjestelmiin kuten Cerebras. Keskeinen ajatus: jokainen siru on erikoistunut tiettyyn malliin. Siru on malli. Chat-demo on aika villi: