Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A Taalas executa o Llama 3 8B a 16k tokens por segundo por utilizador. Isso é quase um aumento de uma ordem de magnitude mesmo em comparação com sistemas baseados em SRAM como o Cerebras.
Ideia principal: cada chip é especializado para um determinado modelo. O chip é o modelo.
A demonstração de chat é bastante impressionante:
Top
Classificação
Favoritos
