Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🏎️ gemma-webgpu: um Gemma 1B sem dependência, extremamente rápido, rodando inteiramente no seu navegador. Vibração completa codificada do meu celular.
🔥 136,8 tok/s no Mac M4 (3,3x mais rápido que transformers.js)
📱 101 tok/s no iPhone 17 (270M), 34 tok/s (1B)
O que construímos do zero:
• 18 shaders de computação WGSL manuscritos com operações fundidas (fusedNormAdd salva 36 despachos de GPU por passada para frente)
• Q8_0 desquantização diretamente na GPU — qualidade superior ao Q4 E mais rápida
• O streaming de solicitação de alcance carrega pesos camada por camada (~44MB blocos), faz upload para a GPU, libera memória JS imediatamente. Pico de pilha: ~50MB mesmo para o modelo de 1GB
• Esse truque de streaming é o que faz o 1B rodar no iPhone. ela nunca guarda o modelo completo na RAM
12KB com zíper. Zero dependências. NPM install gemma-webgpu

Melhores
Classificação
Favoritos
