DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi | OKX Web3 Cüzdan

Trend Olan Konular

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN-%0,43

#

Boop.Fun leading the way with a new launchpad on Solana.

header

You Jiacheng

You Jiacheng

You Jiacheng11 Sa Önce

Bu eğilim mHC/AttnRes modellerinde de geçerli mi?

David

David12 Sa Önce

1/n Aynı cümleyi İngilizce ve Çince bir LLM'ye verdim, sonra içeride ne olduğunu izledim. Katman 10'a gelindiğinde, model artık hangi dili okuduğunu bilmiyor. Sadece... düşünüyordu. LLM beyinlerinin aslında içinde 🧵 nasıl göründüğüne dair yeni blog yazısı

You Jiacheng

You Jiacheng15 Sa Önce

Gizli düzenlemenin çok parlak bir yolu

Robots Digest 🤖

Robots Digest 🤖18 Sa Önce

Önceden eğitilmiş kodlayıcı yok, karmaşık numaralar yok. LeWorldModel, JEPA tabanlı Dünya Modellerinin ham piksellerden uçtan uca sadece 2 kayıp terimiyle nasıl eğitilebileceğini gösteriyor ~15M param, tek GPU ve ~48× temel model dünya modellerinden daha hızlı planlama.

26

You Jiacheng

You Jiacheng12 Mar 17:30

ilginç. Yanlış hatırlamıyorsam, mevcut tokenın KV'sini dikkat maskesi ile hariç tuttum (yani çaprazı kaldırın) çalışmıyor! Hipotez: Bu, mevcut tokenı etkili bir dikkat çekici haline getirir.

Shuangfei Zhai

Shuangfei Zhai12 Mar 16:44

LM için Transformers'a (neredeyse) ücretsiz bir geliştirme olan Exclusive Self Attention (XSA) ile selam deyin. Gözlem: y = attn(q, k, v) için, yi ve vi çok yüksek kosinüs benzerliğe sahiptir Düzeltme: vi ile yi ile zi = yi - (yiTvi)vi/‖vi‖² Sonuç: model boyutları arasında daha iyi eğitim/değer kaybı; Dizi uzunluğu arttıkça kazançlar artır. Daha fazlasını gör:

352

En İyiler

Sıralama

Takip Listesi

©2017 - 2026 WEB3.OKX.COM

Türkçe 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

OKX Web3 Hakkında Daha Fazla Bilgi

İndir Akademi Hakkımızda Kariyer Bize Ulaşın Hizmet şartları Gizlilik Bildirimi X (eski adıyla Twitter)

Ürün

Cüzdan Paneli Swap Pazar Yeri Birikim Geliştirici Merkezi Gezgin Güvenlik

Destek

Destek Merkezi Resmî Kanal Doğrulama Duyurular DEX ücret tablosu OKX Toplulukları Bitcoin Cüzdanı Ethereum cüzdanı Solana cüzdanı