Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Simo Ryu
Mám rád kočky, matematiku a kódy
cloneofsimo@gmail.com
Komunita je z těchto výzev naprosto nadšená! Pokračujte ve skvělých dílech!!

Vuk Rosić22. 3. 02:22
Udělal jsem rychlých 71 experimentů pro 500 z 13 000 kroků pro výzvu OpenAI
1. Mix expertů je absolutní VÍTĚZ
(velmi překvapivé, protože by to nemělo být u malých LLM)
> Nejdůležitější je počet expertů. 4 (nejlepší) > 3 >> 2.
2. UNTIED Embeddings fungují, jsou nešťastné
3. Hloubková konvoluce – SLEPÁ ULIČKA
Postřehy:
1. 4-expertní MOE + netěsnící ReLU -> -0,048 BPB, jasný vítěz
2. Nevázané faktorované embeddingy (bn128) -> -0,031 BPB, které stojí za to kombinovat s MOE
3. Kombinace MOE + QAT -> zachovává kvantovanou kvalitu pro podání
Slepé uličky
1. Hloubková konvoluce – > každá varianta bolí, větší jádra bolí více
2. Vázané faktoringové vnoření – > katastrofální, zejména při malých úzkých místech
3. Sdílení váhy – > nekonkurenceschopné s MOE v kvalitě
4. Conv + cokoli komba — zhoršuje poškození
Další kroky
1. Validujte MOE 4e + leaky v počtu 2000-5000 kroků, více semen
2. Test MOE 4e + leaky + untied bn128 — dvě největší výhry se mohou nasčítat
3. Kompletní běh (13780 kroků) nejlepší kombinace, abyste zjistili, zda překoná žebříček 1,2244 BPB
71 experimentů, 3 GPU, každá ~500 kroků. Vuk Rosić
Trénink 500 kroků nám hlavně pomáhá eliminovat VELMI ŠPATNÉ poražené, vítězové musí být testováni na delší trénink.
Děkuji @novita_labs za výpočty!



188
Na související téma jsem extrémně optimistický ohledně toho, co LLM mělo a co umožní. Ale pokud je něco, co jsem pesimistický, tak je to učení. LLM nezlepší, jak rychle se něco naučíš. Protože se neučíte čtením nebo přednáškou: Učíte se POUZE tím, že to DĚLÁTE.
Nikdy neuslyšíte matematika nebo programátora, který by řekl, že se učil "čtením učebnic nebo dokumentů".

Simo Ryu22. 3. 02:00
Je velmi pravděpodobné, že LLM vyškolené v newtonovské fyzice nikdy nepřijdou s relativitou, která by vysvětlila gravitaci v kosmické škále. V takovém případě by musel zasáhnout Einstein a vyřešit to místo toho.
Ale vymyslel by to on, kdyby veškerou fyzikální řešení přenesl na LLM?
Myslím, že je to vážný problém. Nepochybně mnoho GOAT je GOAT jen proto, že veškerou intuici si vybudovali z řešení problémů sami. Grothendieck je známý tím, že v dospívání znovu vynalezl teorii míry od základů. Pokud lidé přenesou své reálné prostředí, které mohli použít, na LLM, nikdy nedostaneme dalšího Einsteina
104
Je velmi pravděpodobné, že LLM vyškolené v newtonovské fyzice nikdy nepřijdou s relativitou, která by vysvětlila gravitaci v kosmické škále. V takovém případě by musel zasáhnout Einstein a vyřešit to místo toho.
Ale vymyslel by to on, kdyby veškerou fyzikální řešení přenesl na LLM?
Myslím, že je to vážný problém. Nepochybně mnoho GOAT je GOAT jen proto, že veškerou intuici si vybudovali z řešení problémů sami. Grothendieck je známý tím, že v dospívání znovu vynalezl teorii míry od základů. Pokud lidé přenesou své reálné prostředí, které mohli použít, na LLM, nikdy nedostaneme dalšího Einsteina
247
Top
Hodnocení
Oblíbené