DApp Store | Web3 Hub for hendelser og spill

Populære emner

offentlig har ikke XAI sagt «vi trente en belønningsmodell som kartlegger tweet draft > forventede likes.» Men de har åpenbart rå ingredienser. X sier at offentlige innlegg, pluss metadata som engasjement/reposts, kan deles med xAI for opplæring/finjustering. det står også at dine interaksjoner, input, resultater og til og med eksplisitt tilbakemelding på Grok kan brukes til å forbedre modellene. i mellomtiden har Grok native tilgang til sanntids X-data, og xAI har allerede sagt at de bruker storskala RL for resonnement og verktøybruk. Så mitt gjetning er at det egentlig ikke er en søt liten tweet>likes-prediktor, men noe mer rotete og sannsynligvis mer kraftfullt, som skjer når du forhåndstrener på nettdiskursen, lærer av det som sprer seg, samler inn eksplisitt og implisitt tilbakemelding, og så lar produktmålinger lukke sirkelen. Ikke én eneste belønningsmodell. Mer som full-stack operant betinging.

Topp

Rangering

Favoritter