🚨 UUTINEN: Meta-tutkijat näyttivät mallin, joka oli 2 miljoonaa tuntia videota. Ei nimikkeitä. Ei fysiikan oppikirjaa. Ei lainkaan valvontaa. Sitten näytettiin pätkä, jossa esine katoaa seinän taakse eikä koskaan palaa. Malli merkitsi sen vääräksi. 🤯 Se oli oppinut esineen pysyvyyttä. Muodon johdonmukaisuus. Törmäysdynamiikka. Täysin katsomisesta. Mikä on vielä yllättävämpää: jopa malli, joka on koulutettu vain viikon ainutlaatuisella videolla, saavutti sattumanvaraisen suorituskyvyn fysiikan rikkomusten havaitsemisessa. Se ei ole sattumaa. Se on periaate. Artikkelin keskeinen oivallus: tämä toimii vain, kun malli ennustaa opitussa esitystilassa, ei raakapikseleissä. Mallin täytyy rakentaa sisäinen maailmamalli, tiivistetty ja abstrakti, ja ennustaa sitä vastaan. Pikselitilan ennustaminen epäonnistuu. Multimodaaliset LLM:t, jotka järkeilevät tekstin kautta, epäonnistuvat. Vain arkkitehtuuri, joka rakentaa abstrakteja esityksiä ennustaen puuttuvia aistisyötteitä, jotain lähellä sitä, miten neurotieteilijät kuvaavat ennustavaa koodausta, saa fysiikan intuition. Mikä tarkoittaa, että ydintieto, jonka tutkijat olettivat olevan kovakoodattuja, saattaa olla vain havainnointia laajassa mittakaavassa. Vauvat oppivat esineiden pysyvyyttä katsomalla asioita. Sama periaate pätee tässäkin. Nyt tulee se osa, josta kukaan ei puhu. Jos pelkkä havainnointi opettaa mallille fyysisen maailman säännöt, mitä tapahtuu, kun samaa periaatetta sovelletaan tuotantojärjestelmiin? Tuotannossa on myös fysiikkaa. Ei painovoimaa. Mutta säännöt ovat yhtä johdonmukaiset: mitkä käyttöönotot aiheuttavat häiriöitä klo 3 aamulla, mitkä konfiguraatioyhdistelmät ovat vaarallisesti vuorovaikutuksessa, mitkä koodipolut heikkenevät hiljaisesti kuormituksen alla, mitkä palvelumuutokset aiheuttavat vikoja kahden hypyn päässä. Nämä kuviot ovat juurtuneet tuhansiin kehityskulkuihin. Koodin työntö, metriset siirrot, asiakastiket, tapahtumaaikataulut. Suurimmaksi osaksi huomaamatta. Ehdottomasti ilman merkintöjä. Kukaan ei kirjoita juoksukirjaa, jossa sanotaan "jos palvelu A otetaan käyttöön lippu X aktiivisena ja palvelu B on yli 70 % suorittimesta, viive palvelussa C heikkenee 40 % kuudessa minuutissa." Mutta tämä kaava on olemassa. Se on toistettavissa. Ja se on nyt havaittavuusdatassasi, näkymättömänä, koska kukaan ei ole rakentanut mallia sen löytämiseksi. Se on se kuilu, jota @playerzeroai yrittää kuroa umpeen. Ei taas yksi testijuoksija. Ei vielä yksi hälytyskynnys. Tuotantomaailman malli, joka oppii, mitkä asiat rikkoutuvat kertyneestä havainnoinnista, samalla tavalla kuin Metan malli oppi painovoiman. Se ei tarkista testien kattavuutta. Se ennustaa epäonnistumiskulut. Viikko videota riitti oppimaan, että kiinteät esineet eivät kulje seinien läpi. Kysymys on, kuinka paljon tuotantohavaintoa järjestelmäsi tarvitsee ennen kuin malli alkaa ennustaa, missä sinun järjestelmäsi seuraavaksi rikkoutuu. ...