julkisesti xAI ei ole sanonut "koulutimme palkitsemismallin, joka kartoittaa twiittiluonnokset > odotetut tykkäykset." Mutta heillä on hyvin selvästi raaka-aineet. X sanoo, että julkiset julkaisut sekä metatiedot kuten sitoutuminen/uudelleenjulkaisut voidaan jakaa xAI:lle koulutusta ja hienosäätöä varten. Se myös sanoo, että vuorovaikutuksesi, syötteesi, tuloksesi ja jopa eksplisiittinen palaute Grokista voidaan käyttää mallien parantamiseen. sillä välin Grokilla on natiivi pääsy reaaliaikaiseen X-dataan, ja xAI on jo kertonut käyttävänsä laajamittaista RL:ää päättelyyn/työkalujen käyttöön. Joten arvaukseni on, ettei kyse ole yhdestä söpöstä twiitti>tykkäysten ennustajasta, vaan jostain sotkuisemmasta ja todennäköisesti voimakkaammasta asiasta, joka tapahtuu, kun koulutat verkkokeskustelua, opit leviämisestä, keräät eksplisiittistä ja implisiittistä palautetta ja annat tuotemittareiden sulkea kierteen. Ei yhtään palkitsemismallia. enemmänkin full-stack operanttiehdollista.