DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Tämä kaavio näyttää hiljaisesti uuden pelikirjan tekoälykoodausyrityksille, eikä kukaan puhu siitä. Cognition ja Cursor alkoivat molemmat Clauden ja GPT:n kääreistä. Katso nyt tätä vertailuarvoa. Kognitio on SWE-1.6, 51.7 %. Cursorin Composer-1,5 50,8 %. Molemmat ovat lähellä Claude Opus 4.6:ta 53,6 % ja GPT-5.3-Codex 56,8 % arvolla. Kumpikaan yritys ei kouluttanut perustusmallia alusta alkaen. Molemmat ottivat käyttöön avoimen lähdekoodin perusmalleja ja sovelsivat vahvistusoppimista oikeissa koodausympäristöissä. Cognitionin Swyx sanoi suoraan Hacker Newsissa: "perusmallin ominaisuudet ovat yhä vähemmän tärkeitä, kunhan se on tarpeeksi hyvä, koska silloin RL ja jälkikoulutus ottavat vallan ja muodostavat koko erottelun pisteen." Se on väitöskirja. Perusmalli on hyödyke. RL-putkisto, joka on koulutettu juuri sinun agenttivaljakkojesi mukaan, työkalujen käyttömalleihin ja todellisten käyttäjäsessioiden mukaan, on puolustettavissa oleva kerros. Cognition koulutti SWE-1.6:n Cascade-valjaillaan kaksi kertaluokkaa enemmän RL-laskentaa kuin SWE-1.5. Cursor koulutti Composerin reaaliaikaisissa IDE-ympäristöissä tiedostojen muokkauksen, semanttisen haun ja terminaalikomentojen avulla. Molemmat suunnittelivat mallin ja tuotteen yhdessä. Hypyn matematiikka kertoo tarinan. SWE-1.5 sai 40,1 %. SWE-1.6 saa 51,7 %. Sama perusmalli. Sama 950 tok/s johtopäätös Cerebrasissa. Koko 11,6 pisteen parannus tuli paremmista RL-resepteistä ja paremmasta laskennasta. Se on nopeampi parannusvauhti kuin useimmat peruslaboratoriot saavat esikoulutusskaalauksesta. Tämä on kaksi $10B+ yritystä (Cognition $10,2B, Cursor $29,3B), jotka itsenäisesti päätyvät samaan johtopäätökseen: GPT-5:ttä ei tarvitse rakentaa kilpaillaksesi GPT-5:n kanssa koodauksessa. Tarvitset RL:n laajassa mittakaavassa riittävän hyvän pohjan lisäksi, joka on suunniteltu yhdessä agenttisi infrastruktuurin kanssa. Nopeuskerros on myös tärkeä. Kognitio kulkee 950 tok/s Cerebrasin läpi. Composerin nopeus on 250 tok/s. Agenttisissa työnkuluissa, joissa malli kiertää kymmeniä kertoja tehtävää kohden, tuo nelinkertainen nopeusero kasvaa merkityksellisiksi erilaisiksi käyttäjäkokemuksiksi. Kognitio tarkoittaa, että panostusnopeus plus tarkkuus voittaa pelkän tarkkuuden. Kysymys, joka huolestuttaa OpenAI:ta ja Anthropicia: jos kaksi startupia pääsee viiden pisteen päähän parhaista malleistasi avoimen lähdekoodin pohjalla, mitä tapahtuu, kun avoimen lähdekoodin pohjat paranevat? Jokainen parannus Llamaan tai Qweniin siirtyy suoraan Cognitioniin ja Cursorin tuotantoputkeen. Perustuslaboratoriot käytännössä tukevat omaa kilpailijaansa.

Johtavat

Rankkaus

Suosikit