Mistral on julkaissut Mistral Small 4:n, avoimen painomallin, jossa on hybridipäättely ja kuvasyöte, ja se sai pisteet 27 Artificial Analysis Intelligence Indexissä @MistralAI:n Small 4 on 119B-yhdistelmä asiantuntijoita sisältävä malli, jossa on 6,5B aktiivista parametria per token, ja se tukee sekä päättely- että ei-päättelytiloja. Päättelytilassa Mistral Small 4 saa pisteet 27 Artificial Analysis Intelligence Indexissä, mikä on 12 pisteen parannus Small 3.2:een (15) verrattuna ja on nyt yksi Mistralin älykkäimmistä malleista, ohittaen Mistral Large 3:n (23) ja vastaten patentoitua Magistral Medium 1.2:ta (27). Kuitenkin se jää jälkeen avoimen painon vertaisvertaisista, joilla on samankaltaiset kokonaisparametrimäärät, kuten gpt-oss-120B (korkea, 33), NVIDIA Nemotron 3 Super 120B A12B (Päättely, 36) ja Qwen3.5 122B A10B (Päättely, 42). Tärkeimmät huomiot: ➤ Päättely- ja ei-päättelytilat yhdessä mallissa: Mistral Small 4 tukee konfiguroitavaa hybridipäättelyä päättely- ja ei-päättelytilojen kanssa, toisin kuin Mistralin aiemmin julkaisemat erilliset päättelyvariaatiot Magistral-malleillaan. Päättelytilassa malli saa pisteet 27 Artificial Analysis Intelligence Indexissä. Ei-päättelytilassa malli saa 19 pistettä, mikä on neljän pisteen parannus edeltäjäänsä Mistral Small 3.2:een (15) verrattuna ➤ Tokenin tehokkaampi kuin samankokoiset vertaiset: ~52M output tokenilla Mistral Small 4 (Päättely) käyttää vähemmän tokeneita Artificial Analysis Intelligence Indexin ajamiseen verrattuna päättelymalleihin kuten gpt-oss-120B (korkea, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Päättely, ~110M) ja Qwen3.5 122B A10B (Päättely, ~91M). Ei-päättelytilassa malli käyttää ~4M lähtötokeneita ➤ Natiivituki kuvan syötteelle: Mistral Small 4 on multimodaalinen malli, joka hyväksyy sekä kuvan syötteen että tekstin. Monimodaalisessa arvioinnissamme MMMU-Pro, Mistral Small 4 (Päättely) saa 57 %, edellä Mistral Large 3:sta (56 %) mutta Qwen3.5 122B A10B:stä (Päättely, 75 %). Kumpikaan gpt-oss-120B tai NVIDIA Nemotron 3 Super 120B A12B ei tue kuvan syöttöä. Kaikki mallit tukevat vain tekstin lähtöä ➤ Parannus todellisissa agenttitehtävissä: Mistral Small 4 saa ELO-pisteeksi 871 GDPval-AA:ssa, joka perustuu OpenAI:n GDPval-aineistoon, testataan malleja todellisista tehtävistä 44 ammatissa ja 9 suuressa toimialalla, ja mallit tuottavat toimituksia kuten asiakirjoja, taulukoita ja kaavioita agenttisessa silmukassa. Tämä on yli kaksinkertainen Small 3.2:n (339) Eloon verrattuna ja lähellä Mistral Large 3:een (880), mutta gpt-oss-120B:n (korkein, 962), NVIDIA Nemotron 3 Super 120B A12B:n (Reasoning, 1021) ja Qwen3.5 122B A10B:n (Reasoning, 1130) jälkeen ➤ Alhaisempi hallusinaatioprosentti verrattuna samankokoisiin vertaismalleihin: Mistral Small 4 pisteet -30 AA-Omnisciencessa, tiedon luotettavuuden ja hallusinaatioiden arvioinnissa, jossa pisteet vaihtelevat -100–100 (korkeampi on parempi) ja negatiivinen pistemäärä tarkoittaa enemmän virheellisiä kuin oikeita vastauksia. Mistral Small 4 sijoittuu gpt-oss-120B:n (korkein, -50), Qwen3.5 122B A10B:n (Päättely, -40) ja NVIDIA Nemotron 3 Super 120B A12B:n (Päättely, -42) edelle Keskeiset mallitiedot: ➤ Kontekstiikkuna: 256 000 tokenia (nousua 128 000:sta Small 3.2:ssa) ➤ Hinnoittelu: 0,15 dollaria/0,6 dollaria per 1 miljoona syöttö-/ulostulotokenia ➤ Saatavuus: Vain Mistralin ensimmäisen osapuolen API. Natiivilla FP8-tarkkuudella Mistral Small 4:n 119B-parametrit vaativat ~119GB painojen itse-isännöintiin (yli 80GB HBM3-muistia yhdellä NVIDIA H100:lla) ➤ Modaliteetti: Kuvan ja tekstin syöttö pelkästään tekstilähtöllä ➤ Lisensointi: Apache 2.0 -lisenssi
Älykkyyden ja kokonaisparametrien osalta Mistral Small 4 (Päättely, 27) tarjoaa vähemmän suotuisan kompromissin kuin samankokoiset vertaiset kuten gpt-oss-120B (korkea, 33), NVIDIA Nemotron 3 Super 120B A12B (Päättely, 36) ja Qwen3.5 122B A10B (Päättely, 42)
~52M ulostulotokenilla Mistral Small 4 (Päättely) käyttää vähemmän tokeneita Artificial Analysis Intelligence Indexin ajamiseen verrattuna vertaismalleihin kuten gpt-oss-120B (korkea, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Päättely, ~110M) ja Qwen3.5 122B A10B (Päättely, ~91M)
Tulosten täydellinen erittely:
Täydelliset tulokset ovat saatavilla Mistral Small 4 -mallin sivulta Artificial Analysis:
9,53K