Trillion Labs, een Koreaanse AI-startup, heeft Tri-21B-think Preview gelanceerd, een klein open gewichten redeneer model dat 20 scoort op de Artificial Analysis Intelligence Index Belangrijke benchmark inzichten: ➤ Hoge maar niet leidende intelligentie voor zijn kleine formaat: Tri-21B-think Preview scoort hoog voor zijn relatief kleine grootte van 21 miljard parameters. Het model van slechts 21B maakt het relatief toegankelijker om zelf te hosten in vergelijking met leidende open source modellen zoals GLM-5 en Kimi K2.5. ➤ Lage hallucinatiegraad: Tri-21B-think Preview scoort -49 op de AA-Omniscience Index, een eigen Artificial Analysis benchmark die de betrouwbaarheid van kennis en hallucinaties in verschillende sectoren meet. Deze goede score wordt voornamelijk gedreven door een relatief lage hallucinatiegraad (62%), wat de laagste is onder de Zuid-Koreaanse modellen die we hebben beoordeeld. ➤ Sterkte in Agentic Tool Use: Tri-21B-think Preview scoort 93% op τ²-Bench Telecom, wat sterke prestaties aantoont op workflows voor agentic toolgebruik. Tri-21B-think Preview behoort tot de voorhoede van open gewichten modellen in deze categorie, met een vergelijkbare score als DeepSeek V3.2 en MiniMax M2.5 in deze categorie. ➤ Hoog Token Gebruik: Tri-21B-think Preview toont een zeer hoog token gebruik in vergelijking met andere modellen in dezelfde intelligentieklasse, met ~120M redeneertokens in de Artificial Analysis Intelligence suite. Dit is vergelijkbaar met K-EXAONE (100M redeneertokens), een ander Koreaans model. ➤ Geen Publieke Eindpunten: Tri-21B-think Preview is een open gewichten model onder de Apache 2.0-licentie. Momenteel is de enige manier om toegang te krijgen tot het model via zelfhosting. Trillion Labs heeft gedeeld dat een eerste partij, toegewijd eindpunt in de nabije toekomst wordt verwacht. Zie hieronder voor verdere analyse
Tri-21B-think Preview scoort 93% op τ²-Bench Telecom, wat sterke prestaties aantoont op agentische toolgebruik werkstromen.
Tri-21B-think Preview demonstreert een zeer hoog tokengebruik, met ongeveer 120M redeneertokens in de Artificial Analysis Intelligence-suite.
8,99K