Trillion Labs, una startup coreana di AI, ha lanciato Tri-21B-think Preview, un piccolo modello di ragionamento con pesi aperti che ottiene 20 nell'Artificial Analysis Intelligence Index Punti chiave del benchmarking: ➤ Intelligenza alta ma non leader per le sue piccole dimensioni: Tri-21B-think Preview ottiene punteggi elevati per la sua relativamente piccola dimensione di 21 miliardi di parametri. Il modello, essendo solo 21B, è relativamente più accessibile per l'auto-ospitazione rispetto ai modelli open source leader come GLM-5 e Kimi K2.5 ➤ Basso tasso di allucinazione: Tri-21B-think Preview ottiene -49 nell'AA-Omniscience Index, un benchmark proprietario di Artificial Analysis che misura l'affidabilità della conoscenza e le allucinazioni in vari settori. Questo buon punteggio è principalmente guidato da un tasso di allucinazione relativamente basso (62%), che è il più basso tra i modelli coreani che abbiamo benchmarkato. ➤ Forza nell'uso di strumenti agentici: Tri-21B-think Preview ottiene il 93% su τ²-Bench Telecom, dimostrando forti prestazioni nei flussi di lavoro di utilizzo di strumenti agentici. Tri-21B-think Preview è tra i modelli a pesi aperti di frontiera in questa categoria, ottenendo punteggi simili a DeepSeek V3.2 e MiniMax M2.5 in questa categoria ➤ Alto utilizzo di token: Tri-21B-think Preview dimostra un utilizzo di token molto elevato rispetto ad altri modelli nella stessa fascia di intelligenza, utilizzando ~120M token di ragionamento attraverso la suite di Artificial Analysis Intelligence. Questo è comparabile a K-EXAONE (100M token di ragionamento), un altro modello coreano ➤ Nessun endpoint pubblico: Tri-21B-think Preview è un modello a pesi aperti sotto licenza Apache 2.0. Attualmente, l'unico modo per accedere al modello è attraverso l'auto-ospitazione. Trillion Labs ha condiviso che un endpoint dedicato di prima parte è previsto per essere servito nel prossimo futuro. Vedi di seguito per ulteriori analisi
Tri-21B-think Preview ottiene il punteggio del 93% su τ²-Bench Telecom, dimostrando una forte performance nei flussi di lavoro di utilizzo degli strumenti agentici.
La preview di Tri-21B-think dimostra un utilizzo molto elevato dei token, utilizzando circa 120 milioni di token di ragionamento all'interno della suite di Intelligenza Artificiale per l'Analisi Artificiale.
9,05K