Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trillion Labs, startup AI Korea, telah meluncurkan Tri-21B-think Preview, model penalaran bobot terbuka kecil yang mendapat skor 20 pada Indeks Kecerdasan Analisis Buatan
Poin utama pembandingan:
➤ Kecerdasan tinggi tetapi tidak terkemuka untuk ukurannya yang kecil: Tri-21B-think Preview mendapat skor tinggi untuk ukuran parameter 21 miliar yang relatif kecil. Model ini hanya 21B membuatnya relatif lebih mudah diakses oleh self-host dibandingkan dengan model open source terkemuka seperti GLM-5 dan Kimi K2.5
➤ Tingkat halusinasi rendah: Skor Pratinjau Tri-21B-think -49 pada Indeks AA-Omniscience, Tolok ukur Analisis Buatan eksklusif yang mengukur keandalan pengetahuan dan halusinasi di seluruh industri. Skor bagus ini terutama didorong oleh tingkat halusinasi yang relatif rendah (62%), yang merupakan yang terendah di antara model Korea Selatan yang kami tolok ukur.
➤ Kekuatan dalam Penggunaan Alat Agen: Tri-21B-think Preview mendapat skor 93% pada τ²-Bench Telecom, menunjukkan kinerja yang kuat pada alur kerja penggunaan alat agen. Pratinjau Tri-21B-think di antara model bobot terbuka perbatasan dalam kategori ini, dengan skor yang mirip dengan DeepSeek V3.2 dan MiniMax M2.5 dalam kategori ini
➤ Penggunaan Token Tinggi: Pratinjau Tri-21B-think menunjukkan penggunaan token yang sangat tinggi dibandingkan dengan model lain di tingkat kecerdasan yang sama, menggunakan ~120 juta token penalaran di seluruh rangkaian Kecerdasan Analisis Buatan. Ini sebanding dengan K-EXAONE (100 juta token penalaran), model Korea lainnya
➤ Tidak Ada Titik Akhir Publik: Pratinjau Tri-21B-think adalah model bobot terbuka di bawah lisensi Apache 2.0. Saat ini, satu-satunya cara untuk mengakses model adalah melalui hosting mandiri. Trillion Labs telah berbagi bahwa pihak pertama dan titik akhir khusus diharapkan akan dilayani dalam waktu dekat.
Lihat di bawah untuk analisis lebih lanjut

Tri-21B-think Preview mendapat skor 93% pada τ²-Bench Telecom, menunjukkan kinerja yang kuat pada alur kerja penggunaan alat agen.

Pratinjau Tri-21B-think menunjukkan penggunaan token yang sangat tinggi, menggunakan ~120 juta token penalaran di seluruh rangkaian Kecerdasan Analisis Buatan.

8,99K
Teratas
Peringkat
Favorit
