Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trillion Labs, корейський стартап у сфері штучного інтелекту, запустив Tri-21B-think Preview — невелику модель мислення з відкритими вагами, яка отримує 20 балів у Індексі штучного аналізу інтелекту.
Основні висновки з бенчмаркінгу:
➤ Високий, але не провідний інтелект для свого малого розміру: Tri-21B-think Preview отримує високі оцінки завдяки відносно невеликому розміру параметрів у 21 мільярд. Наявність моделі 21B робить її відносно більш доступною для самостійного хосту порівняно з провідними відкритими моделями, такими як GLM-5 і Kimi K2.5
➤ Низький рівень галюцинацій: Tri-21B-think Preview оцінює -49 за AA-Omniscience Index, власним бенчмарком штучного аналізу, який вимірює надійність знань і галюцинації в різних галузях. Цей хороший результат зумовлений переважно низьким рівнем галюцинацій (62%), що є найнижчим серед південнокорейських моделей, які ми бенчмаркуємо.
➤ Сила при використанні агентних інструментів: Tri-21B-think Preview набрав 93% на τ²-Bench Telecom, демонструючи високу продуктивність у робочих процесах використання агентних інструментів. Tri-21B-think Preview серед відкритих моделей Frontier у цій категорії, набравши подібні оцінки до DeepSeek V3.2 та MiniMax M2.5 у цій категорії
➤ Високе використання токенів: Tri-21B-think Preview демонструє дуже високе використання токенів порівняно з іншими моделями того ж рівня інтелекту, використовуючи ~120M логічних токенів у всьому наборі Artificial Analysis Intelligence. Це можна порівняти з K-EXAONE (100M tokens reasoning tokens), ще однією корейською моделлю
➤ Без публічних кінцевих точок: Tri-21B-think Preview — це модель з відкритими вагами за ліцензією Apache 2.0. Наразі єдиний спосіб отримати доступ до моделі — це самохостинг. Trillion Labs повідомила, що найближчим часом очікується, що в найближчому майбутньому буде обслуговуватися перша стороння, спеціалізована кінцева точка.
Дивіться нижче для подальшого аналізу

Tri-21B-think Preview отримує 93% на τ²-Bench Telecom, демонструючи високу продуктивність у робочих процесах використання агентних інструментів.

Tri-21B-think Preview демонструє дуже високе використання токенів, використовуючи ~120M розсудливих токенів у наборі Artificial Analysis Intelligence.

9,01K
Найкращі
Рейтинг
Вибране
