Trillion Labs, корейский стартап в области ИИ, запустил Tri-21B-think Preview, небольшую модель рассуждений с открытыми весами, которая набрала 20 баллов в Индексе Искусственного Анализа Интеллекта Ключевые выводы бенчмаркинга: ➤ Высокий, но не ведущий уровень интеллекта для своего небольшого размера: Tri-21B-think Preview получает высокие оценки за свои относительно небольшие 21 миллиард параметров. Модель с 21B параметрами делает её относительно более доступной для самостоятельного хостинга по сравнению с ведущими моделями с открытым исходным кодом, такими как GLM-5 и Kimi K2.5 ➤ Низкий уровень галлюцинаций: Tri-21B-think Preview набирает -49 баллов в Индексе AA-Всеведения, собственном бенчмарке Искусственного Анализа, который измеряет надежность знаний и галлюцинации в различных отраслях. Этот хороший результат в первую очередь обусловлен относительно низким уровнем галлюцинаций (62%), что является самым низким показателем среди корейских моделей, которые мы тестировали. ➤ Сила в использовании агентных инструментов: Tri-21B-think Preview набирает 93% в τ²-Bench Telecom, демонстрируя сильные результаты в рабочих процессах с использованием агентных инструментов. Tri-21B-think Preview находится среди передовых моделей с открытыми весами в этой категории, показывая аналогичные результаты с DeepSeek V3.2 и MiniMax M2.5 в этой категории ➤ Высокое использование токенов: Tri-21B-think Preview демонстрирует очень высокое использование токенов по сравнению с другими моделями в том же уровне интеллекта, используя ~120M токенов рассуждений в рамках Искусственного Анализа Интеллекта. Это сопоставимо с K-EXAONE (100M токенов рассуждений), другой корейской моделью ➤ Нет публичных конечных точек: Tri-21B-think Preview является моделью с открытыми весами под лицензией Apache 2.0. В настоящее время единственный способ получить доступ к модели - это самостоятельный хостинг. Trillion Labs сообщила, что в ближайшем будущем ожидается предоставление специализированной конечной точки.
Tri-21B-think Preview набрал 93% на τ²-Bench Telecom, демонстрируя высокую производительность в рабочих процессах с использованием агентных инструментов.
Tri-21B-think Preview демонстрирует очень высокое использование токенов, используя ~120M токенов для рассуждений в рамках набора инструментов Искусственного Анализа Интеллекта.
8,99K