Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Здание @EurekaLabsAI. Ранее директор по искусственному интеллекту @ Tesla, команда основателей @ OpenAI, CS231n/PhD @ Stanford. Мне нравится обучать большие глубокие нейронные сети.
Мне очень интересно, как будет выглядеть грядущая эпоха высоко индивидуализированного программного обеспечения.
Пример из этого утра - я немного расслабился с кардио в последнее время, поэтому решил провести более серьезный, регламентированный эксперимент, чтобы попытаться снизить свой пульс в состоянии покоя с 50 до 45 за 8 недель. Основной способ сделать это - стремиться к определенной сумме минут в кардио зоны 2 и 1 HIIT в неделю.
Через час я создал этот супер индивидуализированный дашборд для этого очень специфического эксперимента, который показывает, как я продвигаюсь. Claude пришлось обратным образом разработать API облачного тренажера Woodway, чтобы получить сырые данные, обработать, отфильтровать, отладить их и создать веб-интерфейс для отслеживания эксперимента. Это не был полностью гладкий опыт, и мне пришлось заметить и попросить исправить ошибки, например, он перепутал метрическую и имперскую системы единиц и неправильно сопоставил дни с датами в календаре и т.д.
Но я все равно чувствую, что общий вектор ясен:
1) Никогда не будет (и не должно быть) конкретного приложения в магазине приложений для такого рода вещей. Мне не нужно искать, загружать и использовать какой-то "трэкер кардио экспериментов", когда это ~300 строк кода, которые LLM агент даст вам за секунды. Идея "магазина приложений" с длинным хвостом отдельных приложений, из которых вы выбираете, кажется чем-то неправильным и устаревшим, когда LLM агенты могут импровизировать приложение на месте и только для вас.
2) Во-вторых, индустрия должна реорганизоваться в набор услуг сенсоров и актуаторов с эргономикой, родной для агентов. Мой тренажер Woodway - это сенсор - он превращает физическое состояние в цифровые знания. Он не должен поддерживать какой-то читаемый человеком интерфейс, и моему LLM агенту не нужно его обратным образом разрабатывать, это должен быть API/CLI, который легко использовать моему агенту. Я немного разочарован (и мои сроки соответственно замедляются) тем, как медленно происходит этот прогресс в индустрии в целом. 99% продуктов/услуг все еще не имеют AI-родного CLI. 99% продуктов/услуг поддерживают .html/.css документы, как будто я не буду сразу искать, как скопировать и вставить все это в моего агента, чтобы что-то сделать. Они дают вам список инструкций на веб-странице, чтобы открыть этот или тот URL и кликнуть здесь или там, чтобы сделать что-то. В 2026 году. Что я, компьютер? Сделай это. Или пусть мой агент сделает это.
Так что, в любом случае, сегодня я впечатлен, что это случайное дело заняло 1 час (это заняло бы ~10 часов 2 года назад). Но что меня больше всего волнует, так это мысль о том, как это действительно должно было занять максимум 1 минуту. Что должно быть на месте, чтобы это заняло 1 минуту? Чтобы я мог просто сказать: "Привет, можешь помочь мне отслеживать мое кардио в течение следующих 8 недель", и после очень краткого вопроса и ответа приложение было бы готово. AI уже имел бы много личного контекста, он собрал бы дополнительные необходимые данные, он ссылался бы и искал связанные библиотеки навыков и поддерживал бы все мои маленькие приложения/автоматизации.
Кратко говоря, "магазин приложений" с набором отдельных приложений, из которых вы выбираете, - это все более устаревшая концепция сама по себе. Будущее - это услуги AI-родных сенсоров и актуаторов, организованных через LLM в высоко индивидуализированные, эфемерные приложения. Это просто еще не здесь.

111
Я думаю, что сейчас очень интересное время для языков программирования и формальных методов, потому что LLM полностью меняют весь ландшафт ограничений программного обеспечения. Намёки на это уже можно увидеть, например, в растущем интересе к портированию C на Rust или к обновлению устаревших кодовых баз на COBOL и т.д. В частности, LLM *особенно* хороши в переводе по сравнению с генерацией с нуля, потому что 1) исходная кодовая база служит своего рода высокодетализированным запросом, и 2) является ссылкой для написания конкретных тестов. Тем не менее, даже Rust далеко не оптимален для LLM как целевой язык. Какой язык является оптимальным? Какие уступки (если таковые имеются) всё ещё сделаны для людей? Невероятно интересные новые вопросы и возможности. Кажется вероятным, что мы в конечном итоге перепишем большие доли всего когда-либо написанного программного обеспечения много раз.
109
Поздравляю с запуском @simile_ai! (и я рад быть вовлеченным в качестве небольшого ангела.)
Simile работает над действительно интересным, на мой взгляд, недостаточно исследованным аспектом LLM. Обычно LLM, с которыми вы общаетесь, имеют одну, конкретную, тщательно продуманную личность. Но в принципе, родная, первозданная форма предобученной LLM заключается в том, что это движок симуляции, обученный на текстах очень разнообразного населения людей в интернете. Почему бы не использовать эту статистическую мощь: зачем симулировать одного "человека", когда вы можете попытаться смоделировать население? Как построить такую симуляцию? Как управлять ее энтропией? Насколько она верна? Как она может быть полезной? Какие новые свойства могут возникнуть у симуляций в циклах?
На мой взгляд, это очень интересные, многообещающие и недостаточно исследованные темы, и команда здесь отличная. Всего наилучшего!

Joon Sung Park13 февр., 03:00
Представляем Simile.
Симуляция человеческого поведения является одной из самых значительных и технически сложных задач нашего времени.
Мы собрали 100 миллионов долларов от Index, Hanabi, A* BCV, @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky и других.
100
Топ
Рейтинг
Избранное
