Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Construyendo @EurekaLabsAI. Anteriormente Director de IA @ Tesla, equipo fundador @ OpenAI, CS231n/PhD @ Stanford. Me gusta entrenar grandes redes neuronales profundas.
Estoy muy interesado en cómo podría ser la próxima era de software altamente personalizado.
Ejemplo de esta mañana: me he vuelto un poco descuidado con mi cardio recientemente, así que decidí hacer un experimento más serio y regimentado para intentar bajar mi Frecuencia Cardíaca en Reposo de 50 a 45, durante una duración de experimento de 8 semanas. La forma principal de hacerlo es aspirar a un cierto total de minutos en cardio de Zona 2 y 1 HIIT/semana.
Una hora después, codifiqué esta super personalizable interfaz para este experimento muy específico que me muestra cómo estoy avanzando. Claude tuvo que hacer ingeniería inversa de la API en la nube de la cinta de correr Woodway para extraer datos en bruto, procesarlos, filtrarlos, depurarlos y crear una interfaz web para rastrear el experimento. No fue una experiencia completamente fluida y tuve que notar y pedir que se corrigieran errores, por ejemplo, se confundió con las unidades del sistema métrico e imperial y se equivocó al emparejar días con fechas en el calendario, etc.
Pero aún siento que la dirección general es clara:
1) Nunca habrá (y no debería haber) una aplicación específica en la tienda de aplicaciones para este tipo de cosas. No debería tener que buscar, descargar y usar algún tipo de "rastreador de experimentos de cardio", cuando esto son ~300 líneas de código que un agente LLM te dará en segundos. La idea de una "tienda de aplicaciones" con un largo catálogo de aplicaciones discretas de las que elegir se siente de alguna manera incorrecta y anticuada cuando los agentes LLM pueden improvisar la aplicación en el momento y solo para ti.
2) En segundo lugar, la industria tiene que reconfigurarse en un conjunto de servicios de sensores y actuadores con ergonomía nativa de agentes. Mi cinta de correr Woodway es un sensor: convierte el estado físico en conocimiento digital. No debería mantener una interfaz legible por humanos y mi agente LLM no debería tener que hacer ingeniería inversa de ella, debería ser una API/CLI fácilmente utilizable por mi agente. Estoy un poco decepcionado (y mis plazos son correspondientemente más lentos) con la lentitud de esta progresión en la industria en general. El 99% de los productos/servicios aún no tienen una CLI nativa de IA. El 99% de los productos/servicios mantienen documentos .html/.css como si no fuera a buscar inmediatamente cómo copiar y pegar todo eso a mi agente para hacer algo. Te dan una lista de instrucciones en una página web para abrir esta o aquella URL y hacer clic aquí o allá para hacer algo. En 2026. ¿Qué soy, un ordenador? Tú lo haces. O que mi agente lo haga.
Así que, de todos modos, hoy estoy impresionado de que esta cosa aleatoria tomó 1 hora (habría sido ~10 horas hace 2 años). Pero lo que más me emociona es pensar en cómo esto realmente debería haber tomado un máximo de 1 minuto. ¿Qué tiene que estar en su lugar para que sea 1 minuto? Para que simplemente pudiera decir "Hola, ¿puedes ayudarme a rastrear mi cardio durante las próximas 8 semanas?", y después de una breve sesión de preguntas y respuestas, la aplicación estaría lista. La IA ya tendría mucho contexto personal, reuniría los datos adicionales necesarios, haría referencia y buscaría en bibliotecas de habilidades relacionadas, y mantendría todas mis pequeñas aplicaciones/automatizaciones.
En resumen, la "tienda de aplicaciones" de un conjunto de aplicaciones discretas de las que eliges es un concepto cada vez más anticuado por sí mismo. El futuro son servicios de sensores y actuadores nativos de IA orquestados a través de un pegamento LLM en aplicaciones altamente personalizadas y efímeras. Simplemente aún no está aquí.

127
Creo que debe ser un momento muy interesante para estar en lenguajes de programación y métodos formales porque los LLMs cambian completamente el panorama de las restricciones del software. Ya se pueden ver indicios de esto, por ejemplo, en el creciente impulso detrás de portar C a Rust o el creciente interés en actualizar bases de código heredadas en COBOL, etc. En particular, los LLMs son *especialmente* buenos en traducción en comparación con la generación de nuevo, porque 1) la base de código original actúa como una especie de aviso altamente detallado, y 2) como una referencia para escribir pruebas concretas al respecto. Dicho esto, incluso Rust está lejos de ser óptimo para los LLMs como lenguaje objetivo. ¿Qué tipo de lenguaje es óptimo? ¿Qué concesiones (si es que hay alguna) aún se reservan para los humanos? Nuevas preguntas y oportunidades increíblemente interesantes. Es probable que terminemos reescribiendo grandes fracciones de todo el software jamás escrito muchas veces.
123
¡Felicidades por el lanzamiento @simile_ai! (y estoy emocionado de estar involucrado como un pequeño ángel.)
Simile está trabajando en una dimensión realmente interesante, en mi opinión poco explorada, de los LLMs. Por lo general, los LLMs con los que hablas tienen una personalidad única, específica y elaborada. Pero en principio, la forma nativa y primordial de un LLM preentrenado es que es un motor de simulación entrenado sobre el texto de una población altamente diversa de personas en internet. ¿Por qué no aprovechar ese poder estadístico? ¿Por qué simular a una "persona" cuando podrías intentar simular a una población? ¿Cómo construyes tal simulador? ¿Cómo gestionas su entropía? ¿Qué tan fiel es? ¿Cómo puede ser útil? ¿Qué propiedades emergentes podrían surgir de los símiles en bucles?
En mi opinión, estos son temas muy interesantes, prometedores y poco explorados, y el equipo aquí es genial. ¡Todo lo mejor!

Joon Sung Park13 feb, 03:00
Presentamos Simile.
Simular el comportamiento humano es uno de los problemas más importantes y técnicamente difíciles de nuestro tiempo.
Recaudamos $100M de Index, Hanabi, A* BCV, @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky, entre otros.
115
Parte superior
Clasificación
Favoritos
