Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Construyendo @EurekaLabsAI. Anteriormente Director de IA @ Tesla, equipo fundador @ OpenAI, CS231n/PhD @ Stanford. Me gusta entrenar grandes redes neuronales profundas.
Estoy muy interesado en cómo podría ser la próxima era del software altamente personalizado.
Ejemplo de esta mañana: últimamente me he vuelto un poco flojo con mi cardio, así que decidí hacer un experimento más srs y regimentado para intentar bajar mi frecuencia cardíaca en reposo de 50 a >45, durante un experimento de 8 semanas. La forma principal de hacerlo es aspirar a alcanzar una suma total de objetivos de minutos en la Zona 2 de cardio y 1 HIIT por semana.
Una hora después programé un panel súper personalizado para un experimento muy específico que me muestra cómo estoy registrando. Claude tuvo que hacer ingeniería inversa de la API en la nube de la cinta de correr de Woodway para extraer datos en bruto, procesarlos, filtrarlos, depurarlos y crear una interfaz web para rastrear el experimento. No fue una experiencia completamente fluida y tuve que notarlo y pedir que arreglaran errores, por ejemplo, estropeó las unidades métricas frente a las del sistema imperial y se estropeó en el calendario al emparejar días con fechas, etc.
Pero aún así siento que la dirección general es clara:
1) Nunca habrá (ni debería haber) una app específica en la tienda de aplicaciones para este tipo de cosas. No debería tener que buscar, descargar y usar algún tipo de "rastreador de experimentos cardiovasculares", cuando esto son ~300 líneas de código que un agente LLM te dará en segundos. La idea de una "tienda de aplicaciones" con un largo conjunto de apps discretas entre las que eliges resulta de algún modo errónea y anticuada cuando los agentes de LLM pueden improvisar la app en el momento y solo para ti.
2) Segundo, la industria tiene que reconfigurarse en un conjunto de servicios de sensores y actuadores con ergonomía nativa de agentes. Mi cinta de correr Woodway es un sensor: convierte el estado físico en conocimiento digital. No debería mantener un frontend legible por humanos y mi agente LLM no debería tener que hacer ingeniería inversa, debería ser una API/CLI fácilmente utilizable por mi agente. Estoy un poco decepcionado (y mis plazos son correspondientemente más lentos) con lo lento que está avanzando esta progresión en la industria en general. El 99% de los productos/servicios aún no tienen una CLI nativa de IA. El 99% de los productos/servicios mantienen documentación .html/.css como si no buscara inmediatamente cómo copiar y pegar todo a mi agente para que algo se consiga. Te dan una lista de instrucciones en una página web para abrir esta o aquella URL y hacer clic aquí o allá para hacer algo. En 2026. ¿Qué soy, un ordenador? Hazlo tú. O que lo haga mi agente.
En fin, hoy me impresiona que esta cosa aleatoria haya tardado 1 hora (hace 2 años habrían sido ~10 horas). Pero lo que más me emociona es pensar en cómo esto debería haber sido como mucho 1 minuto. ¿Qué tiene que estar preparado para que dure 1 minuto? Así que podía simplemente decir "Hola, ¿me ayudas a controlar mi cardio durante las próximas 8 semanas?", y tras una breve sesión de preguntas y respuestas la app se activaba. La IA ya tendría mucho contexto personal, recopilaría los datos extra necesarios, consultaría y buscaría bibliotecas de habilidades relacionadas, y mantendría todas mis pequeñas aplicaciones/automatizaciones.
Resumen: la "tienda de aplicaciones" de un conjunto de apps discretas entre las que eliges es un concepto cada vez más anticuado por sí solo. El futuro son servicios de sensores y actuadores nativos de IA orquestados mediante pegamento LLM en aplicaciones altamente personalizadas y efímeras. Simplemente aún no ha llegado.

99
Creo que debe de ser una época muy interesante para estar en lenguajes de programación y métodos formales porque los LLMs cambian por completo el panorama de restricciones del software. Ya se pueden ver indicios de esto, por ejemplo, en el impulso creciente detrás de portar C a Rust o el interés creciente en actualizar bases de código heredadas en COBOL, etc. En particular, los LLM son *especialmente* buenos en traducción comparados con la generación de nuevo porque 1) la base de código original actúa como una especie de indicación muy detallada, y 2) como referencia para escribir pruebas concretas respecto a ello. Dicho esto, ni siquiera Rust es lo ideal para los LLMs como idioma objetivo. ¿Qué tipo de lenguaje es óptimo? ¿Qué concesiones (si es que hay alguna) siguen siendo cedidas para los humanos? Preguntas y oportunidades increíblemente interesantes. Parece probable que acabemos reescribiendo grandes fracciones de todo el software jamás escrito muchas veces.
99
¡Enhorabuena por el lanzamiento @simile_ai! (y estoy emocionado de participar como un pequeño ángel.)
Compare está trabajando en una dimensión realmente interesante, en mi opinión poco explorada, de los LLMs. Normalmente, los LLMs con los que hablas tienen una personalidad única, específica y elaborada. Pero en principio, la forma nativa y primordial de un LLM preentrenado es que es un motor de simulación entrenado sobre el texto de una población altamente diversa en internet. ¿Por qué no aprovechar ese poder estadístico: ¿por qué simular a una "persona" cuando podrías intentar simular una población? ¿Cómo se construye un simulador así? ¿Cómo gestionas su entropía? ¿Qué tan fiel es? ¿Cómo puede ser útil? ¿Qué propiedades emergentes podrían surgir de símiles en bucles?
En mi opinión, son temas muy interesantes, prometedores y poco explorados, y el equipo aquí es genial. ¡Mucha suerte!

Joon Sung Park13 feb, 03:00
Presentamos Símile.
Simular el comportamiento humano es uno de los problemas más trascendentales y técnicamente difíciles de nuestro tiempo.
Recaudamos 100 millones de dólares de Index, Hanabi, A* BCV, @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky otros.
89
Populares
Ranking
Favoritas
