Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤯ÚLTIMA HORA: Alibaba acaba de demostrar que la codificación por IA no te quita el trabajo, solo escribe el código heredado que te mantendrá empleado arreglándolo durante la próxima década. 🤣
Aprobar un examen de programación una vez es fácil. ¿Mantener ese código durante 8 meses sin que explote? Aparentemente, es casi imposible para la IA.
Alibaba probó a 18 agentes de IA en 100 bases de código reales durante ciclos de 233 días. No solo buscaban "soluciones rápidas", buscaban la supervivencia a largo plazo.
El resultado fue una masacre:
El 75% de los modelos rompían código que funcionaba previamente durante el mantenimiento.
Solo Claude Opus 4.5/4.6 mantuvieron una tasa de regresión cero del >50%.
Todos los demás modelos acumularon deuda técnica que se acumuló hasta que la base de código colapsó.
Hemos estado usando benchmarks "snapshot" como HumanEval que solo preguntan "¿Funciona ahora mismo?"
El nuevo benchmark SWE-CI pregunta: "¿Sigue funcionando después de 8 meses de evolución?"
La mayoría de los agentes de IA son "Artistas de Soluciones Rápidas". Escriben código quebradizo que hoy pasa las pruebas pero que mañana se convierte en una pesadilla de mantenimiento. No están desarrollando software; Están construyendo un castillo de naipes.
La narrativa acaba de volverse honesta: la mayoría de los modelos pueden escribir código. Casi ninguno puede mantenerlo.

Populares
Ranking
Favoritas
