DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

🤯ÚLTIMA HORA: A Alibaba acabou de provar que a programação de IA não está tomando seu emprego, é apenas escrever o código legado que vai te manter empregado corrigindo isso pela próxima década. 🤣 Passar em um teste de codificação uma vez é fácil. Manter esse código por 8 meses sem que ele exploda? Aparentemente, é quase impossível para a IA. O Alibaba testou 18 agentes de IA em 100 bases de código reais ao longo de ciclos de 233 dias. Eles não buscavam apenas "soluções rápidas" — buscavam sobrevivência a longo prazo. O resultado foi um banho de sangue: 75% dos modelos quebraram códigos que já funcionavam durante a manutenção. Apenas Claude Opus 4.5/4.6 mantiveram uma taxa de regressão zero de >50%. Todos os outros modelos acumularam dívidas técnicas que se acumularam até que a base de código colapsou. Estamos usando benchmarks "snapshot" como o HumanEval, que só perguntam "Funciona agora?" O novo benchmark SWE-CI pergunta: "Ainda funciona após 8 meses de evolução?" A maioria dos agentes de IA são "Artistas de Solução Rápida". Eles escrevem código frágil que passa nos testes hoje, mas amanhã vira um pesadelo de manutenção. Eles não estão construindo software; Eles estão construindo um castelo de cartas. A narrativa acabou de ficar honesta: a maioria dos modelos sabe escrever código. Quase ninguém consegue mantê-lo.

Melhores

Classificação

Favoritos