A OpenAI acaba de lançar o GPT-5.4 e temos testado-o no Cline toda a semana. Notámos um aumento no uso de computadores e no conhecimento geral, e os benchmarks confirmam: OSWorld (avaliação de uso de computador) passou de 47,3% → 75,0%, superando o desempenho humano de 72,4%! 🧵
O GPT-5.4 também tem uma janela de contexto de 1M, mas as suas avaliações mostram que a busca por agulhas em palheiros (MRCR v2) atinge 97% em 16-32K tokens, cai para 57% em 256-512K, e apenas 36% em 512K-1M. Portanto, é uma boa ideia compactar regularmente!
99