O que é surpreendente sobre a experiência do utilizador (UX) da IA é que a melhor UX não é a mais rápida. É aquela que faz você acreditar que um trabalho real foi realizado. Um estudo recente testou isso. Eles deram a mesma resposta em 2,9 e 20 segundos. O modelo e a resposta eram os mesmos. Os utilizadores classificaram a resposta instantânea como menos reflexiva, menos útil, menos credível. A resposta era idêntica. Mas não parecia merecida. Fazemos isso com as pessoas também. Um médico que faz uma pausa antes de responder é considerado mais competente. O esforço sinaliza qualidade. A indústria gastou bilhões em busca de latência zero. Chips mais rápidos, inferência mais rápida, tudo mais rápido. A velocidade como uma métrica central para competir parece intuitiva. Enquanto isso, uma resposta mais lenta é considerada de maior qualidade e mais confiável. Modelos que mostram raciocínio não apenas funcionam melhor, mas fazem os utilizadores sentirem que algo deliberado aconteceu. Acontece que o esforço percebido supera a velocidade real para o utilizador final.