O que surpreende sobre a UX de IA é que a melhor UX não é a mais rápida. É aquela que faz você acreditar que um trabalho real aconteceu. Um estudo recente testou isso. Eles responderam a mesma aos 2, 9 e 20 segundos. O modelo e a resposta eram os mesmos. Os usuários avaliaram a resposta instantânea como menos reflexiva, menos útil e menos confiável. A resposta foi idêntica. Mas não parecia merecido. Fazemos isso com pessoas também. Um médico que pausa antes de responder é considerado mais competente. Esforço sinaliza qualidade. A indústria gastou bilhões buscando latência zero. Chips mais rápidos, inferências mais rápidas, tudo mais rápido. Velocidade como métrica central para competir parece intuitiva. Enquanto isso, uma resposta mais lenta é considerada de melhor qualidade e mais confiável. Modelos que mostram raciocínio não apenas funcionam melhor, mas fazem os usuários sentirem que algo deliberado aconteceu. Acontece que o esforço percebido supera a velocidade real para o usuário final