Lo sorprendente de la experiencia de usuario de la IA es que la mejor experiencia de usuario no es la más rápida. Es la que te hace creer que ha ocurrido trabajo real. Un estudio reciente lo comprobó. Respondieron igual a los 2, 9 y 20 segundos. El modelo y la respuesta eran los mismos. Los usuarios calificaron la respuesta instantánea como menos reflexiva, menos útil y menos creíble. La respuesta fue idéntica. Pero no se sentía merecido. Nosotros también hacemos esto con personas. Un médico que se detiene antes de responder se considera más competente. El esfuerzo señala calidad. La industria gastó miles de millones persiguiendo la latencia cero. Chips más rápidos, inferencias más rápidas, todo más rápido. La velocidad como métrica clave para competir resulta intuitiva. Mientras tanto, una respuesta más lenta se considera de mayor calidad y más fiable. Los modelos que muestran razonamiento no solo funcionan mejor, sino que hacen que los usuarios sientan que algo deliberado ocurrió. Resulta que el esfuerzo percibido supera la velocidad real para el usuario final