Qu'est-ce qui rend les discussions basées sur la parole avec des LLM moins capables ? Parler avec eux est incroyable, mais si vous voulez entrer dans les médias ou générer des médias, tout à coup, ils ne peuvent plus le faire. Est-ce un obstacle connu qui fait l'objet de recherches ? Ou bien y a-t-il simplement pas assez de demande pour cela ?