Wat is het met spraakgebaseerde chats met LLM's die hen minder capabel maken? Met hen praten is geweldig, maar als je media wilt invoeren of media wilt genereren, kunnen ze dat ineens niet. Is het een bekend obstakel dat in onderzoek is? Of is er niet genoeg vraag naar?