Gesprächs-Audio ist nicht nur mehr Sprachdaten. Es hat eine völlig andere Struktur: • Wechsel der Sprecher • Überlappende Sprecher • Stillepausen • Unterbrechungen • Variierende Geschwindigkeit Viele ASR-Bewertungspipelines wurden für sauberes Audio mit einem einzelnen Sprecher entwickelt.