Rozmowy audio to nie tylko więcej danych głosowych. Mają one zupełnie inną strukturę: • Przejmowanie mowy • Nakładający się mówcy • Przerwy w milczeniu • Przerwania • Zmienna prędkość mówienia Wiele pipeline'ów oceny ASR zostało zaprojektowanych dla czystego audio z jednym mówcą.