会話音声は単なる音声データだけではありません。構造はまったく異なります。 ・順番順番 ・スピーカーの重複 ・サイレンスギャップ ・中断 ・可変ペース配分 多くのASR評価パイプラインはクリーンなシングルスピーカー音声向けに設計されていました。