Поясейдон нуждается в голосовых данных и надежной истинной информации на языках с ограниченными ресурсами для сравнения. Чтобы обеспечить точность транскрипции LLM, мы работали с лингвистами для аудита выходных данных на бенгальском языке. Для языка, на котором говорят 280 миллионов человек, обнаруженные нами пробелы указывают на более глубокую проблему: данные ↓