Poseidon heeft spraakdata en betrouwbare grondwaarheid nodig in laag-resource talen om tegen te benchmarken. Om de nauwkeurigheid van LLM-transcripties te waarborgen, hebben we samengewerkt met taalkundigen om de Bengali-uitvoer te controleren. Voor een taal die door 280 miljoen mensen wordt gesproken, wijzen de hiaten die we hebben gevonden op een dieper probleem: data ↓