MetalRT acaba de convertirse en el primer motor completo de inferencia de IA para Apple Silicon: LLM + STT + TTS por @RunAnywhereAI. Ya teníamos la decodificación de LLM más rápida (658 tok/s). Ahora también hemos arrasado con STT y TTS, superando a MLX en todos los aspectos. Cifras de hoy sobre el M4 Max: - Pódcast de 1 hora transcrito en ~5 segundos - Reunión de 3 horas transcrita en ~15 segundos - Subtitulado en directo con retardo perceptible cero - 714 veces más rápido que en tiempo real para STT - 4,6 veces más rápido que MLX de Apple en reconocimiento de voz Las tres modalidades son las tres opciones. Un motor unificado. Y esto es solo los componentes individuales. La pipeline completa de IA de voz sobre la que estamos construyendo será la MÁS RÁPIDA jamás vista en Apple Silicon. Lanzamiento pronto. Referencias completas, gráficos y detalles en los comentarios. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI