Ми об'єднуємося з @cerebras, щоб створити найшвидший можливий висновок. Незабаром на Amazon Bedrock ми забезпечуємо продуктивність виведення у рази швидше, ніж сьогодні, підключаючи AWS Trainium3 для обчислювального попереднього заповнення з Cerebras CS-3 для декодування живлення. Дізнайтеся більше про партнерство.