أحدث طراز في سلسلة مامبا وصل أخيرا 🐍 أصبحت النماذج الهجينة أكثر شعبية، مما يبرز أهمية تصميم الجيل القادم من النماذج الخطية. قدمنا عدة أفكار تركز على SSM لزيادة قدرات النمذجة في مامبا-2 بشكل كبير دون التضحية بالسرعة. نموذج مامبا-3 الناتج حقق تحسنا ملحوظا في الأداء مقارنة بأكثر النماذج الخطية السابقة شعبية (مثل مامبا-2 وGated DeltaNet) على جميع الأحجام. هذه هي أول مامبا يقودها الطالب: كل الفضل يعود @aakash_lahoti @kevinyli_ @_berlinchen @caitWW9، وبالطبع @tri_dao!