Giới thiệu RadixMLP: loại bỏ trùng lặp tiền tố trong cùng một lô để tăng tốc độ prefill từ 1.4–5x. Các token có tiền tố giống nhau (như các prompt hệ thống hoặc các truy vấn chung) tạo ra các kích hoạt giống nhau. @feilsystem đã phát triển RadixMLP để loại bỏ sự dư thừa này, sau đó mã nguồn mở nó và thêm vào TEI và BEI.