Lý do mà chúng tôi dễ dàng thu hút sự chú ý của bạn với tốc độ nhanh hơn 1.8 lần so với torch là chất lượng của bộ phân tích kernel của chúng tôi. Nếu bạn có RDNA3, hãy chạy với VIZ=2.
Bạn có thể phóng to và xem vấn đề cũng như thực thi của từng lệnh. Điều này giúp việc nhìn thấy các điểm nghẽn trở nên nhanh chóng.
LLMs cũng có thể chơi, bạn không cần giao diện web. extra/viz/cli.py có thể đọc cùng một tệp profiler. Vẫn còn hơi thô ở một số chỗ, nhưng điều này sẽ cho phép tạo ra quy trình tự nghiên cứu tốt nhất cho tốc độ kernel.
43