Alasan mudah untuk mendapatkan perhatian flash kami menjadi 1,8x lebih cepat daripada obor adalah kualitas profiler kernel kami. Jika Anda memiliki RDNA3, jalankan dengan VIZ=2.
Anda dapat memperbesar dan melihat masalah dan eksekutif setiap instruksi. Itu membuat melihat kemacetan begitu cepat.
LLM juga dapat dimainkan, Anda tidak memerlukan antarmuka web. extra/viz/cli.py dapat membaca file profiler yang sama. Ini masih agak kasar di sekitar tepinya, tetapi ini akan memungkinkan pipa riset otomatis terbaik untuk kecepatan kernel.
39