Ny kategori av llm-benchmarks.