header
AGI-Eval
AGI-Eval ist ein Benchmark-Hub für LLMs und Agenten und bietet transparente Bestenlisten, Evaluierungsdatensätze und Werkzeuge, um die Modellauswahl und -optimierung zuverlässiger zu machen.