Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Was wäre, wenn Ihr Agent sich selbst beibringen könnte?
Der neue Forschungsbericht des fühlenden KI-Forschers @salahalzubi401 über EvoSkill generiert automatisch hochwertige Fähigkeiten für Claude Code, OpenHands und mehr.
Schließen Sie jeden Benchmark an, und der GEPA-ähnliche Algorithmus macht Ihren Agenten automatisch in den zugehörigen Aufgaben kompetent.

11. März, 21:44
Ein sich selbst entwickelndes Framework zur Entdeckung und Verfeinerung von Agentenfähigkeiten.
Die meisten Agentenfähigkeiten, die ich heute sehe, sind handgefertigt oder schlecht von einem Agenten entworfen.
Multi-Agenten-Systeme zum Aufbau von Fähigkeiten sehen vielversprechend aus.
Dieses Papier stellt EvoSkill vor, ein sich selbst entwickelndes Framework, das automatisch Agentenfähigkeiten durch iterative Fehleranalyse entdeckt und verfeinert.
EvoSkill analysiert Ausführungsfehler, schlägt neue Fähigkeiten oder Änderungen an bestehenden vor und materialisiert sie in strukturierten, wiederverwendbaren Fähigkeitsordnern.
Drei zusammenarbeitende Agenten steuern den gesamten Prozess.
Ein Executor, der Aufgaben ausführt, ein Proposer, der Fehler diagnostiziert, und ein Skill-Builder, der konkrete Fähigkeitsordner erstellt.
Eine Pareto-Front regelt die Auswahl und behält nur Fähigkeiten bei, die die Validierungsleistung bei gehaltenen Daten verbessern, während das zugrunde liegende Modell eingefroren bleibt.
Bei OfficeQA verbessert EvoSkill Claude Code mit Opus 4.5 von 60,6 % auf 67,9 % Genauigkeit bei exakten Übereinstimmungen. Bei SealQA erzielt es einen Gewinn von 12,1 %. Fähigkeiten, die auf SealQA entwickelt wurden, übertragen sich ohne Anpassungen auf BrowseComp und verbessern die Genauigkeit um 5,3 %.
Ich werde diese Forschungsrichtung weiterhin genau verfolgen. Ich halte es für wirklich wichtig.
Papier:
Lerne, effektive KI-Agenten in unserer Akademie zu bauen:

@salahalzubi401 Repping @salahalzubi401
528
Top
Ranking
Favoriten
