トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
エージェントのスキルを発見し磨くための自己進化するフレームワーク。
今日私が見るエージェントのスキルの多くは、手作りか、エージェントによって設計が不十分なものです。
スキル構築のためのマルチエージェントシステムは有望に見えます。
本論文では、反復的な故障解析を通じてエージェントのスキルを自動的に発見・洗練させる自己進化型フレームワークEvoSkillを紹介します。
EvoSkillは実行失敗を分析し、新しいスキルや既存スキルへの修正を提案し、それらを構造化され再利用可能なスキルフォルダに具現化します。
3人の協力エージェントが全体のプロセスを主導します。
タスクを実行するエグゼキューター、失敗を診断するプロポーザー、そして具体的なスキルフォルダを作成するスキルビルダーです。
パレートフロンティアは選択を支配し、保留された検証性能を向上させるスキルのみを保持しつつ、基礎モデルは凍結します。
OfficeQAでは、EvoSkillがOpus 4.5のClaude Codeの正確マッチ精度を60.6%から67.9%に向上させています。SealQAでは12.1%の利得が得られます。SealQAで進化したスキルはゼロショットでBrowseCompに移行し、修正なしで命中率を5.3%向上させました。
この研究の流れを引き続き注意深く追い続けます。本当に大事だと思います。
論文:
私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう:

トップ
ランキング
お気に入り
