マイクロソフトの新しい研究。 Phi-4-推論-ビジョン-15Bは、視覚的理解と構造化された推論能力を組み合わせた150億パラメータのマルチモーダル推論モデルです。 繰り返しますが、すべてのエージェントタスクにフロンティアモデルが必要なわけではありません。Phi-4推論視覚は15Bパラメータで何が可能かを示します。 報告書は、テキストと画像の両方を推論できるコンパクトなモデルをどのように訓練し、能力と効率の中間点を狙ったかを詳述しています。 ビジョンを扱うより小さな推論モデルは、実用的なエージェント展開に不可欠です。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう: