編集

VercelによるAGENTS.mdとSkillの性能比較

Next.js 16 APIの評価において、AGENTS.mdに圧縮したドキュメントインデックス(8KB)を埋め込む手法が、100%の合格率を達成した。

Skills(ツールベースのアプローチ)は、明示的な指示があっても最大79%の合格率にとどまった。また、56%のケースでSkillsがトリガーされないという問題も確認された。

これにより、ドキュメントをコンテキストに常駐させるAGENTS.mdのアプローチが、現在のモデルにおいてはより信頼性が高いことが示された。

出展:AGENTS.md outperforms skills in our agent evals

編集