18時間前AIエージェントの独自ツール対応能力をベンチマーク•HuggingFaceがエージェント評価手法を公開•成功率だけでなく効率も重要と提言•大型・小型モデルで効果が逆転する事例研究・論文コーディングオープンソース続きを読む →