エージェント評価(Agent Evaluation)
エージェント評価は、マルチステップ・ツール使用・自律的意思決定を行う AI エージェントの能力・コスト・安全性を評価する手法とインフラの総称。Holistic Agent Leaderboard(HAL)が 2025〜2026 年に標準的なコスト込み評価プラットフォームとして台頭した。
※ 自動生成 stub、要補完
エージェント評価は、マルチステップ・ツール使用・自律的意思決定を行う AI エージェントの能力・コスト・安全性を評価する手法とインフラの総称。Holistic Agent Leaderboard(HAL)が 2025〜2026 年に標準的なコスト込み評価プラットフォームとして台頭した。
※ 自動生成 stub、要補完