AI 脳 ai-know.
JA · EN
CONCEPT · STUB

エージェント評価(Agent Evaluation)

エージェント評価は、マルチステップ・ツール使用・自律的意思決定を行う AI エージェントの能力・コスト・安全性を評価する手法とインフラの総称。Holistic Agent Leaderboard(HAL)が 2025〜2026 年に標準的なコスト込み評価プラットフォームとして台頭した。

※ 自動生成 stub、要補完

言及された記事