Claude Skill
InternLM/WildClawBench
WildClawBench 是一个用于在 OpenClaw 环境中评估 AI 代理的野外基准测试,支持代理型 AI 的研究与评估。
概览
仓库信息
🚀 安装这个 Skill
openclaw install InternLM/WildClawBench项目简介
WildClawBench 是一个野外基准测试,用于评估在 OpenClaw 环境中运行的 AI 代理,为代理型 AI 系统提供真实且具有挑战性的测试平台。
An in-the-wild benchmark for AI agents in the OpenClaw Environment.
要点
- 面向 AI 代理的野外基准测试
- 基于 OpenClaw 环境构建
- 专注于代理型 AI 评估
- 真实且具有挑战性的测试场景
使用场景
- 评估 AI 代理在开放环境中的性能
- 对代理型 AI 模型进行基准测试
- 代理型评估方法的研究