Claude Skill
LeoYeAI/myclaw-bench
MyClaw-Bench 是 OpenClaw 上 AI 智能体的权威基准测试,涵盖 4 个层级共 45 项任务。由 MyClaw.ai 提供技术支持,实现基于大语言模型的智能体标准化评估。
概览
仓库信息
安装这个 Skill
git clone https://github.com/LeoYeAI/myclaw-bench.gitRegistry 信息
项目简介
MyClaw-Bench 是 OpenClaw 上 AI 智能体的权威基准测试,涵盖 4 个层级共 45 项任务。由 MyClaw.ai 提供技术支持,为基于大语言模型的智能体提供标准化、严格的评估框架。
The definitive benchmark for AI agents on OpenClaw. 45 tasks across 4 tiers. Powered by MyClaw.ai
要点
- 涵盖 4 个层级共 45 项任务
- OpenClaw 智能体的标准化基准测试
- 由 MyClaw.ai 基础设施提供支持
- 专为基于大语言模型的智能体评估设计
- 开源且由社区驱动
使用场景
- 在 OpenClaw 上对 AI 智能体进行基准测试
- 评估基于大语言模型的智能体性能
- 跨层级比较智能体能力
- 智能体测试与评估研究
- 开发稳健的 AI 智能体