Claude Skill

InternLM/WildClawBench

WildClawBench 是一个用于在 OpenClaw 环境中评估 AI 代理的野外基准测试,支持代理型 AI 的研究与评估。

概览

Stars368
Forks26
语言Python
最后更新2026-05-15
最近同步2026-05-15
前往 GitHub

仓库信息

拥有者InternLM
仓库WildClawBench
完整名称InternLM/WildClawBench
Repo ID1,189,335,371

🚀 安装这个 Skill

openclaw install InternLM/WildClawBench

项目简介

WildClawBench 是一个野外基准测试,用于评估在 OpenClaw 环境中运行的 AI 代理,为代理型 AI 系统提供真实且具有挑战性的测试平台。

英文描述

An in-the-wild benchmark for AI agents in the OpenClaw Environment.

要点

  • 面向 AI 代理的野外基准测试
  • 基于 OpenClaw 环境构建
  • 专注于代理型 AI 评估
  • 真实且具有挑战性的测试场景

使用场景

  • 评估 AI 代理在开放环境中的性能
  • 对代理型 AI 模型进行基准测试
  • 代理型评估方法的研究

话题

探索更多

数据来自 GitHub,同步时间:2026-05-15