Claude Skill

suyoumo/ClawProBench

ClawProBench 是一个以实时执行为优先的基准测试框架,用于在 OpenClaw 运行时环境中评估 LLM 代理,具备确定性评分和重复试验可靠性。

概览

Stars540
Forks47
语言Python
最后更新2026-04-26
最近同步2026-04-27
前往 GitHub

仓库信息

拥有者suyoumo
仓库ClawProBench
完整名称suyoumo/ClawProBench
Repo ID941,429,098

🚀 安装这个 Skill

openclaw install suyoumo/ClawProBench

项目简介

ClawProBench 是一个以实时执行为优先的基准测试框架,用于在 OpenClaw 运行时环境中评估 LLM 代理,具备确定性评分和重复试验可靠性。

英文描述

ClawProBench is a live-first benchmark harness for evaluating LLM agents in the OpenClaw runtime with deterministic grading and repeated-trial reliability.

话题

探索更多

相关技能

你可能也会感兴趣的 Claude Skill 项目。

数据来自 GitHub,同步时间:2026-04-27