Claude Skill
Gen-Verse/OpenClaw-RL
OpenClaw-RL 让你仅通过描述即可训练自定义 Claude Skill 代理。结合 RLHF、GRPO、在线策略蒸馏和记忆系统。开源,5000+ 星标。
概览
仓库信息
🚀 安装这个 Skill
openclaw install Gen-Verse/OpenClaw-RL项目简介
OpenClaw-RL 是一个开源框架,允许用户仅通过自然语言描述即可训练自定义的 Claude Skill 代理。它结合了强化学习(RLHF/GRPO)、在线策略蒸馏和记忆系统,将对话式规范转化为可部署的个性化 AI 技能。
OpenClaw-RL: Train any agent simply by talking
要点
- 通过对话训练任何代理——无需编码
- 结合 RLHF、GRPO 和在线策略蒸馏实现高效技能学习
- 内置记忆系统,支持长期上下文保留
- 支持异步和 SGLang 以实现可扩展推理
- 提供 GUI 应用程序,便于交互和监控
- 开源、社区驱动,已获 5000+ 星标
使用场景
- 根据工作流程定制的个性化编程助手
- 通过自然语言训练的自定义游戏代理
- 用于客户支持或辅导的长期记忆聊天机器人
- 无需机器学习专业知识即可快速原型化基于强化学习的 AI 技能
- 技能学习、蒸馏和 RLHF 研究