r

rllm

rLLM 是一个用于训练强化学习 AI 智能体的开源框架。

🌍 海外免费开源编程与开发开源低代码多框架支持

支持平台：API开源自部署

访问官网 ↗

地区: 海外
定价: 免费
是否开源: 是
GitHub Stars: ★ 5.6k
收录来源: GitHub
收录于: 2026-06-06
最近确认可用: 2026-06-06
GitHub: github.com/rllm-org/rllm

rllm

详细介绍

rLLM 是一个开源框架，用于训练强化学习 AI 智能体。它解决了在不同框架下训练智能体时需要大量代码改动的问题，支持多种现有的代理框架，并且只需少量的代码更改即可实现自动追踪和奖励函数定义。用户可以通过命令行或 Python API 快速开始使用 rLLM 来评估和训练模型。适合于希望简化强化学习过程的研究人员和开发者。

核心功能

▪兼容任何代理框架
▪几乎无需修改现有代码
▪提供50+内置基准测试
▪支持多种RL算法
▪两种训练后端可选

适用场景

快速原型开发大规模分布式训练性能优化实验

优点

＋易于集成现有项目
＋强大的社区支持
＋显著提高小模型性能

局限 / 注意

－需要Python 3.11及以上版本
－某些功能可能依赖特定硬件

适合谁

AI研究人员软件开发者数据科学家

以上介绍由 AI 基于公开资料整理，可能存在偏差，以官网为准。

常见问题

如何安装rLLM？

通过pip安装：uv pip install 'rllm @ git+https://github.com/rllm-org/rllm.git'

rLLM支持哪些RL算法？

包括GRPO, REINFORCE, RLOO等

相似智能体

Cursor

AI 代码编辑器，含 Agent 模式

🌍 海外免费+付费

Dify

LLMOps + Agent 编排平台，开源

🇨🇳 国内免费+付费开源

扣子 Coze

字节的零代码 Agent/Bot 搭建平台

🇨🇳 国内免费+付费

Trae

字节跳动的 AI IDE（含 Agent）

🇨🇳 国内免费

LangChain

最主流的 LLM/Agent 编排框架

🌍 海外免费开源

Devin

Cognition 出品的自主软件工程师 Agent

🌍 海外付费

信息有误？欢迎在关于页联系我们更正。