r

rllm

rLLM 是一个用于训练强化学习 AI 智能体的开源框架。

🌍 海外免费开源编程与开发开源低代码多框架支持
支持平台:API开源自部署
地区
海外
定价
免费
是否开源
GitHub Stars
★ 5.6k
收录来源
GitHub
收录于
2026-06-06
最近确认可用
2026-06-06
rllm 预览图

详细介绍

rLLM 是一个开源框架,用于训练强化学习 AI 智能体。它解决了在不同框架下训练智能体时需要大量代码改动的问题,支持多种现有的代理框架,并且只需少量的代码更改即可实现自动追踪和奖励函数定义。用户可以通过命令行或 Python API 快速开始使用 rLLM 来评估和训练模型。适合于希望简化强化学习过程的研究人员和开发者。

核心功能

  • 兼容任何代理框架
  • 几乎无需修改现有代码
  • 提供50+内置基准测试
  • 支持多种RL算法
  • 两种训练后端可选

适用场景

快速原型开发大规模分布式训练性能优化实验

优点

  • 易于集成现有项目
  • 强大的社区支持
  • 显著提高小模型性能

局限 / 注意

  • 需要Python 3.11及以上版本
  • 某些功能可能依赖特定硬件

适合谁

AI研究人员软件开发者数据科学家

以上介绍由 AI 基于公开资料整理,可能存在偏差,以官网为准。

常见问题

如何安装rLLM?

通过pip安装:uv pip install 'rllm @ git+https://github.com/rllm-org/rllm.git'

rLLM支持哪些RL算法?

包括GRPO, REINFORCE, RLOO等

相似智能体

信息有误?欢迎在 关于页 联系我们更正。