finetuning-rl topic

List finetuning-rl repositories

228

Stars

Forks

Watchers

FineTune LLMs in few lines of code (Text2Text, Text2Speech, Speech2Text)

227

Stars

Forks

227

Watchers

[NeurIPS 2025] Flow x RL. "ReinFlow: Fine-tuning Flow Policy with Online Reinforcement Learning". Support VLAs e.g., pi0, pi0.5. Fully open-sourced.