THUDM/slime

slime is an LLM post-training framework for RL Scaling.

[view on github]last commit: Jun 18, 2026

stars

6,277

7d

+178

30d

+542

90d

+1,411

## star history

## found in

Awesome Open Source AI/Full Training Frameworks