scalable-oversight topic

List scalable-oversight repositories

Stars

Forks

Watchers

[ACL 2024] Code for the paper "ALaRM: Align Language Models via Hierarchical Rewards Modeling"

Stars

Forks

Watchers

Implementation for the research paper "Enhancing LLM Reasoning via Critique Models with Test-Time and Training-Time Supervision".